Acerca de nuestra arquitectura de alta disponibilidad
Estimado clientes:
Deseamos informarles que recientemente tuvimos que proceder a un examen de nuestro servidor S035 debido a una corrupción de datos; esta emergencia provocó una interrupción del servicio que afectó a parte de nuestros clientes de alojamiento compartido.
Después de haber corregido este incidente técnico, deseamos responder a algunas de sus preguntas.
¿No creen uds. que una interrupción de 5 horas es demasiado larga?
Estamos totalmente de acuerdo con Ud. y comprendemos las molestias que el corte puede haber ocasionado.
¿Podría haberse evitado esta interrupción?
Lamentablemente no en este caso en particular; nuestros especialistas declararon que dicha interrupción era inevitable y que era imposible volver a la normalidad sin antes haber chequeado el sistema de archivos (FSCK). Detectamos una importante corrupción de datos en el sistema de archivos que afectó el rendimiento del servidor y no tuvimos otra opción, sino actuar inmediatamente. Por lo general, las corrupciones del sistema de archivos surgen cuando el servidor se apaga bruscamente (a causa de un corte de energía por ejemplo); sin embargo ésta no fue la razón en el S035 , fue algo excepcional.
¿Pero, sus sistemas no son redundantes? ¿Qué sucedió con el mecanismo de conmutación por error?
Nuestra arquitectura de alojamiento compartido utiliza dos configuraciones. Por un lado disponemos de una plataforma basada en VMWate + SAN (en esta arquitectura los datos se encuentran alojados en una sola unidad de almacenamiento SAN, compartida con varios hardwares) y por otro lado una plataforma basada en DRBD + Xen (en este caso, los datos son replicados en tiempo real entre varios hardwares). Ambas plataformas son redundantes a nivel del hardware y cuando una máquina o un simple disco falla, la redundancia evita la interrupción del servicio. Desafortunadamente, cuando el mismo sistema de archivos del arreglo de datos en disco se daña o se vuelve inconsistente, todo el hardware disponible es afectado. En el caso de la replicación DRDB, esta inconsistencia se reproduce en todo el hardware y debe ser reparado lo antes posible. En tal caso, la consistencia del sistema de archivos es el talón de Aquiles de la arquitectura. Recuerde que disponemos de otros sistemas de copia de seguridad con el fin de evitar la pérdida de datos; sin embargo, la restauración de una copia de seguridad de muchos giga-bytes toma por lo general más tiempo que la reparación de la inconsistencia en un FSCK.
¿Qué van a hacer para evitar que el problema se reproduzca?
A pesar de que las corrupciones de datos y las inconsistencias son inherentes a todo entorno de almacenamiento en disco, vamos a trabajar en un nuevo monitoreo de los sistemas que nos permitirá evaluar de forma pro-activa la posibilidad de que esta situación vuelva a ocurrir. Gracias a dichos sistemas podremos realizar trabajos de mantenimiento preventivo fuera de las horas pico.
¿Qué pasa con la garantía?
Siempre garantizamos que nuestra arquitectura ha sido configurada para proporcionar cero tiempo de inactividad y en caso de falla en la provisión de los servicios especificados, usted beneficiará de créditos superiores al promedio de SLA.
Tenga en cuenta que la calidad de nuestra red ha recibido numerosos elogios de compañías como Netcraft, que ofrece servicios independientes de monitoreo Internet. En cuanto a la calidad de nuestro servicio de alojamiento compartido, nuestras estadísticas indican claramente que hemos sido consistentes proveyendo un tiempo de actividad del 99,99%, entre los más altos estándares de la industria.
¿Su plan de alojamiento compartido es la solución más adecuada para mí?
Aunque nuestro servicio de alojamiento compartido ofrece una solución de alojamiento de sitio web de alta calidad, a precio relativamente bajo, podría no ser la opción más indicada para su aplicación en particular o para su página web. Nuestros ingenieros de ventas pueden ayudarle a evaluar sus necesidades para de este modo proporcionarle la solución que mejor corresponda a sus necesidades y a su presupuesto.
Una vez más, lamentamos cualquier inconveniente que este incidente haya podido causarle y le agradecemos su comprensión.
Si tiene alguna pregunta o solicitud relacionada con este tema, lo invitamos a ponerse en contacto con nuestro servicio al cliente.
Atentamente:
El equipo de iWeb.
Commentarios
Aún no hay comentarios.

Blog
Foro
Estado
