Replicación de bases de datos de misión crítica
Würth IT se ve a sí misma como un proveedor de servicios integrales de tamaño medio y orientación internacional para las TI de numerosas empresas comerciales y de servicios dentro y fuera del Grupo Würth.
Desde los primeros proyectos informáticos realizados por la empresa de Künzelsau en los años 80 y la fusión con Comgroup en 2002, el proveedor de servicios informáticos no ha dejado de desarrollarse.
Würth IT ha crecido con fuerza en los últimos años. Tras el establecimiento de una sucursal en China en 2004, en los últimos años se han añadido otras en la India y los Estados Unidos.
El departamento de TI trabaja las 24 horas del día para sus clientes, lo que plantea exigencias especialmente elevadas en cuanto a disponibilidad, protección y copia de seguridad de los datos.
"Los nuevos requisitos nos obligan a reinventarnos cada año"
afirma Jörg Engel, Jefe de Servicios de Plataforma Unix en Würth IT, donde es responsable, entre otras cosas, de la base SAP y de todas las bases de datos y sistemas Unix:
"Suministramos informática a un gran número de tiendas y sucursales, y el marketing online sigue ganando importancia para nuestros usuarios".
El número de usuarios es enorme: el Grupo Würth reúne a más de 400 empresas a las que Würth IT suministra servicios. Alrededor del 15% de las ventas se generan con clientes que no pertenecen al Grupo Würth. Sin embargo, el software SAP también desempeña un papel importante dentro del Grupo.
Los servicios incluyen principalmente aplicaciones ERP, servicios Sharepoint, telefonía y operaciones de TI. En total, hay unas 1.400 instancias de sistemas operativos, en las que alrededor del 70% de los servidores funcionan en máquinas virtuales.
Los sistemas centralizados gestionan sistemas ERP que se utilizan en todo el mundo, sobre todo soluciones SAP. Mundial puede entenderse aquí literalmente, porque las empresas del Grupo Würth "siguen al sol" y trabajan las veinticuatro horas del día. Las empresas conectadas al entorno global SAP generan alrededor de cinco mil millones de euros.
Con la digitalización de cada vez más procesos empresariales nuevos, las ventanas de mantenimiento para el personal informático del Grupo Würth se reducen a cero. Durante mucho tiempo, el trabajo de TI se ha llevado a cabo en un segundo plano. Pero no siempre ha pasado desapercibido para los usuarios.
"Las copias de seguridad sin tiempo de inactividad siempre han sido importantes para el funcionamiento ininterrumpido de nuestros usuarios, pero con la carga de los sistemas, las copias de seguridad, por ejemplo, provocaban cargas notables en el sistema. Tuvimos que buscar nuevos enfoques".
explica Harald Holl, miembro del Comité Ejecutivo y, como Director de TI, responsable de los centros de datos.
Ralentización de la carga informática
Parte de la carga de trabajo procede tradicionalmente de los propios informáticos. El objetivo de todo responsable informático es, por supuesto, minimizar al máximo esta carga. En el pasado, las aplicaciones de las que había que hacer una copia de seguridad tenían que apagarse por completo para que ésta tuviera sentido, pero desde hace algunos años, las copias de seguridad se ejecutan en segundo plano mientras continúan las operaciones de TI.
Sin embargo, a pesar de la copia de seguridad sin tiempo de inactividad, la copia de seguridad de datos en línea supone una carga considerable para todos los usuarios. Este también era el caso en Würth IT. Uno de los problemas que provocaba la elevada carga durante la copia de seguridad de los datos eran los tiempos de comprobación de la base de datos al crear instantáneas. Debido al tamaño de la base de datos, que se utiliza en operaciones de 24 horas, se crean conjuntos de archivos de registro de varios terabytes al día.
Sin la solución Libelle, la restauración tardaba al menos 13,5 horas en un caso favorable, si no surgían complicaciones. Hubo que realizar una restauración de la base de datos con un tamaño de unos 28 terabytes, una restauración de los archivos de registro con un volumen de registro de 400 a 650 registros con 4,5 gigabytes por registro y la restauración manual de los grupos de rehacer.
"Tuvimos que replantearnos todo el escenario de copias de seguridad y el concepto de alta disponibilidad"
dice Holl:
"Los sistemas existentes estaban optimizados hasta el límite. Pero no queríamos empezar a desarrollar los nuestros, buscábamos una solución estándar."
Ahora bien, los usuarios y los proveedores de soluciones informáticas entienden la norma de maneras muy distintas. Para los proveedores, una solución básica en la que se basan varios módulos a través de API normalizadas ya es software estándar.
Los usuarios tienden a considerar el software estándar como soluciones que pueden ponerse en funcionamiento mediante la configuración, por ejemplo, utilizando las plantillas suministradas.
El equipo de Engel und Holl encontró lo que buscaba en la empresa de software Libelle, con sede en Stuttgart, y en su solución DBShadow, aportada a Engel und Holl por la empresa de sistemas de Würth IT, SMC Spengler IT Software Consulting GmbH.
Tras probar otros programas con un alto nivel de personalización, se tomó la decisión de cambiar rápidamente a la solución Libelle.
Sin embargo, Würth IT se permitió una extensa POC (prueba de concepto) en la que se probaron muchos escenarios diferentes y una amplia variedad de aspectos de utilización y beneficios.
Tiempos de recuperación
DBShadow utiliza ahora el centro de datos espejo y su embudo temporal patentado: tras una única copia inicial de la base de datos, todas las transacciones pasan a un búfer en el lado espejo, también conocido como embudo temporal.
Würth IT determina dinámicamente el tiempo de retención de los datos en el embudo. Una vez transcurrido este tiempo de espera definido, las transacciones se recuperan en la base de datos espejo, de modo que existe un desfase temporal constante entre los sistemas productivo y espejo, pero todos los datos de transacciones que aún no se han recuperado ya se encuentran físicamente en el lado espejo.
Desde el punto de vista de la infraestructura, la base de datos del lado espejo funciona de forma completamente independiente de la base de datos productiva, mientras que los procesos de DBShadow enlazan los dos sistemas a nivel lógico.
Jörg Engel también puede realizar la copia de seguridad periódica en el sistema espejo en cualquier momento sin interrumpir el funcionamiento del sistema productivo.
Por tanto, el uso de DBShadow elimina la necesidad de restaurar la base de datos de 28 terabytes, restaurar los archivos de registro, restaurar los enlaces lógicos de las bases de datos y crear los grupos de rehacer en caso de RD.
El tiempo necesario para que un sistema productivo vuelva a estar disponible es ahora de sólo diez minutos, o un máximo de cinco horas en el peor de los casos. Sin la solución Libelle, el tiempo necesario -si todo funciona- sería de 13 horas y 30 minutos.
Una importante ventaja adicional es el seguro contra las consecuencias de los errores de los usuarios. Mientras que los métodos basados en hardware, como las instantáneas, protegen principalmente contra errores técnicos, la solución Libelle también puede proteger contra errores lógicos y humanos.
Estos errores son mucho más frecuentes que las pérdidas de datos debidas a fallos de hardware. Incluso en caso de errores lógicos, como errores de usuario, actualizaciones de software defectuosas o similares, el sistema productivo puede pasar a la base de datos sombra mediante una "recuperación puntual".
En sólo unos minutos, todas las transacciones válidas -hasta un punto definible en el tiempo antes del error o fallo del usuario- se recuperan del embudo temporal a la base de datos en la sombra. A continuación, la base de datos en la sombra se pone en línea como sistema productivo.
Recuperación en caso de catástrofe
Siguiendo las recomendaciones de la BSI y el sentido común, es importante mantener grandes distancias con las fuentes físicas de peligro. Puede tratarse de gasolineras o parques de tanques, así como de empresas en las que se procesan productos químicos.
No siempre se sabe lo cerca que están esos peligros. Mientras que muchas empresas instalan sus réplicas en un centro de datos situado a pocos kilómetros de distancia en el mejor de los casos, debido a las restricciones de ancho de banda y tiempos de latencia, Würth IT no sólo utiliza el concepto Libelle para replicar en el centro de datos de réplica vecino, sino que pronto utilizará también la opción de larga distancia de DBShadow para replicar las bases de datos en Suiza.
Esto también contrarresta el riesgo de que los datos se destruyan por cortes de electricidad a gran escala, catástrofes regionales y atentados y similares.
Engel también justifica la decisión a favor de DBShadow por su facilidad de uso:
"Tanto si utilizamos la base de datos en la sombra para la seguridad de los datos, para la rápida implantación del software en las empresas filiales del Grupo Würth o por su facilidad de uso, con Libelle progresamos rápidamente." - "Con otras soluciones, el esfuerzo individual era demasiado elevado"
confirma Holl.
En funcionamiento productivo, ahora se llama "Libelle una vez al día", lo que significa una comprobación de cuatro pantallas en la GUI de DBShadow. Jörg Engel lo explica:
"Controlamos la sombra, aunque no es realmente necesario debido a la fiabilidad de la solución, pero es nuestra base de datos más importante".
Würth IT valora muy positivamente la posibilidad de corregir errores semánticos, aunque el bautismo de fuego aún no se ha materializado.
"Es bueno si no necesitamos un retroceso. El embudo temporal Libelle es un seguro para esto"
confirman Holl y Engel.