Copia de seguridad y restauración
Peter Färbinger, redactor jefe de E-3, habló con Alexander Wallner, director general de NetApp en Alemania, Michael Scherf, miembro del consejo de administración de All for One Steeb, y Martin Finkbeiner, director general de Grandconsult, filial de All for One Steeb.
El estudio "Espionaje, sabotaje y robo de datos: protección económica en la era digital", realizado por la asociación sectorial Bitkom en 2015, muestra que solo el 49% de las empresas alemanas dispone de un plan de emergencia informática.
"Por nuestra propia experiencia, podemos decir que estas cifras son bastante realistas, dependiendo del sector y del modelo de negocio".
Alexander Wallner confirma la situación actual al principio de la entrevista.
Los estudios también demuestran que, por desgracia, los planes de emergencia no valen ni el papel en el que están impresos. Michael Scherf, de All for One Steeb, distingue también entre TI y organización:
Quienes elaboren un plan de contingencia informática también definirán en él pruebas de funcionamiento periódicas. Esto sirve para comprobar la funcionalidad y coherencia de los datos restaurados.
Sin embargo, los procesos organizativos en torno a la recuperación de datos también deben probarse y formarse. Cada minuto cuenta en caso de emergencia, sobre todo en los sectores que realizan un gran volumen de transacciones o están estrechamente integrados en cadenas de suministro, como los grandes minoristas en línea o las empresas del sector de suministros de automoción.
No hay tiempo para discutir en detalle quién debe hacer qué.
"Las copias de seguridad y la continuidad del negocio son básicamente un tema central en todas las organizaciones de TI, y el CIO tiene la tarea de garantizar la seguridad y la disponibilidad de los datos. Hasta aquí el statu quo.
dice Alexander Wallner.
"Lo que está cambiando, sin embargo, son los procesos empresariales y, cada vez más, incluso los modelos de negocio, y, por tanto, las condiciones marco esenciales. En los últimos años, los datos se han convertido cada vez más en un factor de producción central.
La transformación digital, con sus cadenas de procesos digitales de extremo a extremo y modelos de negocio muy centrados en los datos que analizan el comportamiento de los clientes, por ejemplo, significa que también ha llegado a la alta dirección el mensaje de que los sistemas informáticos deben funcionar a prueba de fallos."
Si fallan, debe ser posible restaurarlos muy rápidamente. Sin embargo, los responsables de TI no sólo deben demostrar a la dirección la eficacia de las estrategias de continuidad de la actividad, sino que también son necesarias medidas eficaces para cumplir la normativa de protección de datos.
"Cualquiera que conozca estos antecedentes debería suponer que el 100% de las empresas deberían contar con planes de contingencia detallados para la continuidad de la actividad, ¿no?".
pregunta Wallner.
Sin embargo, la práctica es claramente diferente.
La maleta K
Todas las predicciones son difíciles, sobre todo si se refieren al futuro. Por ello, probablemente la mejor precaución para el caso K sea practicar normas y procesos.
"Con algunas empresas, realizamos este tipo de pruebas una vez al trimestre, lo que ya supone un alto grado de certeza de que los datos y procesos permiten una recuperación segura.
Sin embargo, cualquiera que opere un entorno SAP vivo que se amplíe regularmente o en el que se importen actualizaciones continuamente debería llevar a cabo este tipo de formación más a menudo."
advierte Martin Finkbeiner, de Grandconsult, filial de All for One Steeb.
Si la restauración de datos no funcionó con la última copia de seguridad en caso de emergencia, habrá que utilizar versiones más antiguas. También puede ser necesario aplicar parches del sistema más antiguos o incluso desmontar componentes de hardware para que el entorno informático sea compatible con los datos de la copia de seguridad antigua.
"Sin embargo, en caso de emergencia suele ser demasiado tarde.
Finkbeiner lo sabe por su experiencia profesional.
"Por lo tanto, siempre deben tomarse las precauciones suficientes para garantizar que, incluso en el caso K, que nunca puede descartarse por completo, todo lo posible vaya sobre ruedas en el primer intento durante la recuperación de datos".
Las encuestas han demostrado que la causa más común de pérdida de datos es un defecto de hardware o software. Puede tratarse del fallo de un disco duro o de un controlador de almacenamiento, pero también de una aplicación temporalmente defectuosa que no guarda sus datos del todo correctamente.
También son muy frecuentes los errores de funcionamiento o la pérdida de datos debido a un apagón repentino sin que la fuente de alimentación de emergencia pueda actuar a tiempo.
Los programas maliciosos, como los virus, o las fuerzas naturales, como el fuego y el agua, tienen muchas menos probabilidades de ser la causa de la pérdida de datos.
"En una encuesta internacional, la Oficina Federal de Estadística cita los fallos en los componentes informáticos como la principal razón de la pérdida de datos, seguida de los errores humanos, los cortes de electricidad y los cortes causados por el clima"
explica Alexander Wallner, de NetApp. Se puede practicar o automatizar el caso K?
"La cuestión de si se puede o no se plantea en absoluto".
afirma Wallner, responsable de NetApp.
"Más bien, es imprescindible formar en los procedimientos operativos y organizativos de un fallo informático, incluida la recuperación de datos".
En el catálogo IT-Grundschutz de la BSI (Oficina Federal de Seguridad de la Información) se prescriben "ejercicios de reconstrucción de datos". El diseño en la práctica puede ser diferente.
"Algunas organizaciones informáticas ponen a prueba sus planes de contingencia hasta en cuatro pruebas al año"
añade Michael Scherf de All for One Steeb.
Sin embargo, también sabe que, por desgracia, la realidad es que la gente sólo se levanta una vez al año para realizar las gestiones más necesarias.
"En caso de catástrofe, sin embargo, esta actitud conduce al caos operativo y a retrasos significativos en los tiempos de puesta en marcha"
advierte Scherf.
Prioridades a la vista
Desde un punto de vista puramente tecnológico, no hay obstáculos cuando se trata de realizar copias de seguridad. Incluso para los escenarios SAP Hana más grandes con clústeres Hadoop, existen sistemas de copia de seguridad seguros y eficientes. Con el fin de establecer los procesos necesarios dentro de la organización de TI, los proveedores a veces ofrecen ejemplos gratuitos de mejores prácticas y consejos en Internet.
"El mayor peligro es básicamente el trabajo diario por proyectos en TI y la presión por la eficiencia y los costes"
advierte Martin Finkbeiner.
"Esto lleva a que las actividades improductivas, como las copias de seguridad, se cuelen al final de la lista de prioridades".
Todo el mundo hace copias de seguridad de sus datos, ¿no?
"Casi todas las empresas realizan copias de seguridad de los datos de una forma u otra".
Martin Finkbeiner, de Grandconsult, está convencido. Sin embargo, la razón de hacer copias de seguridad de los datos es poder restaurarlas muy rápidamente y al mismo tiempo sin errores en caso de emergencia, para que el funcionamiento de la empresa se vea afectado lo menos posible.
"A menudo, sólo durante la restauración se pone de manifiesto la eficacia real de la estrategia de copia de seguridad".
Finkbeiner hace hincapié en la restauración que realmente importa al final.
"Las razones del fracaso de la restauración son muchas".
conoce a su colega Michael Scherf.
Los problemas técnicos pueden provocar que los datos de un soporte de almacenamiento dejen de ser legibles o que un backup no se guarde de forma coherente. En los modernos entornos de backup de NetApp, por ejemplo, hace tiempo que se prescindió por completo de las cintas magnéticas.
Las copias de seguridad de datos que se han ejecutado limpiamente desde un punto de vista puramente técnico, pero cuya restauración ofrece resultados inutilizables, por ejemplo en caso de errores o factores mutuamente desfavorables por parte del entorno de la aplicación, también son especialmente delicadas.
"Estos problemas de restauración también se repiten una y otra vez en la práctica. Así que hay factores muy diversos que pueden dar lugar a una restauración defectuosa".
añade Alexander Wallner.
¿Falsa seguridad?
Con almacenamiento de datos redundante, centros de datos de emergencia con duplicación de datos, etc., los datos suelen estar muy seguros. Entonces, ¿para qué sirve hacer copias de seguridad?
"Dependiendo del modelo de negocio y del sector, los requisitos de disponibilidad de los datos son muy diferentes, por lo que las soluciones de copia de seguridad siguen siendo necesarias a pesar de los sistemas de almacenamiento redundantes y los conceptos de continuidad de negocio"
subraya con rotundidad Alexander Wallner en la entrevista E-3.
Además, la copia de seguridad también asume la función de archivo y cumple así los requisitos legales.
"Por lo tanto, las empresas siempre necesitan un concepto multinivel para los datos operativos actuales hasta el archivado a largo plazo"
explica Wallner. Michael Scherf añade:
"Para que un centro de datos de emergencia, por ejemplo, pueda intervenir inmediatamente en caso de emergencia, se necesita una copia de seguridad de los datos más o menos permanente en función de los requisitos de la operación empresarial."
Además, a menudo deben restaurarse varias generaciones de copias de seguridad de datos para restaurar selectivamente partes específicas de una copia de seguridad de datos completa.
Tiempo de inactividad cero en todas partes
"Cada vez más, las operaciones empresariales sólo pueden tolerar un pequeño tiempo de inactividad"
así es como Michael Scherf describe el cambiante negocio.
"La ventana para reiniciar las TI es, por tanto, cada vez más estrecha. Las soluciones adecuadas para ello son cualquier cosa menos triviales, pero con la participación de un proveedor de servicios externo especializado aún pueden trazarse de forma económica."
La copia de seguridad en línea mediante instantáneas sin interferir en las operaciones informáticas en curso y una recuperabilidad muy rápida y específica son piedras angulares importantes. Scherf conoce la práctica:
"En el transcurso de la actividad cotidiana, una tabla SAP se destruye rápidamente, y sólo esta tabla debe restaurarse a partir de la última copia de seguridad de los datos.
Por tanto, las cintas magnéticas clásicas o los robots de cinta están claramente en retirada para las tareas de copia de seguridad modernas. Hoy en día, los expertos informáticos prefieren las redes de copia de seguridad de alta disponibilidad.
La ventana de tiempo para el backup y la recuperación con un fuerte aumento simultáneo de los volúmenes de datos se considera el parámetro decisivo para un sistema de protección de datos eficaz. NetApp ofrece SnapManager o SnapCreator para bases de datos clásicas.
Ambos productos utilizan la tecnología de instantáneas para realizar copias de seguridad rápidas y de rendimiento neutro. Entre otras cosas, estas herramientas de copia de seguridad utilizan la interfaz SAP Backint y, por tanto, están integradas en la gestión y supervisión de copias de seguridad de SAP (DB12/DB13).
"No hay conceptos generales de protección de datos, ya que los clientes tienen una gran variedad de SLA".
subraya Alexander Wallner.
"Siempre es importante derivar el concepto de copia de seguridad de los datos de forma coherente a partir de los requisitos de la operación empresarial".
Scherf describe el escenario y plantea algunas preguntas:
- ¿Cuánto tiempo puede estar fuera de servicio la TI sin que tenga un impacto inaceptable en mi negocio?
- ¿Hasta qué punto es aceptable para mí la pérdida de datos, ya que también puedo recuperarlos manualmente si es necesario?
- ¿Qué aplicaciones son absolutamente críticas para la empresa y pueden incluso diseñarse para un tiempo de inactividad cero, y cuáles no?
- ¿Cuándo entran en vigor las sanciones de mis clientes si, por ejemplo, como proveedor de la industria automovilística, ya no puedo cumplir puntualmente los plazos de entrega?
- ¿Qué pérdidas de volumen de negocio debo esperar si falla mi plataforma de negociación?
- ¿De cuánto tiempo dispongo en absoluto para recuperar las pérdidas más adelante mediante el correspondiente aumento de las transacciones?
- ¿Está mi entorno informático diseñado para gestionar transacciones adicionales?
"Sólo cuando el caso de negocio se esboza de forma clara y resistente puede derivarse la estrategia adecuada de continuidad del servicio de TI a partir de los requisitos de continuidad del negocio".
añade su colega Martin Finkbeiner. Importante, dice Finkbeiner: las mencionadas preguntas básicas sobre los requisitos de las operaciones empresariales deben volver a plantearse periódicamente.
Especialmente en tiempos de transformaciones digitales y su enorme dinámica empresarial, las mismas preguntas se responden de forma fundamentalmente distinta un año después, según la experiencia.
"La copia de seguridad de los datos se vuelve especialmente compleja cuando aumenta la cantidad de datos y crece el número de sistemas de los que hay que hacer una copia de seguridad en paralelo, así ocurre, por ejemplo, con las copias de seguridad de SAP landscape"
Wallner, responsable de NetApp, lo sabe por su experiencia profesional. A esto hay que añadir los largos tiempos de ejecución de los backups, que suponen una carga para el funcionamiento del sistema. Con la ayuda de los métodos de backup basados en almacenamiento, se pueden minimizar los tiempos de backup, neutralizar casi por completo las pérdidas de rendimiento y realizar el backup simultáneo de todo un entorno SAP.
"Si quieres optimizar tu estrategia de copias de seguridad sin mucho esfuerzo administrativo, puedes usar una pasarela de almacenamiento en la nube, por ejemplo".
dice Wallner.
Copia de seguridad en la nube
La solución AltaVault ofrecida por NetApp está disponible como dispositivo físico o máquina virtual y gestiona la transferencia de los datos de backup de la propia empresa a cualquier proveedor de cloud o incluso a un cloud privado.
AltaVault puede utilizarse en cualquier entorno SAP y funciona con las aplicaciones de copia de seguridad más comunes.
Tecnológicamente, AltaVault proporciona a la nube un acceso similar al de una unidad de red: protocolos como CIFS (Common Internet File System) y NFS (Network File System) constituyen la base para que el departamento de TI pueda seguir utilizando directamente los procesos y el software existentes para la copia de seguridad de los datos. Esto salvaguarda las inversiones ya realizadas y acelera la implantación.
"Además, la solución puede utilizarse con nubes públicas como AWS, Azure o Softlayer".
Alexander Wallner está orgulloso de la competencia de NetApp. Los servicios de copia de seguridad desde la nube, dirigidos a empresas, son ofrecidos por proveedores de servicios de TI en diversas formas y niveles de calidad.
"El problema aquí es la comparabilidad de los servicios, ya que los CIO también tienen que fijarse en los SLA a la hora de comprar servicios en la nube, por ejemplo"
subraya Wallner en la entrevista con E-3. Al departamento de TI le lleva mucho tiempo evaluar a distintos proveedores. Este es el trasfondo de la oferta "Backup as a Service".
Basándose en las tecnologías de NetApp, los proveedores de servicios autorizados ofrecen el servicio completo de backup a la nube. La particularidad en este caso: NetApp certifica el servicio de los proveedores de servicios de TI, con lo que prácticamente se hace cargo del control de calidad para los clientes empresariales.
"Además, los socios solo podrán utilizar centros de datos en Alemania para BaaS".
explica Wallner. En la actualidad, diez socios en Alemania ya ofrecen sus servicios para BaaS, que, por supuesto, también son perfectos para los clientes de SAP.
Copia de seguridad de Hana
A diferencia de las bases de datos convencionales, que leen sus datos principalmente del disco duro o de la memoria flash, los sistemas de computación en memoria como SAP Hana mantienen los datos en su mayor parte íntegramente en la memoria principal.
"Esto plantea nuevas exigencias a la infraestructura de copia de seguridad, ya que hay que hacer copias de seguridad de muchos más datos".
Alexander Wallner conoce los nuevos retos tecnológicos. Estos datos suelen guardarse en streaming continuo en un sistema de copia de seguridad, ya que los procedimientos clásicos con copias de seguridad delta diarias ya no funcionan debido al volumen de datos.
Con una copia de seguridad de datos en el rango de los TBytes, hacer una copia de seguridad en disco y luego en cinta puede llevar varias horas. Restaurar los datos lleva un tiempo similar.
"Por eso muchas empresas trabajan ahora con el concepto de instantáneas"
Wallner lo sabe.
"Aquí, las copias de seguridad del sistema SAP operativo se crean y copian continuamente sin sobrecargar los sistemas productivos. De este modo, la recuperación es considerablemente más rápida.
Los sistemas de almacenamiento FAS o AFF desarrollados por NetApp crean estas instantáneas para el backup de Hana en sólo unos segundos. Un análisis realizado por NetApp entre los clientes existentes de Hana demostró que el tiempo medio de un backup de instantáneas de Hana es de 19 segundos.
Incluso las copias de seguridad de datos complejos no duran más de un minuto para los clientes.
"Las soluciones SAP son en su mayoría críticas para el negocio".
añade Michael Scherf de All for One Steeb.
"El mayor uso de Hana también cambia la base tecnológica, que también se utiliza cada vez más para rediseñar procesos empresariales anteriores o incluso modelos de negocio."
Este cambio en la "visión de conjunto" también influye en la organización de la copia de seguridad y la recuperación de datos. Además, la inclusión temporal de recursos de la nube pública, como la potencia de cálculo, ofrece posibilidades de escalado completamente nuevas.
"Nuestro modelo de procedimiento para el Restore-Schutzbrief abarca, por tanto, desde la revisión de los requisitos a partir del caso de negocio específico hasta su análisis y comparación con los procesos y tecnologías de copia de seguridad existentes, la evaluación de los escenarios de destino adecuados, su implantación y, sobre todo, los servicios continuados en las operaciones en curso."
Scherf explica el modelo holístico de copia de seguridad y restauración que se ha desarrollado.
Por último: ¿Qué consejo daría este grupo de expertos a un cliente actual de SAP sobre la revisión de sus copias de seguridad?
"Aquí recomendamos confiar en un proveedor de servicios para comprobar y validar las copias de seguridad".
Martin Finkbeiner responde por todos.
"Para ello, hemos desarrollado nuestra oferta Carta de Protección Restore. La idea básica es:
La copia de seguridad no lo es todo, porque sin validación de la copia de seguridad restaurada, todo es nada. Así que no hay copia de seguridad sin validación de la restauración".