Sauvegarde et restauration


Le rédacteur en chef d'E-3, Peter Färbinger, s'est entretenu avec Alexander Wallner, directeur général de NetApp Allemagne, Michael Scherf, membre de la direction d'All for One Steeb, et Martin Finkbeiner, directeur général de Grandconsult, une filiale d'All for One Steeb.
L'étude "Espionnage, sabotage et vol de données - Protection économique à l'ère numérique" réalisée en 2015 par l'association professionnelle Bitkom montre que seules 49 % des entreprises allemandes disposent d'un plan d'urgence informatique.
"Notre propre expérience nous permet d'affirmer que ces données sont tout à fait réalistes, selon le secteur et le modèle commercial".
Alexander Wallner confirme la situation actuelle au début de l'entretien.
Des études montrent également que les plans d'urgence ne valent malheureusement même pas le papier sur lequel ils sont imprimés. Michael Scherf d'All for One Steeb fait donc également la distinction entre l'informatique et l'organisation :
Celui qui développe un plan d'urgence informatique y définira également des tests réguliers. Cela permet de vérifier le bon fonctionnement et la cohérence des données de restauration.
Mais il convient également de tester et d'entraîner les processus organisationnels autour de la récupération des données. Chaque minute compte en cas d'urgence, en particulier dans les secteurs qui effectuent un grand nombre de transactions ou qui sont étroitement liés à des chaînes d'approvisionnement, comme les grands commerçants en ligne ou les entreprises de sous-traitance automobile.
Il n'y a pas de temps à perdre à discuter pour savoir qui doit faire quel geste en détail.
"La sauvegarde et la continuité de l'activité sont des thèmes centraux dans toute organisation informatique et le DSI a pour mission d'assurer la sécurité et la disponibilité des données. Voilà pour le statu quo".
estime Alexander Wallner.
"Ce qui change cependant, ce sont les processus commerciaux et même, de plus en plus, les modèles commerciaux - et donc des conditions-cadres essentielles. Ainsi, au cours des dernières années, les données sont devenues de plus en plus un facteur de production central.
La transformation numérique avec ses chaînes de processus numériques continues et ses modèles commerciaux fortement axés sur les données, qui analysent par exemple le comportement des clients, font que le message selon lequel les systèmes informatiques doivent fonctionner à l'abri des pannes a également été entendu par la direction de l'entreprise".
Si elles venaient à tomber en panne, elles doivent pouvoir être restaurées très rapidement. Les responsables informatiques doivent non seulement présenter à la direction des stratégies de continuité d'activité efficaces, mais aussi prendre des mesures efficaces pour assurer la conformité aux règles de protection des données.
"Celui qui connaît ce contexte devrait en fait partir du principe que 100 % des entreprises devraient disposer de plans d'urgence détaillés pour la continuité de l'activité, n'est-ce pas ?"
demande Wallner.
La pratique est toutefois nettement différente.
L'affaire K
Toutes les prévisions sont difficiles, surtout lorsqu'elles concernent l'avenir. Ainsi, la meilleure façon de se préparer au cas K est probablement de mettre en pratique des normes et des processus.
"Avec certaines entreprises, nous effectuons ces tests une fois par trimestre, ce qui donne déjà une grande assurance que les données et les processus permettent une récupération sûre.
Mais ceux qui gèrent un environnement SAP vivant, qui est régulièrement étendu ou dans lequel des mises à jour sont continuellement installées, devraient organiser de telles formations plus souvent".
met en garde Martin Finkbeiner de Grandconsult, une filiale d'All for One Steeb.
Si, en cas d'urgence, la restauration des données n'a pas fonctionné avec la dernière sauvegarde, il faut recourir à des versions plus anciennes. Dans certaines circonstances, il peut également être nécessaire d'appliquer des correctifs système plus anciens, voire de démonter des composants matériels afin de rendre l'environnement informatique compatible avec les anciennes données de sauvegarde.
"Mais en cas d'urgence, il est souvent trop tard".
Finkbeiner le sait de par sa pratique professionnelle.
"C'est pourquoi il faut toujours prendre suffisamment de précautions pour que, même dans le cas K, qui ne peut jamais être totalement exclu, le plus de choses possibles se déroulent sans problème du premier coup lors de la récupération des données".
Des enquêtes ont montré que la cause la plus fréquente d'une perte de données est un défaut matériel ou logiciel. Il peut s'agir de la défaillance d'un disque dur ou d'un contrôleur de stockage, mais aussi d'une application temporairement défectueuse qui ne stocke pas ses données tout à fait correctement.
Les erreurs de manipulation sont également très fréquentes, de même que la perte de données due à une panne de courant soudaine, sans que l'alimentation de secours ait pu intervenir à temps.
Les logiciels malveillants comme les virus ou les forces de la nature comme le feu et l'eau sont nettement moins souvent à l'origine d'une perte de données.
"Dans une enquête internationale, l'Office fédéral allemand de la statistique place les défaillances des composants informatiques en tête des causes de perte de données, suivies par les erreurs humaines, les pannes de courant et les pannes dues aux conditions météorologiques".
explique Alexander Wallner de NetApp. Peut-on s'entraîner ou automatiser le cas K ?
"La question de savoir si c'est possible ne se pose même pas".
déclare le directeur de NetApp Wallner.
"Il est au contraire indispensable de s'entraîner aux procédures opérationnelles et organisationnelles d'une panne informatique, y compris la récupération des données".
Le catalogue IT-Grundschutz du BSI (Office fédéral de la sécurité des technologies de l'information) prescrit des "exercices de reconstruction de données". Leur conception dans la pratique peut varier.
"Certaines organisations informatiques testent leurs plans d'urgence jusqu'à quatre fois par an".
ajoute Michael Scherf d'All for One Steeb.
Mais il sait aussi que la réalité est malheureusement telle que l'on ne se mobilise qu'une fois par an pour effectuer les démarches les plus nécessaires.
"En cas de catastrophe, cette attitude conduit toutefois à un chaos opérationnel et à des délais de démarrage nettement plus longs".
prévient Scherf.
Les priorités en ligne de mire
D'un point de vue purement technologique, il n'y a pas d'obstacles à la sauvegarde. Même pour les plus grands scénarios SAP Hana avec cluster Hadoop, il existe des systèmes de sauvegarde sûrs et efficaces. Pour mettre en place les procédures nécessaires au sein de l'organisation informatique, les fournisseurs fournissent parfois gratuitement des exemples de bonnes pratiques et des conseils sur Internet.
"Le plus grand danger est en fait le travail de projet quotidien dans l'informatique et la pression de l'efficacité et des coûts".
prévient Martin Finkbeiner.
"Cela a pour conséquence que les activités improductives comme la sauvegarde sont reléguées tout en bas de la liste des priorités".
Tout le monde fait des sauvegardes, n'est-ce pas ?
"La sauvegarde des données est en effet effectuée sous une forme ou une autre par pratiquement toutes les entreprises".
est convaincu Martin Finkbeiner de Grandconsult. Toutefois, la sauvegarde des données est effectuée dans le but de pouvoir restaurer très rapidement les données sauvegardées en cas d'urgence, tout en évitant les erreurs, afin de perturber le moins possible l'activité de l'entreprise.
"Ce n'est souvent qu'au moment de la restauration que l'on constate l'efficacité réelle de la stratégie de sauvegarde".
Finkbeiner insiste sur la restauration, qui est en fin de compte ce qui compte vraiment.
"Les raisons d'un échec du rétablissement sont nombreuses"
sait son collègue Michael Scherf.
Des problèmes techniques peuvent entraîner l'illisibilité des données sur un support de stockage ou une sauvegarde incohérente. Dans les environnements de sauvegarde modernes de NetApp, par exemple, les bandes magnétiques ne sont plus utilisées depuis longtemps.
Les sauvegardes de données qui se sont déroulées proprement d'un point de vue purement technique, mais dont la restauration donne des résultats inutilisables, par exemple en cas d'erreurs ou de facteurs s'influençant mutuellement de manière défavorable du côté de l'environnement applicatif, sont particulièrement délicates.
"De tels problèmes de restauration se produisent également régulièrement dans la pratique. Ce sont donc des facteurs très différents qui peuvent conduire à une restauration erronée".
ajoute Alexander Wallner.
Fausse sécurité ?
Avec un stockage redondant des données, des centres de calcul de secours avec mise en miroir des données, etc., les données sont généralement très sûres. Pourquoi alors les sauvegarder ?
"Les exigences en matière de disponibilité des données varient considérablement en fonction du modèle d'entreprise et du secteur, c'est pourquoi des solutions de sauvegarde sont toujours nécessaires malgré les systèmes de stockage redondants et les concepts de continuité de l'activité".
souligne avec insistance Alexander Wallner dans l'entretien d'E-3.
En outre, la sauvegarde joue également le rôle d'archivage et répond ainsi aux exigences légales.
"C'est pourquoi les entreprises ont toujours besoin d'une approche à plusieurs niveaux, allant des données opérationnelles actuelles à l'archivage à long terme".
explique Wallner. Michael Scherf ajoute
"Pour qu'un centre de calcul de secours puisse par exemple intervenir immédiatement en cas d'urgence, une sauvegarde des données plus ou moins permanente est nécessaire en fonction des exigences de l'activité commerciale".
En outre, il est souvent nécessaire de conserver plusieurs générations de sauvegardes de données de manière restaurable, par exemple pour restaurer de manière sélective des parties bien précises d'une sauvegarde de données globale.
Pas de temps d'arrêt zéro partout
"De plus en plus souvent, l'activité commerciale ne supporte qu'un faible temps d'arrêt".
décrit Michael Scherf comme un business en pleine mutation.
"La fenêtre pour le redémarrage de l'informatique est donc de plus en plus étroite. Les solutions adaptées à cet effet sont loin d'être triviales, mais en faisant appel à un prestataire de services externe spécialisé, elles peuvent néanmoins être mises en place de manière économique".
La sauvegarde en ligne par snapshots sans perturber l'exploitation informatique en cours et la possibilité de restauration très rapide et ciblée sont des points de repère importants. Scherf connaît la pratique :
"Il arrive rapidement qu'une table SAP soit écrasée dans les activités quotidiennes et c'est la seule qui doit être restaurée à partir de la dernière sauvegarde des données".
Les bandes magnétiques classiques ou les robots à bandes sont donc clairement sur le déclin pour les tâches de sauvegarde modernes. Les experts informatiques préfèrent aujourd'hui les réseaux de sauvegarde à haute disponibilité.
La fenêtre de temps pour la sauvegarde et la restauration en cas de forte augmentation des volumes de données est considérée comme le paramètre décisif pour un système de protection des données efficace. NetApp propose SnapManager ou SnapCreator pour les bases de données classiques.
Les deux produits utilisent la technologie Snapshot pour des sauvegardes rapides et neutres en termes de performances. Ces outils de sauvegarde utilisent entre autres l'interface SAP-Backint et sont donc intégrés dans la gestion et le monitoring des sauvegardes SAP (DB12/DB13).
"Il n'existe pas de concepts forfaitaires de sauvegarde des données, car les clients ont des SLA très différents".
souligne Alexander Wallner.
"Il est toujours important de déduire le concept de sauvegarde des données de manière cohérente à partir des exigences de l'activité commerciale".
Scherf décrit le scénario et soulève quelques questions :
- Combien de temps l'informatique peut-elle être en panne sans que mon activité ne soit plus raisonnablement affectée ?
- Dans quelle mesure les pertes de données sont-elles acceptables pour moi, car je peux les reproduire manuellement si nécessaire ?
- Quelles applications sont absolument critiques pour l'entreprise et peuvent même être conçues pour un temps d'arrêt zéro, quelles applications ne le sont pas ?
- Quand les sanctions de mes clients s'appliquent-elles si, en tant que fournisseur de l'industrie automobile, je ne peux plus répondre à temps aux appels de livraison ?
- Quelles sont les pertes de chiffre d'affaires auxquelles je dois m'attendre si ma plateforme de trading tombe en panne ?
- Combien de temps me reste-t-il pour récupérer les pertes plus tard en effectuant davantage de transactions ?
- Mon environnement informatique est-il seulement conçu pour gérer les transactions supplémentaires ?
"Ce n'est que lorsque l'analyse de rentabilité est claire et solide que l'on peut déduire la stratégie appropriée pour la continuité des services informatiques à partir des exigences en matière de continuité d'activité".
ajoute son collègue Martin Finkbeiner. Ce qui est important, selon Finkbeiner, c'est que les questions de base susmentionnées concernant les exigences de l'activité commerciale devraient être posées à nouveau périodiquement.
C'est justement à l'époque des transformations numériques et de leur énorme dynamique commerciale que les mêmes questions trouvent des réponses fondamentalement différentes un an plus tard, selon les expériences faites.
"La sauvegarde des données devient particulièrement complexe lorsque la quantité de données augmente et que le nombre de systèmes à sauvegarder en parallèle s'accroît, par exemple pour les sauvegardes de paysages SAP".
sait le manager de NetApp Wallner de par sa pratique professionnelle. A cela s'ajoutent les longues durées de sauvegarde qui pèsent sur le fonctionnement du système. Les méthodes de sauvegarde basées sur le stockage permettent de minimiser les durées de sauvegarde, de neutraliser presque entièrement les pertes de performance et de sauvegarder simultanément un environnement SAP complet.
"Ceux qui souhaitent optimiser leur stratégie de sauvegarde sans trop d'efforts administratifs utilisent par exemple une passerelle de stockage en nuage".
estime Wallner.
Sauvegarde dans le nuage
La solution AltaVault proposée par NetApp est disponible sous forme d'appliance physique ou de machine virtuelle et prend en charge le transfert de ses propres données de sauvegarde vers n'importe quel fournisseur de cloud ou même vers un cloud privé.
AltaVault peut être utilisé dans n'importe quel environnement SAP et fonctionne avec les applications de sauvegarde les plus courantes.
Sur le plan technologique, AltaVault permet au cloud d'avoir un accès similaire à celui d'un lecteur réseau : les protocoles tels que CIFS (Common Internet File System) et NFS (Network File System) constituent la base pour que l'IT puisse réutiliser directement les processus et logiciels existants pour la sauvegarde des données. Cela permet de préserver les investissements déjà réalisés et d'accélérer la mise en œuvre.
"De plus, la solution peut être utilisée avec des clouds publics tels que AWS, Azure ou Softlayer".
Alexander Wallner est fier de la compétence de NetApp. Les services de sauvegarde dans le cloud, qui s'adressent aux entreprises, sont proposés par les fournisseurs de services informatiques sous différentes formes et à différents niveaux de qualité.
"Le problème ici est la comparabilité des prestations, car les DSI doivent également tenir compte des SLA lors de l'achat de services cloud, par exemple".
souligne Wallner dans l'entretien d'E-3. Ainsi, il est assez fastidieux pour le département informatique d'évaluer différents fournisseurs. C'est dans ce contexte qu'est née l'offre "Backup as a Service".
Sur la base des technologies NetApp, des fournisseurs de services autorisés proposent une prestation complète de sauvegarde dans le cloud. La particularité ici : NetApp certifie le service des fournisseurs de services informatiques et se charge donc pratiquement du contrôle de la qualité pour les entreprises clientes.
"De plus, pour le BaaS, les partenaires ne peuvent utiliser que des centres de données situés en Allemagne".
explique Wallner. Aujourd'hui, dix partenaires en Allemagne proposent déjà leurs services pour BaaS, qui conviennent bien sûr parfaitement aux clients SAP.
Sauvegarde Hana
Contrairement aux bases de données traditionnelles, qui lisent principalement leurs données à partir du disque dur ou de la mémoire flash, les systèmes informatiques en mémoire tels que SAP Hana conservent en grande partie l'intégralité des données dans la mémoire principale.
"Cela entraîne de nouvelles exigences pour l'infrastructure de sauvegarde, car il y a beaucoup plus de données à sauvegarder".
Alexander Wallner connaît les nouveaux défis technologiques. La sauvegarde de ces données se fait typiquement sous forme de streaming continu sur un système de sauvegarde, car les procédures classiques avec des sauvegardes delta quotidiennes ne fonctionnent plus ici, ne serait-ce qu'en raison des volumes de données.
Pour une sauvegarde de données de l'ordre du TByte, la sauvegarde sur disque puis sur bande peut prendre plusieurs heures. La restauration des données prend tout autant de temps.
"C'est pourquoi de nombreuses entreprises travaillent aujourd'hui avec le concept de snapshots"
sait Wallner.
"Des copies de sauvegarde du système SAP opérationnel sont créées et sauvegardées en continu, sans surcharger les systèmes de production. La restauration est ainsi beaucoup plus rapide".
Les systèmes de stockage FAS ou AFF développés par NetApp créent ces snapshots pour la sauvegarde Hana en quelques secondes seulement. Comme l'a montré une analyse menée par NetApp auprès des clients existants de Hana, le temps nécessaire à la sauvegarde d'un snapshot Hana est en moyenne de 19 secondes.
Même les sauvegardes de données complexes ne durent pas plus d'une minute chez les clients.
"Les solutions SAP sont généralement critiques pour l'entreprise".
complète Michael Scherf d'All for One Steeb.
"L'utilisation accrue de Hana modifie en outre la base technologique, qui est par ailleurs de plus en plus utilisée pour redessiner les processus commerciaux actuels, voire les modèles commerciaux".
Ce changement de "Big Picture" influence également l'organisation de la sauvegarde et de la restauration des données. De plus, l'intégration temporaire de ressources issues du cloud public, comme la puissance de calcul, offre de toutes nouvelles possibilités de mise à l'échelle.
"Notre modèle d'approche pour le contrat de protection Restore va donc de l'examen des exigences issues du business case concret à leur réalisation, en passant par l'analyse et la comparaison avec les processus et technologies de sauvegarde déjà existants, l'évaluation de scénarios théoriques appropriés et surtout les services d'ongoing en cours d'exploitation".
explique Scherf à propos du modèle global de sauvegarde et de restauration élaboré.
Pour conclure, je dirai ceci : Que conseillerait cette table ronde à un client SAP existant concernant la vérification de la sauvegarde de ses données ?
"Nous recommandons ici de faire appel à un prestataire de services qui se chargera de la vérification et de la validation des sauvegardes".
répond Martin Finkbeiner pour tous.
"C'est dans ce but que nous avons développé notre offre de lettre de protection Restore. L'idée de base est la suivante
La sauvegarde ne fait pas tout, car sans validation de la sauvegarde restaurée, tout n'est rien. Donc pas de sauvegarde sans validation sécurisée de la restauration".