Hana & Hadoop - Une équipe de rêve pour le Big Data


Les utilisateurs SAP qui ont eu l'occasion de travailler avec Hana sont généralement enthousiastes quant aux possibilités et aux performances fabuleuses. Ils aimeraient bien stocker le plus de données possible dans Hana et les traiter directement "en mémoire".
Malheureusement, il y a un hic : plus Hana est utilisé, plus il est cher et plus il nécessite de ressources. A cela s'ajoute une limitation générale de Hana :
Le stockage de données relationnel est certes idéal pour les données structurées, mais cela devient difficile pour les données non structurées telles que les logs, les flux de médias sociaux, les documents ou les images. C'est pourtant là qu'Hadoop a ses atouts.
Une plateforme comme Cloudera Enterprise permet de stocker, de traiter et d'analyser des données volumineuses de manière économique et flexible, mais ne dispose pas de fonctionnalités et de performances comparables pour l'hébergement de charges de travail relationnelles, comme le traitement de transactions en ligne (OLTP) dans une base de données ou un entrepôt de données.
Tout cela n'est pas nouveau et de nombreuses entreprises exploitent en fait les deux plates-formes côte à côte, séparément et distinctement, afin de tirer parti de leurs atouts respectifs.
Mais on oublie souvent qu'une architecture intégrée des deux solutions peut combiner le meilleur des deux mondes tout en compensant les inconvénients.
Cloudera Enterprise peut ainsi absorber de grandes quantités de données les plus diverses et limiter la faim de ressources de SAP Hana. Il complète idéalement Hana, en particulier dans les domaines suivants :
- Volumes et diversité des données : les systèmes traditionnels de gestion des données atteignent ici leurs limites. Les entreprises doivent faire des compromis sur les données qu'elles doivent conserver ou non, en raison de leur coût et de leur complexité technique, sans compter que les données non structurées sont difficiles à modéliser et à stocker. Cloudera Enterprise est la solution idéale pour fournir et stocker toutes les données d'une organisation.
- Utilisation des ressources : dans une architecture intégrée, les processus peuvent être externalisés. Hana peut alors utiliser les ressources libérées pour servir au mieux les requêtes et les applications.Les charges de travail ETL gourmandes en ressources sont le plus souvent externalisées, mais il est également possible de transférer des requêtes et des analyses vers Cloudera Enterprise, en particulier pour les très grands volumes de données.
- Problèmes de capacité : il peut être avantageux d'externaliser des données de Hana, par exemple des données historiques ou de faible valeur. Il est ainsi possible d'effectuer des analyses sur de longues périodes sans devoir conserver l'historique complet des données dans Hana. Une charge réduite sur les serveurs Hana signifie automatiquement une réduction des coûts.
- des ressources d'analyse et de requête : Dans une architecture intégrée, Hana peut prendre en charge le traitement rapide de données structurées et en ligne, par exemple OLTP, Data Warehousing ou OLAP (Online Analytical Processing).Cloudera Enterprise offre également la possibilité de traiter de grandes quantités de données non structurées en ligne et hors ligne. Les organisations peuvent déterminer la répartition la plus judicieuse en termes de coûts et de performances.
Dans une architecture intégrée, les coûts peuvent être sensiblement réduits par rapport à une exploitation purement Hana. Les entreprises peuvent commencer par des tâches simples comme l'externalisation des charges de travail ETL et progresser pas à pas vers une plateforme analytique combinée.
Au-delà de l'externalisation de processus individuels, il est même possible d'extraire des données de Hana et de les transférer vers Cloudera Enterprise à des fins d'analyse. Cela peut être utile pour examiner des données de valeur inconnue sans utiliser les ressources coûteuses de Hana, qui peuvent alors être utilisées pour des charges de travail plus importantes.
Au final, on peut dire qu'il s'agit d'une véritable équipe de rêve : Les entreprises n'ont pas à choisir une plateforme, en la combinant, elles obtiennent le meilleur des deux mondes.