Hana-Hadoop- couplage direct


Avec la plateforme SAP Hana et en combinaison avec Sybase IQ et Hadoop, les applications big data Hana et S/4 Hana peuvent être mises en œuvre. Et ce, en utilisant SLES for SAP Applications pour SAP Hana et SLES pour Hadoop avec Suse Manager comme gestionnaire d'infrastructure.
Comment les objectifs d'utilisation de SAP Hana et Hadoop se distinguent-ils ? Comment les technologies de base de données s'accordent-elles ? On sait que les points forts de Hana sont le traitement de données structurées jusqu'à 100 téraoctets à une vitesse extrême.
Hadoop, en revanche, n'a pas été conçu en premier lieu pour les transactions OLTP. L'avantage d'Hadoop est clair : traiter des informations non structurées, le plus souvent textuelles, et semi-structurées de la manière la plus efficace possible avec des coûts de stockage matériel faibles par téraoctet, ce qui permet d'utiliser des clusters Hadoop de plusieurs centaines de serveurs standard.
Intégration d'un seul tenant
Il y a environ deux ans, SAP a annoncé son intention d'accélérer sa collaboration en ce qui concerne la distribution Intel pour Apache Hadoop ainsi que Hortonworks Data Platform, une distribution Hadoop libre, et d'intégrer Hana et Hadoop ainsi que de distribuer Hana conjointement avec Hadoop.
L'objectif de l'intégration Hana-Hadoop est avant tout de relier intelligemment entre elles des données extrêmement volumineuses ou des données de masse et des informations réparties sur différents systèmes, de manière à ce qu'elles puissent être analysées ou évaluées efficacement et en temps réel.
SAP a mis en place un couplage direct Hana-Hadoop, y compris un connecteur Hana-Hadoop (en utilisant également les BoDS, Business Objects Data Services, et ETL) et fournit également une architecture de référence à cet effet.
Il est ainsi possible de combiner et de traiter des données structurées, semi-structurées et non structurées. Il s'agit par exemple de journaux web, de données machine, de données texte, de CDR (Call Data Records) ou de données audio et vidéo. Il existe également une architecture d'entreprise basée sur Apache Hadoop, qui a été développée par SAP et le spécialiste du Big Data MapR.
Elle permet de stocker et de traiter toutes les données sur un seul cluster Hadoop multi-tenant, tout en traitant les analyses en temps réel avec SAP Hana. Comme SAP, MapR est un partenaire Suse.
Cluster Hadoop
Sur la base de ce qui précède, SAP Hana peut être couplé à Hadoop. Il faut tenir compte du fait qu'en règle générale, Hadoop préfère une installation physique pour des raisons de comportement IO.
En particulier parce que les données à traiter dans le cadre de Big Data sont de l'ordre du pétaoctet, voire de l'exoctet. Lors de la mise en place d'Hadoop avec Suse SLES pour Hadoop, l'outil de gestion Suse Manager peut être utilisé de manière avantageuse.
Grâce à une étroite collaboration avec SAP, Suse s'assure que Hana et le cluster Hadoop offrent tous deux des performances maximales - et qu'ils peuvent être utilisés de manière optimale lorsque les deux technologies sont associées à la plateforme Suse.
Les utilisateurs SAP qui misent sur le big data et le cloud computing tirent un bénéfice avéré de cette étroite imbrication.