Acoplamiento directo Hana-Hadoop


Con la plataforma SAP Hana y en conjunción con Sybase IQ y Hadoop, las aplicaciones Big Data de Hana y S/4 Hana pueden hacerse realidad. Y esto se hace utilizando SLES for SAP Applications para SAP Hana y SLES for Hadoop con Suse Manager como gestión de la infraestructura.
¿En qué se diferencian los usos de SAP Hana y Hadoop? ¿Cómo encajan las tecnologías de bases de datos? Hana es conocida por sus puntos fuertes en el procesamiento de datos estructurados de hasta 100 terabytes a una velocidad extrema.
Hadoop, por su parte, no se diseñó principalmente para transacciones OLTP. La ventaja de Hadoop es clara: procesar información no estructurada, en su mayoría basada en texto, y semiestructurada de la forma más eficiente posible con bajos costes de almacenamiento de hardware por terabyte, para lo que pueden utilizarse los denominados clústeres Hadoop con varios cientos de servidores estándar.
Integración a partir de un único molde
Hace unos dos años, SAP anunció que impulsaría la cooperación en la distribución de Intel para Apache Hadoop, así como Hortonworks Data Platform, una distribución gratuita de Hadoop, e integraría Hana y Hadoop, además de distribuir Hana junto con Hadoop.
En este caso, el objetivo de la integración Hana-Hadoop es ante todo: vincular de forma inteligente inmensas cantidades de datos o datos masivos e información distribuida en varios sistemas de tal forma que puedan analizarse o evaluarse de forma eficiente y en tiempo real.
SAP ha implementado un acoplamiento directo Hana-Hadoop que incluye un conector Hana-Hadoop (que también utiliza BODS, Business Objects Data Services y ETL) y también proporciona una arquitectura de referencia para ello.
Así, se pueden combinar y procesar datos estructurados, semiestructurados y no estructurados. Esto incluye, por ejemplo, registros web, datos de máquinas, datos de texto, CDR (registros de datos de llamadas) o datos de audio y vídeo. También existe una arquitectura empresarial basada en Apache Hadoop, desarrollada por SAP y el especialista en Big Data MapR.
Permite almacenar y procesar todos los datos en un único clúster Hadoop multiusuario, procesando análisis en tiempo real con SAP Hana. Al igual que SAP, MapR es socio de Suse.
Clúster Hadoop
Sobre la base de lo anterior, SAP Hana puede acoplarse con Hadoop. Cabe señalar que Hadoop suele preferir una instalación física por motivos de comportamiento de IO.
Sobre todo porque, en el caso de big data, hay que procesar datos del orden de petabytes o incluso exabytes. A la hora de configurar Hadoop con Suse SLES for Hadoop, se puede aprovechar la herramienta de gestión Suse Manager.
La estrecha colaboración de Suse con SAP garantiza que tanto Hana como el clúster Hadoop ofrezcan el máximo rendimiento y puedan utilizarse de forma óptima en combinación con la plataforma Suse.
Los usuarios de SAP que confían en los macrodatos y la computación en nube se benefician claramente de esta estrecha integración.