Hadoop und Hana – das perfekte Zusammenspiel
Einen wichtigen Ansatzpunkt bietet für viele unserer Kunden eindeutig Hana. Zwar läuft Hadoop auch auf Low-Cost-Servern, aber einen signifikanten Performance-Zuwachs kann man durch die Architektur von SAP erreichen.
Und da Zeit vielleicht mehr als je zuvor Geld ist, sehen wir für viele unserer Kunden die Zeit gekommen, darüber nachzudenken, wie Sie durch die Kombination von Hortonworks und SAP noch mehr aus ihrer bestehenden Infrastruktur ziehen können.
Rein technisch liegt ein wichtiger Vorteil darin, dass die zu analysierenden Daten im Arbeitsspeicher des Servers zur Analyse hinterlegt werden. Dadurch, dass hier keine externen I/O-Operationen anfallen und der Datenzugriff aufgrund eines anderen Musters erfolgt, sind auch aufwändige Analysen schnell durchführbar.
Hana bietet dafür abgestimmte Bibliotheken für Aufgaben innerhalb von Prognosen, Planung, Textverarbeitung, räumliche Analysen sowie Business Analytics.
Eine mögliche virtualisierte Abbildung der Systeme macht den Anwender unabhängig von der genutzten Hardware, soweit auf eine ausreichende Performance geachtet wird.
Stärken von Hadoop
Hadoop punktet in den Big-Data-Analysen durch seine Fähigkeit, fehlende Informationen in Datensätzen selbst hinzufügen zu können. So kann es
z. B. demografische Daten den Web-Logs von Kunden hinzufügen, bevor sie der Verarbeitung zugeführt werden.
Außerdem zeichnet sich Hadoop durch seine Erkennung von Datenmustern aus und führt eine intelligente Auswertung von Datenclustern und der Verbindung verschiedener Datentypen durch. Wichtig ist auch die Erkennung von großen, aber ähnlichen Datensets.
Auch bei der Risikoanalyse erkennt Hadoop die Datenmuster zuverlässig, z. B. um anormalen Operationen im Bankbereich, wie etwa im Kreditkartenwesen, rechtzeitig zu erkennen.
In Bereichen, in denen gestreamte Daten direkt verarbeitet und analysiert werden müssen, bietet sich das Zusammenspiel von Hadoop und Hana geradezu an.
Sinnvolle Anwendungsfelder
Darunter fallen intelligente Stromzähler, die Auswertung der Daten aus Fahrzeugsensoren oder aus Fertigungsanlagen. Hier können sehr einfache, aber in der Masse anfallende Daten direkt in den Arbeitsspeicher geladen und mit Hadoop analysiert werden.
Die besondere Architektur von Hadoop begünstigt dabei auch die Vernetzung mehrerer Hana-Instanzen. Daneben bietet sich auch die Analyse der Entwicklungen in den sozialen Medien an. I
m Gegensatz zu den gestreamten Daten, deren Herausforderung in ihrer schieren Masse besteht, sind die aus den sozialen Medien gewonnenen Informationen zwar weniger zahlreich, dafür aber komplexer und ungeordnet. Auch hier führt die Verarbeitung mit Hadoop unter Zuhilfenahme von Hana zu einem schnelleren Ergebnis.
Das kann für ein Unternehmen bedeuten, dass es schneller sich abzeichnende Entwicklungen bei der Zielgruppe erkennt und agiler auf sie reagieren kann. In einigen Branchen ist dies ein wesentlicher Wettbewerbsvorteil, da hier nicht nur auf die Zielgruppe reagiert wird, sondern eine wirkliche Interaktion stattfindet, die das Unternehmen und seine Produkte wiederum in einem besseren Licht darstellt.
Die Analyse sich abzeichnender Konsumententrends kann sich daher direkt auf das Betriebsergebnis auswirken. Im Zusammenspiel mit der In-memory-DB Hana spielt Hadoop seine Qualitäten als Framework für skalierbare, verteilt arbeitende Software voll aus.
Dabei spielt es keine Rolle, in welchem Umfeld die Lösung zum Tragen kommt – Einsatzfelder gibt es in jeder Branche. Wer seine Big-Data-Analysen effizient und schnell durchführen will und dabei sämtliche Ursprungsgrößen für ein besseres Ergebnis einbeziehen will, sollte sich das Zweigespann genauer ansehen.