Garbage in - Garbage out
Selon Lünendonk (2016), environ 85% des entreprises ont un problème de données de base. Ce qui est connu depuis des années dans l'environnement de la Business Intelligence se répercute désormais dans le cadre de la transformation numérique.
Les entreprises doivent être préparées à la transformation numérique en se basant sur les processus. Cela inclut la garantie d'une qualité élevée des données de base. Ici, de nouvelles possibilités (par exemple l'apprentissage automatique) peuvent désormais intervenir directement dans le processus et permettre de garantir la qualité des données au moment où elles sont créées. Une telle intervention dans les processus commerciaux doit être voulue par les entreprises. Celles qui ne le font pas en seront toutefois pour leurs frais dans quelques années.
Deux exemples récents
Imaginez que votre algorithme d'appariement envoie automatiquement une lettre à un candidat qui n'est pas le bon en raison de données incomplètes et non actuelles. Comment l'algorithme peut-il savoir ce qui est vraiment complet et actuel par rapport aux données du candidat ? Les coûts engendrés par la perte de temps inutile (écrire des e-mails, téléphoner ensuite, etc.) sont réels, mais ce qui est gênant, c'est d'écrire à un mauvais candidat.
Imaginez que vous vous décidiez, sur la base d'un algorithme automatique, pour un fournisseur dont les données, comme dans l'exemple 1, sont également incomplètes et non actuelles, voire mal gérées (conditions, respect des délais de livraison, conditions légales, etc.) Une fois la commande déclenchée, il est difficile de l'annuler. Outre le coût de l'annulation, c'est surtout la crédibilité en tant que donneur d'ordre qui en pâtit.
Intervention dans les processus commerciaux
Pour améliorer la qualité des données de base, il est désormais possible d'intervenir dans le processus commercial, surtout dans l'environnement SAP, grâce à la plateforme Hana. L'avantage réside dans le fait que la gestion des données de base basée sur Hana permet d'utiliser les possibilités des algorithmes de comparaison qui signalent déjà à la personne qui traite les données si une entrée est en principe correcte ou incorrecte ou si elle est correcte ou incorrecte à un certain degré de probabilité.
Dans l'environnement de la technologie Hana, il est également possible de déduire ce qui est juste ou faux sur la base des données déjà existantes. Le degré de précision des données de base dans leur ensemble doit être évalué, défini et, le cas échéant, redressé au préalable.
Avec l'ajout de nouvelles données, la précision (= cohérence et exhaustivité, actualité et sémantique) des données augmentera peu à peu, améliorant ainsi la base pour des décisions ultérieures. Ce processus fait appel à la méthodologie du Machine Learning - l'apprentissage à partir des données. Le processus met également à contribution le gestionnaire de dossier. Il est la dernière instance à garantir la qualité des données ! Le Machine Learning lui offre un outil pour effectuer avec succès le contrôle visuel nécessaire.
Pourquoi Hana maintenant ?
Une étape décisive pour l'amélioration de la qualité des données de base est l'influence interactive par des valeurs par défaut et/ou des prédictions de probabilité pendant la saisie des données. Les valeurs empiriques issues de l'approche d'apprentissage automatique doivent être disponibles en temps réel. L'évaluation des valeurs empiriques dans des systèmes de stockage de données "adjacents" (Hadoop, etc.) ne favorise pas le traitement des données en temps réel. Les valeurs empiriques (pas nécessairement l'ensemble de la base de données à partir de laquelle ces expériences ont été extraites) doivent donc se trouver là où elles sont nécessaires au moment de l'exécution - directement dans la base de données du système opérationnel.
Pour pouvoir utiliser ces possibilités au sein de la plateforme SAP Hana, il faut remplir les conditions techniques de licence. Dans tous les cas, il s'agit d'un investissement - mais d'un investissement qui en vaut la peine. Aujourd'hui déjà, il est possible non seulement d'économiser environ cinq à dix pour cent du temps de travail total consacré à la correction des erreurs dans les données de base, mais les connaissances basées sur des algorithmes modernes peuvent être transformées en véritable bénéfice commercial en toute confiance - aujourd'hui et avant les concurrents sur le marché.