Quantité et qualité


Les données de base devraient finalement être préparées pour la migration. Il serait alors possible d'identifier les doublons pertinents dans les données de base et de les éviter avec la bonne stratégie. Comment les entreprises doivent-elles procéder ? SAP n'impose pas seulement un ultimatum aux entreprises pour la migration vers S/4 en mettant fin au support du fabricant pour les versions précédentes. SAP pousse également à la migration vers le cloud.
Le rapport d'investissement 2022 de DSAG montre que jusqu'à présent, 32 % des entreprises utilisent S/4 sur site, 6 % S/4 dans le cloud privé et 2 % dans le cloud public. Selon le rapport, les entreprises font preuve de réticence à migrer complètement, car il semble que près de la moitié des entreprises qui utilisent S/4 sur site utilisent encore en parallèle ERP/ECC 6.0 ou la Business Suite 7. Cela indique que l'on ne fait pas encore suffisamment confiance à un remplacement complet par le nouveau système.
Malheureusement, la stratégie "cloud first" et le changement de modèle de données se heurtent encore trop souvent dans les entreprises à des structures de silos de données qui se sont développées au fil des années. Ainsi, une étude IDC a révélé en 2020 qu'en moyenne 23 silos de données sont entretenus dans les entreprises. Une étude de Barc réalisée l'année précédente montre que pour 65 % des participants à l'étude, rien n'a fondamentalement changé. Au contraire, le nombre de silos de données continue même d'augmenter. Cela n'aide ni à une migration complète ni à une utilisation hybride de différents systèmes, mais rend le remplacement inévitable encore plus difficile.
Le rapport DSAG montre également que le comportement d'investissement pour S/4 est légèrement en baisse par rapport à l'année précédente. Les entreprises devraient profiter de ce moment pour améliorer la qualité de leurs données de base et la maintenir durablement. En effet, ce n'est qu'avec une qualité de données élevée et assurée que le remplacement de l'ancien système peut réussir et que la valeur ajoutée de la nouvelle solution peut être pleinement exploitée.
Comme un faux cinquantenaire
Les entreprises ont tout intérêt à transférer leurs données de base dans le nouveau modèle de données avant la migration vers S/4 et à attribuer correctement les entités. Les silos de données encore existants, mais aussi les changements de nom ou d'adresse et les erreurs de saisie humaines entraînent cependant toujours des doublons, voire des enregistrements multiples. Même dans les fichiers bien gérés, il reste en moyenne cinq pour cent d'enregistrements redondants, si l'on fait abstraction des doublons voulus, comme par exemple des adresses de facturation et de livraison différentes. Il s'agit de repérer les doublons, dans le sens où le contrôle des doublons et la recherche floue permettent de trouver l'enregistrement pertinent. C'est la seule façon d'identifier clairement le bon partenaire commercial en cas de doute.
Il est recommandé de lutter contre la création de doublons dès la saisie, afin de ne pas avoir à fouiller et à nettoyer l'ensemble des données ultérieurement. Dans l'idéal, le contrôle des doublons s'effectue à proximité du dialogue dans la transaction avec le partenaire. Mais la vérification dans l'Address Search Body de SAP est également une option : dans ce cas, la Hana Fuzzy Search peut d'abord rechercher et comparer les données existantes directement en arrière-plan lors de la saisie de nouvelles données. Il en résulte toutefois une liste assez longue de candidats possibles d'enregistrements doubles ou multiples.
Mais quels enregistrements, c'est-à-dire quel partenaire, sont corrects et pertinents en cas de doute ? Il est nécessaire de retravailler manuellement la liste de propositions. Dans le cas de grandes bases de données, il peut s'agir de centaines, voire de plusieurs milliers d'enregistrements - ce qui n'est guère efficace pour les personnes chargées de traiter les dossiers, et encore moins pour identifier le bon partenaire commercial.
Recherche floue Hana
Dans l'environnement de S/4 ou de la base de données Hana sous SAP ERP ou SAP CRM, une solution d'identité supplémentaire intelligente et intégrée dans SAP, comme celle d'Uniserv, peut aider à réduire la liste des candidats de Hana Fuzzy Search aux résultats les plus pertinents. Ainsi, environ 90 pour cent des doublons non pertinents sont éliminés. Lors du contrôle des doublons, c'est-à-dire lors de la création ou de la modification d'un enregistrement, ainsi que lors de la recherche floue avec recherche, ouverture, évaluation et sélection du partenaire commercial, il reste au final une quantité raisonnable d'enregistrements pertinents qui peuvent ensuite être traités manuellement de manière efficace. La décision finale, à savoir quel enregistrement est le bon, c'est-à-dire le plus pertinent, peut être prise rapidement.

Particularités lors de l'identification : alors que lors d'une recherche floue, quelques arguments d'une personne ou d'une entreprise sont saisis dans la fenêtre de recherche, différents éléments, tels que le prénom et le nom, la rue, le numéro de maison, le code postal et la ville, sont saisis de manière structurée lors de la vérification des doublons pour la création ou la modification d'un enregistrement. En conséquence, des possibilités particulières d'identification doivent être maîtrisées. Après la réduction, il reste encore environ dix pour cent de résultats positifs pour lesquels un score indique la probabilité agrégée qu'un enregistrement soit un doublon ou déjà l'enregistrement correct. Plus le score est élevé, plus il est probable qu'il s'agisse d'un doublon. L'évaluation s'effectue à l'aide de jetons prédéfinis, c'est-à-dire de segments ou d'éléments particuliers qui sont vérifiés lors de la recherche à l'aide de bases de connaissances spécifiques à chaque pays et d'un algorithme sous-jacent.
Les jetons peuvent être consultés par l'utilisateur, l'évaluation est donc transparente. En mode expert, les utilisateurs voient quels tokens ont été évalués et comment. Cela explique le classement de la pertinence d'un jeu de données et aide les collaborateurs à identifier le jeu de données correct et pertinent. Il est donc recommandé de miser, en plus de Hana Fuzzy Search, sur une technologie supplémentaire qui limite la liste des résultats de telle sorte que les partenaires commerciaux puissent être identifiés correctement de manière efficace et en gagnant du temps. Le principe est le suivant : la pertinence avant la quantité. Cela aide énormément les entreprises à éviter la création de nouveaux doublons ou d'enregistrements multiples.
C'est surtout la moitié des entreprises mentionnées au début qui travaillent en parallèle sur différentes versions de SAP qui risquent de transporter des doublons comme un proverbial poids mort dans leur stock de données. Avant la conversion complète, elles devraient donc procéder à un contrôle des doublons et à une assurance qualité globale des données. Et lors de l'exploitation ultérieure, il faudra veiller à ce qu'il n'y ait pas de doublons ou d'enregistrements multiples, afin qu'aucun nouveau doublon ne vienne polluer le système à long terme.
Paramètres de recherche
Recherche de synonymes : Les noms "Steffi" et "Stefanie" sont affichés comme potentiellement associés.
Recherche de surplomb : Les noms doubles sont également trouvés en entrant le nom simple, par exemple "Heinz Müller-Schulze" pour "Heinz Müller".
Erreur de frappe : Doublet reconnu malgré une saisie erronée, par exemple pour "Stehpan" et "Stephan".
Résolution de l'acronyme : Les abréviations sont reconnues, par exemple "TK" pour "Techniker Krankenkasse".
Équivalence de code postal : Les codes postaux qui sont géographiquement proches peuvent être évalués en conséquence.