Information et éducation par et pour la communauté SAP

Reconnaissance de documents et IA : peu spectaculaires ou impressionnantes ?

Des taux d'automatisation élevés dans la capture de documents ne sont toujours pas la règle. Une nouvelle méthode basée sur le deep learning fait ici un pas de plus vers l'avenir.
Michael Diez, esker
28 novembre 2019
Chronique sur l'IA
avatar
Ce texte a été automatiquement traduit en français de l'allemand

Informationen und Daten von Dokumenten auszulesen und zu nutzen, stellt uns als Mensch vor keine große Herausforderung. Wir sind mühelos in der Lage, einen Stapel unterschiedlichster Dokumente anhand ihres Layouts zu sortieren, zu trennen und alle nötigen Informationen zu erfassen.

Für Softwarelösungen ist diese Verarbeitung alles andere als banal. Die effiziente Extraktion von Informationen aus eingehenden Geschäftsdokumenten, wie zum Beispiel Bestellungen, ist für Unternehmen, die täglich mit unzähligen Dokumenten konfrontiert sind, von entscheidender Bedeutung.

Gerade auch deshalb, weil Scannen und Dokumenterfassung Welten auseinander liegen. Wenn ein Dokument gescannt wird, wird es digital auf dem Computer gespeichert. Dort stoppt der Prozess.

Die Datei ist digitalisiert, aber Nutzer können nicht viel mit den im Dokument enthaltenen Informationen anfangen. Diese Informationen sind aber sehr wertvoll, und die Unternehmen benötigen sie für die Nutzung und Weiterverarbeitung in ihrem SAP-System.

Deshalb ist es unerlässlich, eine Software oder einen Prozess für die inhaltliche Dokumenterfassung zu etablieren. Doch damit ist die Aufgabe noch lange nicht gemeistert.

Trotz immer besser gewordener Technologien ist die umfassende semantische Korrektheit der Datenextraktion nach wie vor eine Herausforderung, insbesondere bei der Analyse von Tabelleninhalten zur Erkennung von bestellten oder fakturierten Positionen, da die Dokumente oft komplexe und mehrdeutige Strukturen aufweisen.

Man kann auf Erkennungsverfahren ähnlich der Gesichtserkennung setzen. In Verbindung mit einer großen Anzahl an Layout-Vorlagen und kontinuierlichem Machine Learning können hohe Automatisierungsraten bei der Erkennung und Erfassung von Dokumenten wie Bestellungen oder Rechnungen generiert werden.

Ergänzen kann man diese Methode mit einer intelligenten Extraktion von Tabelleninhalten, die über das reine Erkennen physikalischer Strukturen hinausgeht.

Damit wird ein Ansatz verfolgt, der auf Deep Learning basiert und die Erkennung von Positionen in verschiedenen Layouts ermöglicht, die bei der reinen Strukturerkennung nicht unbedingt berücksichtigt werden oder dem Algorithmus im Vorfeld nicht angelernt werden.

Der neue, auf Deep Learning beruhende Ansatz trainiert den eingesetzten Algorithmus mit einer großen Menge von aufbereiteten Echtdaten, die aus Datenschutzgründen anonymisiert werden und einem neuronalen Netzwerk zur Verfügung gestellt werden.

Dieser Algorithmus ist nun in der Lage, aufgrund der „Erfahrung“ und des entsprechend großen Netzwerks auch bei der Ersterfassung von Bestellungen oder Rechnungen hohe Erfassungsraten zu erzeugen.

Es ist möglich, neben Text und Zahlen auch komplexe Tabelleninhalte bei Erstbestellungen zu erkennen. Deep Learning als Teilmenge der künstlichen Intelligenz trägt dazu bei, die Produktivität und die betriebliche Effizienz deutlich zu steigern.

Der neuartige Erkennungsansatz ist von besonderem Interesse, da seine Analyselogik im Grundsatz generisch ist und so leicht an andere Dokumenttypen angepasst werden kann. Er basiert nur zu einem kleinen Teil auf spezifischer layoutbasierter Textverarbeitung.

Diese Technologien zeigen, wie außergewöhnlich effizient künstliche Intelligenz sein kann. Derzeit wird an der nächsten Generation von KI-Diensten gearbeitet, die bald in der Lage sein werden, auf Anhieb genaue und zuverlässige Daten aus Bestellungen, Rechnungen und anderen Geschäftsdokumenten zu extrahieren.

Besonders spannend ist, dass die besten KI-Ansätze für die Verarbeitung natürlicher Sprache im Bereich der Geschäftsdokumente außerordentlich gut geeignet sind und ein enormes Innovationspotenzial für die Zukunft darstellen.

So unspektakulär das Erfassen von Dokumenten für uns als Menschen auch scheint, die Prozesse, die hinter einer automatisierten Verarbeitung stecken, zeigen nicht nur eindrucksvoll die Hürden, sondern auch die rasante technische Entwicklung und faszinierende Lösungsansätze – eine eindrucksvolle Herausforderung, die es zu meistern gilt.

https://e3mag.com/partners/esker-software-gmbh/

avatar
Michael Diez, esker

Michael Diez ist Account Manager bei Esker.


Écrire un commentaire

Le travail sur la base SAP est essentiel pour réussir la conversion S/4. 

Ce que l'on appelle le centre de compétences prend ainsi une importance stratégique chez les clients existants de SAP. Indépendamment du modèle d'exploitation d'un S/4 Hana, les thèmes tels que Automatisation, Suivi, Sécurité, Gestion du cycle de vie des applications et Gestion des données la base de l'exploitation opérationnelle de S/4.

Pour la deuxième fois déjà, le magazine E3 organise à Salzbourg un sommet pour la communauté SAP afin de s'informer en détail sur tous les aspects du travail de base de S/4-Hana.

Lieu de la manifestation

FourSide Hôtel Salzbourg,
Trademark Collection by Wyndham
Am Messezentrum 2, 5020 Salzbourg, Autriche
+43-66-24355460

Date de l'événement

mercredi 10 juin, et
Jeudi 11 juin 2026

Billet d'entrée anticipé

Billet régulier

EUR 390 hors TVA
disponible jusqu'au 1.10.2025
EUR 590 hors TVA

Lieu de la manifestation

Hôtel Hilton Heidelberg
Kurfürstenanlage 1
D-69115 Heidelberg

Date de l'événement

mercredi 22 avril et
Jeudi 23 avril 2026

Billets

Billet régulier
EUR 590 hors TVA
Abonnés au magazine E3
à prix réduit avec le Promocode STAbo26
EUR 390 hors TVA
Étudiants*
à prix réduit avec le Promocode STStud26.
Veuillez envoyer votre certificat d'études par e-mail à office@b4bmedia.net.
EUR 290 hors TVA
*Les 10 premiers billets sont gratuits pour les étudiants. Tentez votre chance ! 🍀
L'organisateur est le magazine E3 de la maison d'édition B4Bmedia.net AG. Les conférences seront accompagnées d'une exposition de partenaires SAP sélectionnés. Le prix du billet comprend la participation à toutes les conférences du Steampunk and BTP Summit 2026, la visite de l'espace d'exposition, la participation à la soirée et les repas pendant le programme officiel. Le programme des conférences et la liste des exposants et des sponsors (partenaires SAP) seront publiés en temps utile sur ce site.