Information et éducation par et pour la communauté SAP

Reconnaissance de documents et IA : peu spectaculaires ou impressionnantes ?

Des taux d'automatisation élevés dans la capture de documents ne sont toujours pas la règle. Une nouvelle méthode basée sur le deep learning fait ici un pas de plus vers l'avenir.
Michael Diez, esker
28 novembre 2019
Chronique sur l'IA
avatar
Ce texte a été automatiquement traduit en français de l'allemand

Lire et utiliser les informations et les données des documents ne nous pose pas de problème majeur en tant qu'être humain. Nous sommes capables, sans effort, de trier et de séparer une pile de documents les plus divers en fonction de leur mise en page et de saisir toutes les informations nécessaires.

Pour les solutions logicielles, ce traitement est loin d'être banal. L'extraction efficace d'informations à partir de documents commerciaux entrants, tels que les commandes, est essentielle pour les entreprises qui sont confrontées quotidiennement à d'innombrables documents.

C'est précisément parce qu'il y a un monde entre la numérisation et la capture de documents. Lorsqu'un document est numérisé, il est enregistré numériquement sur l'ordinateur. C'est là que le processus s'arrête.

Le fichier est numérisé, mais les utilisateurs ne peuvent pas faire grand-chose avec les informations contenues dans le document. Or, ces informations sont très précieuses et les entreprises en ont besoin pour les utiliser et les traiter dans leur système SAP.

C'est pourquoi il est indispensable de mettre en place un logiciel ou un processus pour la saisie des documents de contenu. Mais la tâche est loin d'être accomplie.

Malgré des technologies de plus en plus performantes, l'exactitude sémantique globale de l'extraction des données reste un défi, notamment lors de l'analyse du contenu des tableaux pour identifier les postes commandés ou facturés, car les documents présentent souvent des structures complexes et ambiguës.

On peut miser sur des méthodes de reconnaissance similaires à la reconnaissance faciale. En combinaison avec un grand nombre de modèles de mise en page et un apprentissage automatique continu, il est possible de générer des taux d'automatisation élevés pour la reconnaissance et la saisie de documents tels que les commandes ou les factures.

On peut compléter cette méthode par une extraction intelligente du contenu des tableaux, qui va au-delà de la simple reconnaissance des structures physiques.

Il s'agit d'une approche basée sur le deep learning qui permet de reconnaître des positions dans différentes mises en page qui ne sont pas forcément prises en compte lors de la simple reconnaissance de la structure ou qui ne sont pas apprises à l'algorithme au préalable.

La nouvelle approche basée sur le deep learning entraîne l'algorithme utilisé avec une grande quantité de données réelles préparées, qui sont rendues anonymes pour des raisons de protection des données et mises à la disposition d'un réseau neuronal.

Cet algorithme est désormais en mesure de générer des taux de saisie élevés, même lors de la première saisie de commandes ou de factures, grâce à son "expérience" et à l'étendue correspondante de son réseau.

Il est possible de reconnaître, outre le texte et les chiffres, le contenu de tableaux complexes lors des premières commandes. Le deep learning, en tant que sous-ensemble de l'intelligence artificielle, contribue à augmenter considérablement la productivité et l'efficacité opérationnelle.

Cette nouvelle approche de la reconnaissance est particulièrement intéressante, car sa logique d'analyse est fondamentalement générique et peut donc être facilement adaptée à d'autres types de documents. Elle ne repose que pour une petite part sur un traitement de texte spécifique basé sur la mise en page.

Ces technologies montrent à quel point l'intelligence artificielle peut être extraordinairement efficace. On travaille actuellement sur la prochaine génération de services d'IA, qui seront bientôt capables d'extraire du premier coup des données précises et fiables à partir de commandes, de factures et d'autres documents commerciaux.

Il est particulièrement passionnant de constater que les meilleures approches de l'IA sont extraordinairement adaptées au traitement du langage naturel dans le domaine des documents commerciaux et représentent un énorme potentiel d'innovation pour l'avenir.

Aussi peu spectaculaire que puisse paraître la saisie de documents pour nous, en tant qu'êtres humains, les processus qui se cachent derrière un traitement automatisé montrent de manière impressionnante non seulement les obstacles, mais aussi le développement technique fulgurant et les approches de solutions fascinantes - un défi impressionnant qu'il s'agit de maîtriser.

https://e3mag.com/partners/esker-software-gmbh/

avatar
Michael Diez, esker

Michael Diez est Account Manager chez Esker.


Écrire un commentaire

Le travail sur la base SAP est essentiel pour réussir la conversion S/4. 

Ce que l'on appelle le centre de compétences prend ainsi une importance stratégique chez les clients existants de SAP. Indépendamment du modèle d'exploitation d'un S/4 Hana, les thèmes tels que Automatisation, Suivi, Sécurité, Gestion du cycle de vie des applications et Gestion des données la base de l'exploitation opérationnelle de S/4.

Pour la deuxième fois déjà, le magazine E3 organise à Salzbourg un sommet pour la communauté SAP afin de s'informer en détail sur tous les aspects du travail de base de S/4-Hana.

Lieu de la manifestation

FourSide Hôtel Salzbourg,
Trademark Collection by Wyndham
Am Messezentrum 2, 5020 Salzbourg, Autriche
+43-66-24355460

Date de l'événement

mercredi 10 juin, et
Jeudi 11 juin 2026

Billet d'entrée anticipé

Billet régulier

EUR 390 hors TVA
disponible jusqu'au 1.10.2025
EUR 590 hors TVA

Lieu de la manifestation

Hôtel Hilton Heidelberg
Kurfürstenanlage 1
D-69115 Heidelberg

Date de l'événement

mercredi 22 avril et
Jeudi 23 avril 2026

Billets

Billet régulier
EUR 590 hors TVA
Abonnés au magazine E3
à prix réduit avec le Promocode STAbo26
EUR 390 hors TVA
Étudiants*
à prix réduit avec le Promocode STStud26.
Veuillez envoyer votre certificat d'études par e-mail à office@b4bmedia.net.
EUR 290 hors TVA
*Les 10 premiers billets sont gratuits pour les étudiants. Tentez votre chance ! 🍀
L'organisateur est le magazine E3 de la maison d'édition B4Bmedia.net AG. Les conférences seront accompagnées d'une exposition de partenaires SAP sélectionnés. Le prix du billet comprend la participation à toutes les conférences du Steampunk and BTP Summit 2026, la visite de l'espace d'exposition, la participation à la soirée et les repas pendant le programme officiel. Le programme des conférences et la liste des exposants et des sponsors (partenaires SAP) seront publiés en temps utile sur ce site.