Reconnaissance de documents et IA : peu spectaculaires ou impressionnantes ?


Lire et utiliser les informations et les données des documents ne nous pose pas de problème majeur en tant qu'être humain. Nous sommes capables, sans effort, de trier et de séparer une pile de documents les plus divers en fonction de leur mise en page et de saisir toutes les informations nécessaires.
Pour les solutions logicielles, ce traitement est loin d'être banal. L'extraction efficace d'informations à partir de documents commerciaux entrants, tels que les commandes, est essentielle pour les entreprises qui sont confrontées quotidiennement à d'innombrables documents.
C'est précisément parce qu'il y a un monde entre la numérisation et la capture de documents. Lorsqu'un document est numérisé, il est enregistré numériquement sur l'ordinateur. C'est là que le processus s'arrête.
Le fichier est numérisé, mais les utilisateurs ne peuvent pas faire grand-chose avec les informations contenues dans le document. Or, ces informations sont très précieuses et les entreprises en ont besoin pour les utiliser et les traiter dans leur système SAP.
C'est pourquoi il est indispensable de mettre en place un logiciel ou un processus pour la saisie des documents de contenu. Mais la tâche est loin d'être accomplie.
Malgré des technologies de plus en plus performantes, l'exactitude sémantique globale de l'extraction des données reste un défi, notamment lors de l'analyse du contenu des tableaux pour identifier les postes commandés ou facturés, car les documents présentent souvent des structures complexes et ambiguës.
On peut miser sur des méthodes de reconnaissance similaires à la reconnaissance faciale. En combinaison avec un grand nombre de modèles de mise en page et un apprentissage automatique continu, il est possible de générer des taux d'automatisation élevés pour la reconnaissance et la saisie de documents tels que les commandes ou les factures.
On peut compléter cette méthode par une extraction intelligente du contenu des tableaux, qui va au-delà de la simple reconnaissance des structures physiques.
Il s'agit d'une approche basée sur le deep learning qui permet de reconnaître des positions dans différentes mises en page qui ne sont pas forcément prises en compte lors de la simple reconnaissance de la structure ou qui ne sont pas apprises à l'algorithme au préalable.
La nouvelle approche basée sur le deep learning entraîne l'algorithme utilisé avec une grande quantité de données réelles préparées, qui sont rendues anonymes pour des raisons de protection des données et mises à la disposition d'un réseau neuronal.
Cet algorithme est désormais en mesure de générer des taux de saisie élevés, même lors de la première saisie de commandes ou de factures, grâce à son "expérience" et à l'étendue correspondante de son réseau.
Il est possible de reconnaître, outre le texte et les chiffres, le contenu de tableaux complexes lors des premières commandes. Le deep learning, en tant que sous-ensemble de l'intelligence artificielle, contribue à augmenter considérablement la productivité et l'efficacité opérationnelle.
Cette nouvelle approche de la reconnaissance est particulièrement intéressante, car sa logique d'analyse est fondamentalement générique et peut donc être facilement adaptée à d'autres types de documents. Elle ne repose que pour une petite part sur un traitement de texte spécifique basé sur la mise en page.
Ces technologies montrent à quel point l'intelligence artificielle peut être extraordinairement efficace. On travaille actuellement sur la prochaine génération de services d'IA, qui seront bientôt capables d'extraire du premier coup des données précises et fiables à partir de commandes, de factures et d'autres documents commerciaux.
Il est particulièrement passionnant de constater que les meilleures approches de l'IA sont extraordinairement adaptées au traitement du langage naturel dans le domaine des documents commerciaux et représentent un énorme potentiel d'innovation pour l'avenir.
Aussi peu spectaculaire que puisse paraître la saisie de documents pour nous, en tant qu'êtres humains, les processus qui se cachent derrière un traitement automatisé montrent de manière impressionnante non seulement les obstacles, mais aussi le développement technique fulgurant et les approches de solutions fascinantes - un défi impressionnant qu'il s'agit de maîtriser.