Apprentissage automatique


Il s'agit d'un programme européen d'innovation pour les start-ups et les PME. Une solution prometteuse pour optimiser les données clients, par exemple pour le marketing, est le deep learning, une branche du machine learning (ML). Avec les start-ups Frosha.io et Recogn.ai, Uniserv veut faire progresser cette technologie.
Les bases de données clients sont sujettes aux erreurs
Dans le cadre de l'initiative Data Pitch, Uniserv a demandé cet été à des start-up d'élaborer une solution automatique capable d'apprendre. Celle-ci devait être entraînée à assembler des données provenant de différentes sources internes et externes, comme par exemple des pages Internet, des données ouvertes, des profils de médias sociaux ou des e-mails.
Ces sources sont extrêmement hétérogènes. En outre, la solution devait corriger automatiquement les erreurs dans les enregistrements existants - et donc être en mesure d'optimiser les bases de données clients. En effet, les erreurs se glissent souvent, en particulier dans les données de base telles que le nom et l'adresse.
Simone Braun, Business Development, Uniserv, explique : "Par exemple, il est fréquent que des informations sur une personne soient déposées dans des enregistrements concernant l'entreprise ou que des noms d'entreprises soient mentionnés dans le champ d'adresse.
Il arrive aussi souvent que des informations concernant plusieurs personnes ne soient enregistrées que dans un seul enregistrement pour une seule personne. Certes, un être humain reconnaît immédiatement ces erreurs, mais elles sont difficiles à corriger pour une machine. La technologie d'auto-apprentissage utilisée devrait toutefois dépasser les capacités humaines".
Le deep learning détecte les structures défectueuses
L'approche d'apprentissage en profondeur des deux start-ups européennes Frosha.io et Recogn.ai a été particulièrement convaincante. Frosha.io a utilisé des réseaux neuronaux récurrents (Recurrent Neural Networks) dans le cadre du problème posé. Recogn.ai a convaincu par son approche combinant les graphes de connaissances et l'apprentissage profond pour le traitement automatique du langage naturel (Natural Language Processing).
En utilisant les réseaux neuronaux du deep learning, une machine se met elle-même en position de reconnaître des structures, de les évaluer et de s'améliorer d'elle-même en plusieurs passages.
De cette manière, la technologie parvient à rendre utilisables même des ensembles de données clients non structurés, entre autres pour des mesures de marketing. Les deux solutions devaient en outre tenir compte du règlement général de l'UE sur la protection des données (RGPD).
Dans le cadre du concours, Uniserv a mis à disposition des start-ups participantes des jeux de données contenant des informations synthétiques sur les noms et les adresses sous forme non structurée et semi-structurée. Frosha.io et Recogn.ai ont réussi à s'imposer parmi 142 candidats à l'automne - et ont ensuite répondu avec succès aux questions critiques du jury d'Uniserv, de la Commission européenne et des représentants de l'initiative Data Pitch à Londres fin octobre.
Ils ont ensuite été admis dans le programme d'incubation financé par l'UE. Il leur reste donc six mois à partir du 1er février 2018 pour mettre en pratique leur idée de solution avec le soutien financier de l'UE. Durant cette période, Uniserv soutiendra les deux start-ups en tant que partenaire de coopération en leur fournissant son expertise ainsi que des jeux de données sur la base desquels le système d'apprentissage automatique pourra apprendre.
À l'avenir, Uniserv entend poursuivre le développement de leurs projets respectifs en collaboration avec les deux start-ups. L'objectif est un échange continu de connaissances sur l'utilisation de l'apprentissage automatique et de l'intelligence artificielle pour le traitement des données clients et leur utilisation dans des initiatives de marketing.
Une opportunité pour les start-ups et les entreprises
Data Pitch est un programme d'incubation financé par l'Union européenne qui met en relation des entreprises et des institutions publiques avec des start-ups de toute l'Europe.
Dans le cadre de cette initiative, un concours a été organisé durant l'été et l'automne 2017. Celui-ci a permis à des entreprises actives dans l'analyse de données d'attribuer des tâches à des start-ups et à des PME. L'initiative encourage les start-ups en leur apportant un soutien financier, tandis que les entreprises participantes bénéficient à leur tour de nouvelles idées.