Information et éducation par et pour la communauté SAP

Des chatbots d'IA d'entreprise avec un logiciel open source

Utiliser ChatGPT, c'est mettre ses données en danger. Mais pour suivre le rythme de l'évolution technologique, l'IA ne peut pas être ignorée. Comment donc concilier la sécurité des données internes et l'IA ? La réponse : l'open source !
Maximilian Rehms, FIS-ASP
Felix Förster, FIS-ASP
23 juillet 2024
avatar
avatar
Ce texte a été automatiquement traduit en français de l'allemand

Le danger des LLM à source fermée : à ce jour, aucune publication n'a été faite sur la manière dont les modèles linguistiques ont été entraînés par les grands hébergeurs de chat AI. Bien au contraire : on entend régulièrement dire que certaines parties des données d'entraînement sont protégées par des droits d'auteur. Tant que le processus d'entraînement n'est pas divulgué, il y a toujours le risque que chaque message, chaque page web, chaque texte et donc potentiellement aussi les données internes de l'entreprise soient utilisés pour l'entraînement. Car une chose est claire : les développeurs de modèles linguistiques vivent des données et doivent continuer à entraîner les modèles linguistiques en permanence. Où peut-on trouver de nouvelles données si tout l'Internet libre a déjà été utilisé ?

La caractéristique révolutionnaire des grands hébergeurs de chat AI n'est pas qu'une sorte de superintelligence capable de remplacer l'homme travaille en arrière-plan. Comme il ne s'agit que de calcul de probabilités, un chatbot n'est pas un être intelligent. Même si la construction dans son ensemble est très complexe, l'élément prometteur est simple : le langage. Les modèles Large Language permettent d'interagir avec les systèmes informatiques en utilisant le langage naturel, humain. L'interface est encore plus simplifiée : un chat. Communiquer avec un ordinateur, c'est comme écrire à un ami via Messenger.

LLM et données propres

Les possibilités de soutien sont énormes : un plan d'entraînement pour réussir un triathlon ? Pas de problème. Résumer des mails ou des contrats interminables aux éléments clés ? C'est fait en quelques secondes. Analyser des anomalies dans de gros fichiers journaux SAP ? Terminé immédiatement. Si l'on relie encore un LLM à ses propres données, le potentiel est presque infini. Il suffit d'imaginer tout ce qu'il est possible de faire lorsqu'on peut interroger tout son système de tickets comme base de connaissances en langage naturel. Vos données sont votre force.

Les LLM exploitent le plus grand potentiel possible de cette force. Les LLM donnent vie à vos données. Comme OpenAI, par exemple, ne donne pas de visibilité, on ne peut jamais être sûr de la sécurité de ses propres données derrière les portes fermées. Mais c'est justement cette porte fermée qui en ouvre une autre : Open Source.

L'open source fournit la clé : chaque détail peut être tracé dans le code du programme, chaque adaptation peut être vérifiée. Vous savez ainsi ce qui se passe avec vos données : rien. Car vous n'envoyez pas de données à une quelconque entreprise, bien au contraire, vous vous procurez le produit dans votre propre maison. C'est un peu comme si vous pouviez acheter ChatGPT en tant que produit fini et le placer dans votre centre informatique. Vous avez la clé et donc le contrôle total de la manière dont vos données sont reliées à l'IA et si elles le sont. En résumé, l'avantage de l'open source est la transparence.

Moteur d'inférence

Tout d'abord, un moteur d'inférence permettant d'exploiter des modèles de langage est installé sur un matériel fort. Il manque encore le LLM adéquat, que l'on peut trouver sur Huggingface pour chaque utilisation. Pour accéder ensuite à vos données, deux possibilités s'offrent à vous : Finetuning et Retrieval Augmented Generation (RAG). Alors que le finetuning nécessite trop de puissance et de coûts, le RAG offre une alternative avantageuse.

Dans ce cas, on ne modifie pas les données du LLM, mais on fournit un contexte issu de sa propre base de données. C'est comme si vous disiez au LLM : voici mon ticket 1234, résumez-moi son contenu. Le fait que le contexte soit toujours fourni présente un autre avantage : contrairement aux fournisseurs en ligne, l'ensemble des données est toujours à jour.

Avec RAG et un LLM open source, vous avez toutes les clés en main pour associer vos propres données à la technologie. La réponse à la question de savoir comment suivre le rythme de l'évolution technologique sans avoir à se soucier de la sécurité de ses propres données est finalement simple : l'open source.


Vers l'inscription du partenaire :

avatar
Maximilian Rehms, FIS-ASP

Maximilian Rehms est ingénieur cloud chez FIS-ASP.


avatar
Felix Förster, FIS-ASP

Felix Förster est consultant AI dans le domaine de l'infrastructure, FIS-ASP


Écrire un commentaire

Le travail sur la base SAP est essentiel pour réussir la conversion S/4. 

Ce que l'on appelle le centre de compétences prend ainsi une importance stratégique chez les clients existants de SAP. Indépendamment du modèle d'exploitation d'un S/4 Hana, les thèmes tels que Automatisation, Suivi, Sécurité, Gestion du cycle de vie des applications et Gestion des données la base de l'exploitation opérationnelle de S/4.

Pour la deuxième fois déjà, le magazine E3 organise à Salzbourg un sommet pour la communauté SAP afin de s'informer en détail sur tous les aspects du travail de base de S/4-Hana.

Lieu de la manifestation

FourSide Hôtel Salzbourg,
Trademark Collection by Wyndham
Am Messezentrum 2, 5020 Salzbourg, Autriche
+43-66-24355460

Date de l'événement

mercredi 10 juin, et
Jeudi 11 juin 2026

Billet d'entrée anticipé

Billet régulier

EUR 390 hors TVA
disponible jusqu'au 1.10.2025
EUR 590 hors TVA

Lieu de la manifestation

Hôtel Hilton Heidelberg
Kurfürstenanlage 1
D-69115 Heidelberg

Date de l'événement

mercredi 22 avril et
Jeudi 23 avril 2026

Billets

Billet régulier
EUR 590 hors TVA
Abonnés au magazine E3
à prix réduit avec le Promocode STAbo26
EUR 390 hors TVA
Étudiants*
à prix réduit avec le Promocode STStud26.
Veuillez envoyer votre certificat d'études par e-mail à office@b4bmedia.net.
EUR 290 hors TVA
*Les 10 premiers billets sont gratuits pour les étudiants. Tentez votre chance ! 🍀
L'organisateur est le magazine E3 de la maison d'édition B4Bmedia.net AG. Les conférences seront accompagnées d'une exposition de partenaires SAP sélectionnés. Le prix du billet comprend la participation à toutes les conférences du Steampunk and BTP Summit 2026, la visite de l'espace d'exposition, la participation à la soirée et les repas pendant le programme officiel. Le programme des conférences et la liste des exposants et des sponsors (partenaires SAP) seront publiés en temps utile sur ce site.