Information et éducation par et pour la communauté SAP

IA – de la source au puits

Il est bien connu que l'IA se nourrit des vastes ressources du World Wide Web. Pour l'IA, les textes, photos, vidéos et graphiques constituent la source de son „ savoir “. Les réponses fournies par ChatGPT et autres constituent le réservoir. Que se passerait-il si ces sources venaient à se tarir ?
Peter M. Färbinger, E3 Magazine
24 novembre 2025
avatar
Ce texte a été automatiquement traduit en français de l'allemand

Cela n'a pas été prouvé dans tous les cas, mais l'hypothèse semble évidente : malgré les panneaux d'interdiction virtuels et les barrières de paiement, les opérateurs de grands modèles linguistiques (LLM) „ pillent “ le trésor de données que représente Internet. Les pionniers de l'IA comptent parmi les meilleurs informaticiens au monde, ils devraient donc pouvoir contourner facilement tous les obstacles et toutes les barrières.

Il existe une étiquette WWW : au début du code HTML d'un site web (page d'accueil), il est possible de programmer une interdiction d'accès virtuelle pour les robots et les crawlers. Cette barrière peut s'avérer très utile pour différentes raisons : si un site web est en cours de construction et contient encore des données de test, il n'est pas très utile pour un crawler Google d'indexer ces pages. Un robot d'indexation est un programme automatisé (également appelé spider ou bot) qui parcourt Internet afin de collecter et d'indexer le contenu des sites web. Le robot d'indexation suit les hyperliens pour découvrir de nouvelles pages web et enregistre des informations telles que les titres, les images et les mots-clés afin de créer un index consultable pour les moteurs de recherche tels que Google ou Bing.

Naturellement, ce panneau d'interdiction destiné aux robots d'indexation au début d'un site web peut également être utilisé pour protéger son propre contenu. La condition préalable est bien sûr le respect de l'étiquette WWW. En d'autres termes, toute protection peut être contournée grâce à une programmation encore plus sophistiquée. De nombreuses expériences prouvent que les robots d'indexation des grands pionniers de l'informatique contournent régulièrement les panneaux d'interdiction virtuels pour former leurs LLM.

Les auteurs, journalistes, artistes, photographes et tous les producteurs de contenu considèrent ce contournement d'une barrière technique comme une violation du droit d'auteur et un vol de propriété intellectuelle. Il existe aux États-Unis des avis juridiques préliminaires et des décisions de justice sur ce sujet. En résumé : certains juges américains estiment que les panneaux d'interdiction peuvent être contournés à des fins de formation de l'IA. Cela ne signifie toutefois pas que ces textes et photos peuvent être utilisés dans les réponses et les résultats de l'IA. Il s'agit d'une frontière ténue, qui est peut-être juridiquement défendable, mais qui contredit le sentiment humain.

Pour s'entraîner, l'IA peut donc lire les magazines E3, mais elle ne peut pas les citer. Une bonne synthèse tirée de l'E3 suffira probablement à aider la personne qui sollicite de l'aide au sein de la communauté SAP, ce que l'IA parvient très bien à faire grâce aux „ données d'entraînement “. On peut donc se passer du luxe d'une citation littérale – le secret est de toute façon dévoilé, n'est-ce pas ?

En fin de compte, c'est un problème financier : quiconque utilisait le contenu E3 à des fins commerciales entretenait une relation commerciale avec l'éditeur. Cela garantissait l'équilibre si important entre donner et recevoir au sein de la communauté SAP. Et de nouvelles sources pouvaient voir le jour. Si l'IA „ pille “ désormais les sources E3 sans contrepartie appropriée, le risque est grand de voir la source E3 et de nombreuses autres sources SAP indépendantes se tarir.

Dans quelques années, l'IA pourrait alors ne disposer que des sites Web officiels de SAP et de l'offre WWW de l'association des utilisateurs pour former les modèles de langage à grande échelle. Les réponses dans le creux seront plus modestes. (pmf)

avatar
Peter M. Färbinger, E3 Magazine

Peter M. Färbinger, éditeur et rédacteur en chef de E3-Magazin DE, US et ES (e3mag.com), B4Bmedia.net AG, Freilassing (DE), e-mail : pmf@b4bmedia.net et tél. +49(0)8654/77130-21


Écrire un commentaire

Le travail sur la base SAP est essentiel pour réussir la conversion S/4. 

Ce que l'on appelle le centre de compétences prend ainsi une importance stratégique chez les clients existants de SAP. Indépendamment du modèle d'exploitation d'un S/4 Hana, les thèmes tels que Automatisation, Suivi, Sécurité, Gestion du cycle de vie des applications et Gestion des données la base de l'exploitation opérationnelle de S/4.

Pour la quatrième fois déjà, le magazine E3 organise à Salzbourg un sommet pour la communauté SAP afin de s'informer en détail sur tous les aspects du travail de base de S/4-Hana.

Lieu de la manifestation

FourSide Hôtel Salzbourg,
Trademark Collection by Wyndham
Am Messezentrum 2, 5020 Salzbourg, Autriche
+43-66-24355460

Date de l'événement

mercredi 10 juin, et
Jeudi 11 juin 2026

Billet d'entrée anticipé

Billet régulier

Abonnés au magazine E3 Ticket

à prix réduit avec le Promocode CCAbo26

Étudiants*

à prix réduit avec le Promocode CCStud26.
Veuillez envoyer votre certificat d'études par e-mail à office@b4bmedia.net.
*Les 10 premiers billets sont gratuits pour les étudiants. Tentez votre chance ! 🍀
EUR 390 hors TVA
disponible jusqu'au 30 novembre 2025
EUR 590 hors TVA
EUR 390 hors TVA
EUR 290 hors TVA

Lieu de la manifestation

Hôtel Hilton Heidelberg
Kurfürstenanlage 1
D-69115 Heidelberg

Date de l'événement

mercredi 22 avril et
Jeudi 23 avril 2026

Billets

Billet d'entrée anticipé
Billet régulier
EUR 390 hors TVA
disponible jusqu'au 30.11.2025
EUR 590 hors TVA
Abonnés au magazine E3
à prix réduit avec le Promocode STAbo26
EUR 390 hors TVA
Étudiants*
à prix réduit avec le Promocode STStud26.
Veuillez envoyer votre certificat d'études par e-mail à office@b4bmedia.net.
EUR 290 hors TVA
*Les 10 premiers billets sont gratuits pour les étudiants. Tentez votre chance ! 🍀
L'organisateur est le magazine E3 de la maison d'édition B4Bmedia.net AG. Les conférences seront accompagnées d'une exposition de partenaires SAP sélectionnés. Le prix du billet comprend la participation à toutes les conférences du Steampunk and BTP Summit 2026, la visite de l'espace d'exposition, la participation à la soirée et les repas pendant le programme officiel. Le programme des conférences et la liste des exposants et des sponsors (partenaires SAP) seront publiés en temps utile sur ce site.