Information und Bildungsarbeit von und für die SAP-Community

KI – von der Quelle zur Senke

Allgemein bekannt ist, dass sich KI aus den Weiten des World Wide Web speist. Für KI sind die Texte, Fotos, Videos und Grafiken die Quelle des „Wissens“. Die Senke sind die Antworten von ChatGPT und Co. Was, wenn die Quellen versiegen?
Peter M. Färbinger, E3-Magazin
24. November 2025
avatar

Es ist nicht in allen Fällen bewiesen, aber die Vermutung erscheint offensichtlich: Trotz virtueller Verbotsschilder und Bezahlschranken „plündern“ die Betreiber großer LLMs (Large-Language-Modelle) den Datenschatz des Internets. Die KI-Pioniere gehören zu den besten Informatikern der Welt, damit sollte es ihnen ein Leichtes sein, jede Hürde und Schranke zu umgehen.

Es gibt eine WWW-Etikette: Am Beginn des HTML-Codes einer Website (Homepage) lässt sich ein virtuelles Eintrittsverbot für Bots und Crawler programmieren. Diese Schranke kann aus verschiedenen Gründen sehr sinnvoll sein: Ist etwa eine Website im Aufbau und noch mit Testdaten bestückt, dann macht es für einen Google-Crawler wenig Sinn, diese Seiten zu indexieren. Ein Web-Crawler ist ein automatisiertes Programm (auch Spider oder Bot genannt), das das Internet durchsucht, um Inhalte von Websites zu sammeln und zu indexieren. Der Crawler folgt Hyperlinks, um neue Webseiten zu entdecken, und speichert Informationen wie Titel, Bilder und Schlüsselwörter, um einen durchsuchbaren Index für Suchmaschinen wie Google oder Bing zu erstellen.

Naturgemäß lässt sich dieses Verbotsschild für Web-Crawler am Beginn einer Webseite auch zum Schutz des eigenen Contents nutzen. Voraussetzung ist natürlich die Einhaltung der WWW-Etikette. Anders gesagt: Jeder Schutz lässt sich mit noch raffinierterer Programmierung umgehen. Es gibt zahlreiche Experimente, die belegen, dass die Web-Crawler der großen IT-Pioniere zum Anlernen ihrer LLMs regelmäßig die virtuellen Verbotsschilder umgehen.

Autoren, Journalisten, Künstler, Fotografen und alle Content-Produzenten empfinden diese Umgehung einer technischen Schranke als Copyright-Verletzung und Diebstahl geistigen Eigentums. Es gibt in den USA vorläufige Rechtsgutachten und Gerichtsentscheide zu diesem Thema. Kurz zusammengefasst: Einige US-Richter sind der Meinung, dass die Verbotsschilder zum Zweck des KI-Trainings umgangen werden können. Was aber nicht bedeutet, dass bei KI-Antworten und -Ergebnissen diese Texte und Fotos ausgespielt werden dürfen. Es ist eine dünne Grenze, die vielleicht juristisch haltbar ist, wohl aber dem menschlichen Empfinden widerspricht.

Zum Trainieren darf die KI also die E3-Magazine lesen, aber zitieren darf sie nicht. Dem Hilfesuchenden aus der SAP-Community ist wahrscheinlich schon mit einer guten Zusammenfassung aus dem E3 geholfen, was die KI sicher mit den „Trainingsdaten“ ganz hervorragend schafft. Auf den Luxus eines wörtlichen Zitats kann dann gerne verzichtet werden – die Katze ist ohnehin aus dem Sack, oder?

Letztendlich ist es ein finanzielles Problem: Wer immer sich auch in kommerzieller Art der E3-Inhalte bediente, der stand in einer Geschäftsbeziehung zum Verlag. Damit waren das so wichtige Geben und Nehmen in der SAP-Community gesichert. Und es konnten neue Quellen entstehen. „Plündert“ nun die KI die E3-Quellen ohne entsprechende Gegenleistung, dann besteht die Gefahr, dass die E3-Quelle und viele andere, unabhängige SAP-Quellen versiegen.

In wenigen Jahren könnten der KI dann nur die offiziellen SAP-Webseiten und das WWW-Angebot des Anwendervereins zum Training der Large-Language-Modelle zur Verfügung stehen. Die Antworten in der Senke werden bescheidener sein. (pmf)

avatar
Peter M. Färbinger, E3-Magazin

Peter M. Färbinger, Herausgeber und Chefredakteur E3-Magazin DE, US und ES (e3mag.com), B4Bmedia.net AG, Freilassing (DE), E-Mail: pmf@b4bmedia.net und Tel. +49(0)8654/77130-21


Schreibe einen Kommentar

Die Arbeit an der SAP-Basis ist entscheidend für die erfolgreiche S/4-Conversion. 

Damit bekommt das sogenannte Competence Center bei den SAP-Bestandskunden strategische Bedeutung. Unhabhängig vom Betriebsmodell eines S/4 Hana sind Themen wie Automatisierung, Monitoring, Security, Application Lifecycle Management und Datenmanagement die Basis für den operativen S/4-Betrieb.

Zum vierten Mal bereits veranstaltet das E3-Magazin in Salzburg einen Summit für die SAP-Community, um sich über alle Aspekte der S/4-Hana-Basisarbeit umfassend zu informieren.

Veranstaltungsort

FourSide Hotel Salzburg,
Trademark Collection by Wyndham
Am Messezentrum 2, 5020 Salzburg, Österreich
+43-66-24355460

Veranstaltungsdatum

Mittwoch, 10. Juni, und
Donnerstag, 11. Juni 2026

Early-Bird-Ticket

Reguläres Ticket

Abonnenten des E3-Magazins Ticket

ermäßigt mit Promocode CCAbo26

Studierende*

ermäßigt mit Promocode CCStud26.
Studiennachweis bitte per mail an office@b4bmedia.net senden.
*Die ersten 10 Tickets sind für Studierende kostenfrei. Versuchen Sie Ihr Glück! 🍀
EUR 390 exkl. USt.
verfügbar bis 30. November 2025
EUR 590 exkl. USt.
EUR 390 exkl. USt.
EUR 290 exkl. USt.

Veranstaltungsort

Hotel Hilton Heidelberg
Kurfürstenanlage 1
D-69115 Heidelberg

Veranstaltungsdatum

Mittwoch, 22. April und
Donnerstag, 23. April 2026

Tickets

Early-Bird-Ticket
Reguläres Ticket
EUR 390 exkl. USt.
verfügbar bis 30.11.2025
EUR 590 exkl. USt
Abonnenten des E3-Magazins
ermäßigt mit Promocode STAbo26
EUR 390 exkl. USt
Studierende*
ermäßigt mit Promocode STStud26.
Studiennachweis bitte per mail an office@b4bmedia.net senden.
EUR 290 exkl. USt
*Die ersten 10 Tickets sind für Studierende kostenfrei. Versuchen Sie Ihr Glück! 🍀
Veranstalter ist das E3-Magazin des Verlags B4Bmedia.net AG. Die Vorträge werden von einer Ausstellung ausgewählter SAP-Partner begleitet. Der Ticketpreis beinhaltet den Besuch aller Vorträge des Steampunk und BTP Summit 2026, den Besuch des Ausstellungsbereichs, die Teilnahme an der Abendveranstaltung sowie die Verpflegung während des offiziellen Programms. Das Vortragsprogramm und die Liste der Aussteller und Sponsoren (SAP-Partner) wird zeitnah auf dieser Website veröffentlicht.