La plataforma global e independiente para la comunidad SAP.

IA: de la fuente al sumidero

Se sabe que la IA se nutre de la inmensidad de la World Wide Web. Para la IA, los textos, las fotos, los vídeos y los gráficos son la fuente de «conocimiento». ChatGPT y otros programas similares proporcionan las respuestas. Pero, ¿qué pasa si las fuentes se agotan?
Peter M. Färbinger, E3 Magazine
24 de noviembre de 2025
avatar

Aunque no se ha demostrado en todos los casos, la suposición parece obvia: a pesar de las señales de prohibición virtuales y los muros de pago, los operadores de los grandes modelos de lenguaje (LLM) están saqueando la riqueza de datos de Internet. Los pioneros de la IA se encuentran entre los mejores informáticos del mundo y, para ustedes, sortear cualquier obstáculo o barrera es pan comido.

Existe una etiqueta de la WWW: al principio del código HTML de un sitio web, se puede programar una prohibición de entrada virtual para los bots y los rastreadores. Esta barrera puede ser útil por varias razones. Por ejemplo, si un sitio web está en construcción y todavía contiene datos de prueba, no tiene mucho sentido que un rastreador de Google indexe estas páginas. Un rastreador web, también llamado araña o bot, es un programa automatizado que busca en Internet para recopilar e indexar el contenido de los sitios web. Los rastreadores siguen los hipervínculos para descubrir nuevas páginas web y almacenan información como títulos, imágenes y palabras clave para crear índices de búsqueda para motores de búsqueda como Google y Bing.

Esta señal de prohibición para los rastreadores web al principio de un sitio web también puede utilizarse, por supuesto, para proteger tu propio contenido. El requisito previo, por supuesto, es el cumplimiento de la etiqueta de la WWW. En otras palabras, cualquier protección puede eludirse con una programación más sofisticada. Numerosos experimentos demuestran que los rastreadores web de las principales empresas de TI eluden regularmente las señales de prohibición virtuales para entrenar sus LLM.

Los autores, periodistas, artistas, fotógrafos y todos los productores de contenido consideran que esta elusión de una barrera técnica constituye una infracción de los derechos de autor y un robo de propiedad intelectual. Existen dictámenes jurídicos preliminares y sentencias judiciales sobre esta cuestión en Estados Unidos. En resumen, algunos jueces estadounidenses consideran que estas señales pueden eludirse con fines de entrenamiento de la IA. Sin embargo, esto no significa que estos textos y fotos puedan utilizarse en las respuestas y resultados de la IA. Esto puede ser legalmente sostenible, pero contradice la sensibilidad humana.

A efectos de entrenamiento, la IA puede leer las ediciones de la revista E3 Magazin, pero no puede citarlas. Probablemente, un resumen de E3 sea suficiente para ayudar a alguien que busque ayuda en la comunidad SAP, lo que la IA puede hacer bien con los datos de entrenamiento. No hay necesidad de citas textuales: el secreto ya ha salido a luz, ¿no?

En última instancia, es una cuestión económica. Cualquiera que utilizara el contenido de E3 con fines comerciales tenía una relación comercial con el editor. Esto garantizaba el intercambio que es tan importante en la comunidad SAP. También podían surgir nuevas fuentes. Sin embargo, si ahora la IA saquea las fuentes de E3 sin ofrecer nada a cambio, existe el riesgo de que E3 y muchas otras fuentes independientes de SAP se agoten.

En unos años, es posible que solo los sitios web oficiales de SAP y la presencia web del grupo de usuarios de SAP estén disponibles para entrenar modelos de lenguaje grandes. Los resultados serán entonces más modestos.

avatar
Peter M. Färbinger, E3 Magazine

Peter M. Färbinger, editor y redactor jefe de E3 Magazine DE, US y ES (e3mag.com), B4Bmedia.net AG, Freilassing (DE), E-Mail: pmf@b4bmedia.net y Tel. +49(0)8654/77130-21


Escriba un comentario

Trabajar sobre la base de SAP es crucial para el éxito de la conversión a S/4. 

Esto confiere al centro de competencia una importancia estratégica para los clientes actuales de SAP. Independientemente del modelo operativo de S/4 Hana, temas como Automatización, Supervisión, Seguridad, Application Lifecycle Management y Gestión de datos la base de las operaciones S/4.

Por cuarta vez, la revista E3 organiza una cumbre para la comunidad SAP en Salzburgo con el fin de ofrecer información exhaustiva sobre todos los aspectos de los fundamentos de S/4 Hana.

Lugar de celebración

FourSide Hotel Salzburgo,
Colección Trademark de Wyndham
Am Messezentrum 2, 5020 Salzburgo, Austria
+43-66-24355460

Fecha del acontecimiento

Miércoles, 10 de junio, y
Jueves, 11 de junio de 2026

Entrada anticipada

Entrada normal

Entrada para los suscriptores de la revista E3

reducido con promocode CCAbo26

Estudiantes

reducido con el promocode CCStud26.
Envíe el justificante de estudios por correo electrónico a office@b4bmedia.net.
*Las 10 primeras entradas son gratuitas para los estudiantes. ¡Prueba tu suerte! 🍀
390 EUR sin IVA.
disponible hasta el 30 de noviembre de 2025
590 EUR sin IVA.
390 EUR sin IVA.
290 EUR sin IVA

Lugar de celebración

Hotel Hilton Heidelberg
Kurfürstenanlage 1
D-69115 Heidelberg

Fecha del acontecimiento

Miércoles 22 de abril y
Jueves, 23 de abril de 2026

Entradas

Entrada anticipada
Entrada normal
390 EUR sin IVA.
disponible hasta el 30 de noviembre de 2025
590 EUR sin IVA
Suscriptores de la revista E3
reducido con promocode STAbo26
390 EUR sin IVA
Estudiantes
reducido con el promocode STStud26.
Envíe el justificante de estudios por correo electrónico a office@b4bmedia.net.
290 EUR sin IVA
*Las 10 primeras entradas son gratuitas para los estudiantes. ¡Prueba tu suerte! 🍀
El acto está organizado por la revista E3, publicada por B4Bmedia.net AG. Las presentaciones irán acompañadas de una exposición de socios seleccionados de SAP. El precio de la entrada incluye la asistencia a todas las ponencias de la Cumbre Steampunk y BTP 2026, la visita a la zona de exposición, la participación en el evento nocturno y el catering durante el programa oficial. El programa de ponencias y la lista de expositores y patrocinadores (socios de SAP) se publicarán en este sitio web a su debido tiempo.