Ojo con el lavado de código abierto para la IA


Los usuarios de SAP tampoco pueden ignorar la IA y el ML. Estas tecnologías pueden utilizarse en una amplia gama de áreas de SAP, por ejemplo como IA predictiva o analítica en el análisis de datos maestros, la optimización de procesos de producción y cadenas de suministro, el control de calidad y de forma generativa. Cuando se utiliza la IA en áreas críticas para el negocio como los entornos SAP, siempre debe garantizarse un alto grado de trazabilidad y explicabilidad. Las empresas no quieren una caja negra de algoritmos, datos de entrenamiento o modelos, sino una IA que también respete los principios legales y éticos.
Transparencia a través del código abierto
El valor de las estrategias y tecnologías de código abierto de eficacia probada se pone de manifiesto durante su aplicación. Al igual que en el desarrollo de software, son sinónimo de transparencia. Sin embargo, existe el riesgo de que el código abierto se convierta en un lavado de cara, como demuestra una comparación de los elementos centrales del software de código abierto y los LLM de código abierto. El software de código abierto se caracteriza por algoritmos transparentes y comprensibles, una gestión de errores visible y la oportunidad de impulsar el desarrollo con la participación de la comunidad. En cambio, muchos de los LLM de código abierto suelen estar disponibles de forma gratuita, pero ofrecen poca información sobre aspectos como los datos de entrenamiento, las ponderaciones, los guardarraíles internos del modelo o una hoja de ruta sólida. Las sorpresas están a la orden del día.
Desde el punto de vista de la empresa, la trazabilidad y la base de datos son fundamentales, aunque sólo sea por motivos de responsabilidad o cumplimiento. Se plantea la cuestión de si se debe utilizar un modelo de base de desarrollo monolítico y cuál, cómo se pueden contrarrestar las limitaciones y los riesgos y qué esfuerzo hay que invertir en el funcionamiento, la puesta a punto y la supervisión. Los modelos compactos y específicos de un dominio para un usuario de SAP son una opción interesante en este caso, ya que son más fáciles y rápidos de formar para un área de aplicación definida y pueden manejarse e integrarse de forma más controlada.
Cuando se utilizan LLM genéricos, que ofrecen diversos grados de apertura en cuanto a datos de preentrenamiento y restricciones de uso, estos modelos pueden ampliarse ahora para un fin empresarial específico mediante un procedimiento diferente. Red Hat e IBM han lanzado el proyecto comunitario InstructLab con este fin.
Requiere menos datos y recursos informáticos para volver a entrenar un modelo. Los usuarios y, si lo desean, la comunidad pueden mejorar continuamente los modelos mediante "conocimientos" y "habilidades" a través de contribuciones ascendentes, de acuerdo con los verdaderos principios del código abierto, sin generar miles de nuevas variantes del modelo. Por lo tanto, es posible reforzar aún más un proceso de GAR aplicando la técnica de GAR a un modelo armonizado con InstructLab.
Plataformas MLOps flexibles e híbridas
La plataforma utilizada es siempre una parte importante del entorno de IA. En lugar de muchos entornos sandbox aislados y a menudo no escalables, los usuarios de SAP esperan una plataforma MLOps flexible e híbrida para un uso productivo, que ahora está disponible con Red Hat OpenShift AI, por ejemplo. Dicha plataforma admite la formación, el suministro y la supervisión estandarizada de todas las aplicaciones de IA en la nube, en el perímetro y en las instalaciones. La IA también desempeñará un papel importante en los entornos SAP en el futuro, tanto dentro como fuera de SAP, integrados entre sí y altamente escalables.
Sin embargo, debido a los elevados requisitos normativos derivados del GDPR o de la Ley de IA de la UE, por ejemplo, es indispensable una IA digna de confianza. Un enfoque de código abierto es la base adecuada para ello, ya que ofrece transparencia, innovación y seguridad. Sin embargo, debe ser realmente de código abierto -también en lo que se refiere a los datos de entrenamiento o los modelos de IA- y no sólo un lavado de código abierto.
A la entrada de socios:
