Veiller à l'open source washing en matière d'IA


Les utilisateurs SAP ne peuvent pas non plus ignorer l'IA et le ML. Ces technologies peuvent être utilisées dans les domaines SAP les plus divers, par exemple comme IA prédictive ou analytique pour l'analyse des données de base, l'optimisation des processus de production et des chaînes d'approvisionnement, le contrôle de la qualité et sous forme générative. Lors de l'utilisation de l'IA dans des domaines critiques pour l'entreprise tels que les environnements SAP, il faut toujours garantir un haut niveau de traçabilité et d'explicabilité. Les entreprises ne veulent pas d'une boîte noire en matière d'algorithmes, de données d'entraînement ou de modèles, mais d'une IA qui respecte également les principes juridiques et éthiques.
La transparence grâce à l'open source
C'est lors de la mise en œuvre que l'on voit la valeur des stratégies et des technologies open source éprouvées. Comme dans le développement de logiciels, elles sont synonymes de transparence. Toutefois, il existe ici un risque d'open source washing, comme le montre une comparaison des éléments clés des logiciels open source et des LLM open source. Les logiciels open source se caractérisent par des algorithmes transparents et compréhensibles, un traitement des erreurs visible et la possibilité de faire avancer le développement avec la participation de la communauté. En revanche, de nombreux LLM open source sont certes disponibles gratuitement, mais ne permettent guère de voir des aspects tels que les données d'entraînement, les pondérations, les garde-fous internes au modèle ou une feuille de route solide. Les surprises sont à l'ordre du jour.
Du point de vue de l'entreprise, la traçabilité et la base de données sont fondamentales, ne serait-ce que pour des raisons de responsabilité ou de conformité. Les questions qui se posent sont les suivantes : faut-il utiliser un modèle de fondation pour le développement monolithique et lequel, comment faire face aux restrictions et aux risques et quels efforts doivent être fournis pour l'exploitation, la mise au point et le suivi ? Les modèles compacts et spécifiques à un domaine pour un utilisateur SAP sont ici une option intéressante, car ils peuvent être formés plus facilement et plus rapidement pour un domaine d'application défini et être exploités et intégrés de manière plus contrôlée.
Lors de l'utilisation de LLM génériques, qui offrent différents degrés d'ouverture en ce qui concerne les données de préformation et les restrictions d'utilisation, ces modèles peuvent depuis peu être étendus selon une procédure différente pour un objectif commercial spécifique. Pour ce faire, Red Hat et IBM ont lancé le projet communautaire InstructLab.
Il nécessite moins de données et de ressources de calcul pour le retraitement d'un modèle. Les utilisateurs et, s'ils le souhaitent, la communauté peuvent améliorer en permanence les modèles de "connaissances" et de "compétences" grâce à des contributions en amont - selon de véritables principes open source, sans pour autant créer des milliers de nouvelles variantes de modèles. Il est ainsi possible de renforcer encore un processus RAG en appliquant la technique RAG à un modèle coordonné avec InstructLab.
Plateformes MLOps flexibles et hybrides
La plateforme utilisée est toujours un élément important de l'environnement d'IA. Au lieu de nombreux environnements sandbox isolés et souvent non évolutifs, les utilisateurs SAP attendent une plateforme MLOps flexible et hybride pour l'utilisation en production, qui est désormais disponible avec Red Hat OpenShift AI par exemple. Une telle plate-forme prend en charge la formation, le déploiement et la surveillance unifiée de toutes les applications d'IA, que ce soit dans le cloud, en périphérie ou sur site. L'IA jouera également un rôle important dans les environnements SAP, à l'intérieur et à l'extérieur de SAP, de manière intégrée et hautement évolutive.
Toutefois, en raison des exigences réglementaires élevées découlant par exemple du RGPD ou de l'AI Act de l'UE, une IA digne de confiance est indispensable. Une approche open source est la bonne base pour cela, car elle offre transparence, innovation et sécurité. Toutefois, il doit s'agir d'un véritable open source - également en ce qui concerne les données d'entraînement ou les modèles d'IA - et non d'un simple open source washing.
Vers l'inscription du partenaire :
