Intelligence artificielle : les données de formation doivent être bonnes, justes et équilibrées


Aspects à prendre en compte dans l'IA
Comment garantir, lors de l'utilisation de l'IA, non seulement la qualité des données, mais aussi le respect des exigences éthiques et juridiques ? C'est à cette problématique de l'apprentissage automatique que s'initie un cours en ligne gratuit qui sera lancé le 19 avril sur openHPI, la plateforme éducative ouverte de l'Institut Hasso Plattner.
Il est dirigé par le professeur HPI Felix Naumann et trois autres experts : Jessica Heesen, spécialiste de l'éthique des médias à l'université de Tübingen, Frauke Rostalski, professeur de droit pénal à l'université de Cologne et Sebastian Hallensleben, expert en normalisation à l'Association allemande de l'électrotechnique, de l'électronique et des technologies de l'information. Les participants pourront ainsi découvrir les différents points de vue des experts en informatique, en droit, en éthique et en normalisation sur les questions liées à ces applications de données massives.

“Nous montrons aux débutants quels sont les aspects à prendre en compte lors de la collecte et de l'utilisation des données. traitement à prendre en compte pour utiliser de bonnes données d'entraînement, justes et équilibrées, et ainsi développer également des systèmes d'IA équitables.“
Felix Naumann,
Professeur de systèmes d'information,
Institut Hasso Plattner, Université de Potsdam
"Nous montrons aux débutants à quels aspects il faut faire attention lors de la collecte et du traitement des données afin d'utiliser des données d'entraînement bonnes, justes et équilibrées et de développer ainsi des systèmes d'IA justes", explique Felix Naumann. Selon lui, des exigences telles que la non-discrimination, la prise en compte de la diversité ou la protection des données des travailleurs se répercutent sur les données et les processus avec lesquels les modèles d'IA ont été entraînés auparavant. "Inversement, des données d'entraînement incomplètes, erronées, inadaptées ou unilatérales conduisent à des modèles incertains", prévient Naumann.
Les résultats pourraient donc finalement conduire à des décisions erronées. Avec les autres responsables du cours, l'informaticien veut montrer que les directives juridiques concernant les données de test, de validation et d'entraînement dans l'apprentissage automatique ainsi que leur mise en œuvre dans les normes et les standards sont également encore "largement inexpliquées". Toutes les personnes intéressées peuvent s'inscrire au cours gratuit de deux semaines "IA et qualité des données - perspectives de la science des données, de l'éthique, de la normalisation et du droit" sur le site officiel : open.hpi.de