Künstliche Intelligenz: Trainingsdaten müssen gut, fair und ausgewogen sein
Bei KI zu beachtende Aspekte
Wie kann beim Einsatz von KI gewährleistet werden, dass nicht nur die Datenqualität stimmt, sondern auch ethische und juristische Anforderungen erfüllt werden? In diese Problematik maschinellen Lernens führt ein kostenloser Onlinekurs ein, der am 19. April auf openHPI, der offenen Bildungsplattform des Hasso-Plattner-Instituts, startet.
Geleitet wird er von HPI-Professor Felix Naumann und drei anderen Fachleuten: Medienethikerin Jessica Heesen von der Universität Tübingen, Strafrechtsprofessorin Frauke Rostalski von der Universität Köln und Normungsexperte Sebastian Hallensleben vom Verband der Elektrotechnik, Elektronik und Informationstechnik. Wer teilnimmt, bekommt vermittelt, wie unterschiedlich Experten der Bereiche Informatik, Recht, Ethik und Normung auf die Fragestellungen rund um solche Big-Data-Anwendungen blicken.
“Wir zeigen Einsteigern ins Thema, auf welche Aspekte bei der Datensammlung und Verarbeitung man achten sollte, um gute, faire und ausgewogene Trainingsdaten zu verwenden und so auch faire KI-Systeme zu entwickeln.“
Felix Naumann,
Professor für Informationssysteme,
Hasso-Plattner-Institut, Uni Potsdam
„Wir zeigen Einsteigern ins Thema, auf welche Aspekte bei der Datensammlung und Verarbeitung man achten sollte, um gute, faire und ausgewogene Trainingsdaten zu verwenden und so auch faire KI-Systeme zu entwickeln“, sagt Felix Naumann. Nach seinen Worten wirken Anforderungen wie etwa Diskriminierungsfreiheit, Berücksichtigung von Diversität oder Arbeitnehmerdatenschutz auf die Daten und Prozesse zurück, mit denen KI-Modelle zuvor trainiert wurden. „Umgekehrt führen unvollständige, fehlerbehaftete, unpassende oder einseitige Trainingsdaten zu unsicheren Modellen“, warnt Naumann.
Die Ergebnisse könnten somit letztlich zu Fehlentscheidungen führen. Zusammen mit den anderen Kursleitern will der Informatikwissenschaftler aufzeigen, dass auch die rechtlichen Vorgaben für Test-, Validierungs- und Trainingsdaten im maschinellen Lernen sowie deren Umsetzung in Normen und Standards noch „weitgehend ungeklärt“ sind. Anmelden für den zweiwöchigen Gratiskurs „KI und Datenqualität – Perspektiven aus Data Science, Ethik, Normung und Recht“ können sich alle Interessierten auf der offiziellen Webseite: open.hpi.de