UNF#CK YOUR DATA

Ethical AI - Warum es nicht reicht die KI Outputs fair gestalten zu wollen | Barbara Lampl


Listen Later

TRIGGERWARNUNG – Wir sprechen unmenschliche Arbeitsbedingungen und Menschen die mit unangemessene Inhalte sichten und prüfen müssen.

Wenn Daten doch die Grundlage von KI sind und wir eine ethical AI mal Ende zu Ende betrachten wollen, dann müssen wir doch eigentlich genau an der Quelle anfangen. Aber warum wird darüber so wenig gesprochen? Und was läuft hier schon alles falsch?

Darüber spricht Christian Krug, der Host des Podcasts „Unf*ck Your Data“ mit Barbara Lampl, Geschäftsführerin von Empathic Business.


Wenn es um das Thema Ethical AI geht, dann betrachten die meisten Menschen gerne die Outputs. Also dass hier eine faire und ausgewogene Mischung an Ergebnissen repräsentiert wird. Manchmal wagt man noch den Blick darauf wie die Daten für das Training zusammengestellt werden.

Aber wie genau diese Daten zugänglich gemacht oder erfasst wurden, darüber wird nur selten berichtet. Denn das ist ein Bereich, den die großen Tech Unternehmen oft nur zu gerne unsichtbar halten würden.


Barbara Lampl nimmt uns mit auf eine Geschichtsstunde durch das Datalabeling oder Dataannotation. Denn Daten und Informationen waren schon immer ein Wettbewerbsvorteil. In der digitalen vernetzten Welt wird dies besonders schnell sichtbar. Angefangen von Yahoo deren Surfer das frühe Internet kartografiert haben bis zu den heutigen Taskern, die die Grundlage für die modernen KI Systeme legen. Data is king!

Gut sortierte, kategorisierte und beschriftete Daten sind der entscheidenden Vorteil. Vom Labeling für KI Modelle bis zur Content Moderation auf den sozialen Medien. Wer die besten Daten hat, hat die zuverlässigsten Algorithmen.


Das Bizarre: Die Menschen die die Grundlagen dafür legen, dass andere Milliardäre werden, verdienen oft nur wenige Dollar die Stunde. Und das für Arbeit im Sekundentakt die oft unter prekären Bedingungen stattfindet und bei der die Menschen zum Teil ohne Ausbildung oder Betreuung mit extremen Inhalten konfrontiert werden.

Kein Wunder, dass diese Karawane immer weiter zieht, denn Ausbeutung ist nicht nachhaltig und viele der Tasker lernen schnell die Systeme die sie aufbauen selbst zu nutzen um ihre Arbeit zu erleichtern.


Doch auch dieser unbequemen Wahrheit müssen wir uns stellen, wenn wir KI Systeme nutzen. Und uns manchmal fragen – Warum sind die Ergebnisse so seltsam?



▬▬▬▬▬▬ Profile: ▬▬▬▬


Zum LinkedIn-Profil von AI Babsi: https://www.linkedin.com/in/barbaralampl/


Zum LinkedIn-Profil von Christian: https://www.linkedin.com/in/christian-krug/


Christians Wonderlink: https://wonderl.ink/@christiankrug


UNF#CK YOUR DATA auf Linkedin: https://www.linkedin.com/company/unfck-your-data


▬▬▬▬▬▬ Buchempfehlung: ▬▬▬▬


Buchempfehlung von Barbara: Feeding the Machine – Mark Graham


Alle Empfehlungen in Melenas Bücherladen:

https://gunzenhausen.buchhandlung.de/unfuckyourdata



▬▬▬▬▬▬ Hier findest Du Unf*ck Your Data: ▬▬▬▬


Zum Podcast auf Spotify: https://open.spotify.com/show/6Ow7ySMbgnir27etMYkpxT?si=dc0fd2b3c6454bfa


Zum Podcast auf iTunes: https://podcasts.apple.com/de/podcast/unf-ck-your-data/id1673832019


Zum Podcast auf Deezer: https://deezer.page.link/FnT5kRSjf2k54iib6


Zum Podcast auf Youtube: https://www.youtube.com/@unfckyourdata


▬▬▬▬▬▬ Merch: ▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬


https://unfckyourdata-shop.de/


▬▬▬▬▬▬ Kontakt: ▬▬▬▬


E-Mail: [email protected]


▬▬▬▬▬▬ Timestamps: ▬▬▬▬▬▬▬▬▬▬▬▬▬

00:00 Einführung in Ethical AI und Datenverantwortung

04:00 Die Rolle der Daten im KI-Training

09:51 Geschichte der Datenannotation und Crowdsourcing

15:46 Content Moderation und ihre ethischen Herausforderungen

24:03 Die Herausforderungen der Polizeiarbeit

26:59 Die Realität der Clickworker

30:14 Die ethischen Implikationen der Datenannotation

32:59 Die Problematik der Edge-Cases in KI

36:14 Die Rolle des Menschen im KI-Training

38:58 Die Herausforderungen der Textbewertung in KI

43:19 Kulturelle Wahrnehmung und Sprache

44:05 Absurdistan: Die Herausforderungen der Datenverarbeitung

45:50 Die Rolle von Clickworkern in der Datenlabeling-Welt

48:34 Die Dimensionen des Datenlabelings

51:45 Die Herausforderungen der Content Moderation

54:57 Die ethischen Implikationen von KI und Daten

57:32 Faire Bedingungen in der KI-Wertschöpfungskette


...more
View all episodesView all episodes
Download on the App Store

UNF#CK YOUR DATABy Christian Krug