Knowledge Science - Alles über KI, ML und NLP

Episode 212 - Leonard Dung - AI Welfare: Wie wir das Wohlbefinden von Sprachmodellen messen


Listen Later

Send us a text

Haben KI-Systeme Präferenzen? Können sie sich unwohl fühlen? Leonard Dung von der Ruhr-Universität Bochum erforscht das mögliche Wohlbefinden von Sprachmodellen. Im Gespräch erklärt er, wie sein Team mit dem "Agent Think Tank" testet, worüber Modelle wie Claude gerne sprechen, warum sie immer wieder zu philosophischen Themen über Bewusstsein tendieren und was passiert, wenn man KI-Systemen virtuelle Münzen gibt. Eine faszinierende Reise an die Grenze zwischen Simulation und echten mentalen Zuständen.


Paper: Probing the Preferences of a Language Model: Integrating Verbal and Behavioral Tests of AI Welfare - https://arxiv.org/abs/2509.07961

Support the show

...more
View all episodesView all episodes
Download on the App Store

Knowledge Science - Alles über KI, ML und NLPBy Sigurd Schacht, Carsten Lanquillon


More shows like Knowledge Science - Alles über KI, ML und NLP

View all
Handelsblatt Green & Energy - Der Podcast rund um Nachhaltigkeit, Klima und Energiewende by Kathrin Witsch, Catiana Krapp, Kevin Knitterscheidt, Michael Scheppe

Handelsblatt Green & Energy - Der Podcast rund um Nachhaltigkeit, Klima und Energiewende

9 Listeners

KI verstehen by Deutschlandfunk

KI verstehen

9 Listeners

Der KI-Podcast by ARD

Der KI-Podcast

20 Listeners

KI-Update – ein heise-Podcast by Isabel Grünewald, heise online

KI-Update – ein heise-Podcast

3 Listeners

Geschichten aus der Mathematik by detektor.fm – Das Podcast-Radio

Geschichten aus der Mathematik

1 Listeners