Knowledge Science - Alles über KI, ML und NLP

Episode 195 - Die Kunst des Reward Hackings: Wie KI-Systeme den leichtesten Weg finden.


Listen Later

Send us a text

In dieser Episode von "Knowledge Science" diskutieren Sigurd Schacht und Carsten Lanquillon über das vielschichtige Thema des Reward Hacking in KI-Modellen. Anhand des aktuellen Papers von OpenAI tauchen wir tief in die Mechanismen ein, die künstliche Intelligenzen dazu bringen, den einfachsten Weg zur Zielerfüllung zu wählen – und warum das nicht immer gewünscht ist. Außerdem wird die Rolle von Multi-Agenten-Systemen und moralischen Erwägungen beleuchtet. Erfahren Sie, wie diese Dynamiken in realen Anwendungen reflektiert werden und welche spannenden Forschungsfragen sich daraus ergeben. 

Link zum Paper: https://openai.com/index/chain-of-thought-monitoring/

Support the show

...more
View all episodesView all episodes
Download on the App Store

Knowledge Science - Alles über KI, ML und NLPBy Sigurd Schacht, Carsten Lanquillon


More shows like Knowledge Science - Alles über KI, ML und NLP

View all
Handelsblatt Green & Energy - Der Podcast rund um Nachhaltigkeit, Klima und Energiewende by Kathrin Witsch, Catiana Krapp, Kevin Knitterscheidt, Michael Scheppe

Handelsblatt Green & Energy - Der Podcast rund um Nachhaltigkeit, Klima und Energiewende

8 Listeners

KI verstehen by Deutschlandfunk

KI verstehen

9 Listeners

Der KI-Podcast by ARD

Der KI-Podcast

20 Listeners

KI-Update – ein heise-Podcast by Isabel Grünewald, heise online

KI-Update – ein heise-Podcast

3 Listeners

Geschichten aus der Mathematik by detektor.fm – Das Podcast-Radio

Geschichten aus der Mathematik

1 Listeners