July 03, 2024

Episode 175 - Miniserie Interpretierbarkeit - Golden Gate Claude

Listen Later

29 minutes

Send us a text

In dieser faszinierenden Episode erkunden Sigurd Schacht und Carsten Lanquillon, wie Anthropic's Forschung zur Interpretierbarkeit von KI es ermöglicht, Sprachmodelle auf Konzeptebene zu manipulieren. Sie diskutieren das aufsehenerregende Golden Gate Claude-Experiment, bei dem ein Sprachmodell dazu gebracht wurde, in jeder Konversation die Golden Gate Bridge zu erwähnen, und erörtern die weitreichenden Implikationen dieser Technologie für die Zukunft der KI-Steuerung und -Sicherheit.

Support the show

...more

View all episodes

View all episodes

Download on the App Store

Download on the App Store

Get it on Google Play

Knowledge Science - Alles über KI, ML und NLP

By Sigurd Schacht, Carsten Lanquillon

July 03, 2024

Episode 175 - Miniserie Interpretierbarkeit - Golden Gate Claude

Listen Later

29 minutes

Send us a text

In dieser faszinierenden Episode erkunden Sigurd Schacht und Carsten Lanquillon, wie Anthropic's Forschung zur Interpretierbarkeit von KI es ermöglicht, Sprachmodelle auf Konzeptebene zu manipulieren. Sie diskutieren das aufsehenerregende Golden Gate Claude-Experiment, bei dem ein Sprachmodell dazu gebracht wurde, in jeder Konversation die Golden Gate Bridge zu erwähnen, und erörtern die weitreichenden Implikationen dieser Technologie für die Zukunft der KI-Steuerung und -Sicherheit.

Support the show

...more

More shows like Knowledge Science - Alles über KI, ML und NLP

Hintergrund by Deutschlandfunk

Hintergrund

64 Listeners

Geschichten aus der Geschichte by Richard Hemmer und Daniel Meßner

Geschichten aus der Geschichte

204 Listeners

Das Wissen | SWR by SWR

Das Wissen | SWR

105 Listeners

c’t uplink - der IT-Podcast aus Nerdistan by c’t Magazin

c’t uplink - der IT-Podcast aus Nerdistan

10 Listeners

Spektrum-Podcast by detektor.fm – Das Podcast-Radio

Spektrum-Podcast

16 Listeners

Doppelgänger by Philipp Glöckler, Philipp Klöckner

Doppelgänger

13 Listeners

Alles Geschichte - Der History-Podcast by ARD

Alles Geschichte - Der History-Podcast

59 Listeners

Lanz + Precht by ZDF, Markus Lanz & Richard David Precht

Lanz + Precht

340 Listeners

KI verstehen by Deutschlandfunk

KI verstehen

11 Listeners

RONZHEIMER. by Paul Ronzheimer

RONZHEIMER.

125 Listeners

Der KI-Podcast by ARD

Der KI-Podcast

17 Listeners

KI-Update – ein heise-Podcast by Isabel Grünewald, heise online

KI-Update – ein heise-Podcast

4 Listeners

Geschichten aus der Mathematik by detektor.fm – Das Podcast-Radio

Geschichten aus der Mathematik

1 Listeners

Tech, KI & Schmetterlinge by Sascha Lobo, Schwarz Digits

Tech, KI & Schmetterlinge

2 Listeners