Digital Podcast

KI-Benchmarks haben mehr Probleme als Lösungen


Listen Later

KI-Entwickler brüsten sich stolz mit den Zahlen, die ihre Systeme in Benchmark-Tests erreichen. Wir erklären, wie KI-Benchmarks funktionieren und fragen: Wie aussagekräftig sind solche Tests wirklich? Und kommt es am Ende vielleicht bloss auf die «Vibes» an?
Der ganze Podcast im Überblick:
(00:01:28) Was sind eigentlich KI-Benchmark-Tests?
(00:06:23) Neun Probleme
(00:34:27) Drei Lösungen
Chatbot Arena:
https://chat.lmsys.org
SRF Geek Sofa bei Discord:
https://discord.gg/geeksofa
...more
View all episodesView all episodes
Download on the App Store

Digital PodcastBy Schweizer Radio und Fernsehen (SRF)


More shows like Digital Podcast

View all
Echo der Zeit by Schweizer Radio und Fernsehen (SRF)

Echo der Zeit

95 Listeners

Tagesgespräch by Schweizer Radio und Fernsehen (SRF)

Tagesgespräch

18 Listeners

HeuteMorgen by Schweizer Radio und Fernsehen (SRF)

HeuteMorgen

10 Listeners

Geschichte by Schweizer Radio und Fernsehen (SRF)

Geschichte

15 Listeners

Regionaljournal Zürich Schaffhausen by Schweizer Radio und Fernsehen (SRF)

Regionaljournal Zürich Schaffhausen

1 Listeners

Krimi by Schweizer Radio und Fernsehen (SRF)

Krimi

16 Listeners

SRF Wissen by Schweizer Radio und Fernsehen (SRF)

SRF Wissen

3 Listeners

News Plus – das Thema des Tages in 15 Minuten by Schweizer Radio und Fernsehen (SRF)

News Plus – das Thema des Tages in 15 Minuten

16 Listeners

Debriefing 404 by Schweizer Radio und Fernsehen (SRF)

Debriefing 404

2 Listeners

Sternstunde Philosophie by Schweizer Radio und Fernsehen (SRF)

Sternstunde Philosophie

20 Listeners

Geladen - der Batteriepodcast zur Energiewende by Daniel Messling, Patrick von Rosen

Geladen - der Batteriepodcast zur Energiewende

6 Listeners