February 05, 2025

DeepSeek R1

Listen Later

1 hour 24 minutes

Ein Wal liegt am Strand

DeepSeek R1 sorgte im Januar für Aufsehen: Ein chinesisches KI-Modell, das mit offenen Gewichten und ausgefeiltem Chain-of-Thought Reasoning die etablierten US-amerikanischen Modelle wie o1 herausfordert – und das zu einem Bruchteil der bisher als notwendig erachteten Kosten. Die Ankündigung ließ sogar die Aktienkurse namhafter Chiphersteller einbrechen. Wie gelang DeepSeek dieser Durchbruch? Welche innovativen Engineering-Ansätze ermöglichten den Sprung vom klassischen Foundation Model zum leistungsstarken Reasoning-Modell? Ole und Robert nehmen die Evolution von DeepSeek R1 unter die Lupe und analysieren die mehrschichtigen technischen Innovationen, die hinter diesem Erfolg stehen. Sie diskutieren außerdem die konkreten Auswirkungen dieser Entwicklung auf den deutschen Unternehmenssektor.

Shownotes:

Buch: "Thinking, Fast and Slow"

Chain of Thought Prompting

How cheap, outsourced labour in Africa is shaping AI English (RLHF)

AlphaGo: The Movie

Group Relative Policy Optimization (GRPO)

Running DeepSeek V3 671B on M4 Mac Mini Cluster

DeepSeek FAQ von Ben Thompson auf Stratecherry

Gewinner und Verlierer nach dem KI-Erdbeben: Analyse von Marcel Weiß für FAZ (Paywall)

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning (das Paper zur Veröffentlichung von R1)

DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models

ARC Prize: ARC-AGI Benchmark

...more

View all episodes

View all episodes

Download on the App Store

Download on the App Store

Get it on Google Play

INNOQ Podcast

By INNOQ

5

11 ratings

February 05, 2025

DeepSeek R1

Listen Later

1 hour 24 minutes

Ein Wal liegt am Strand

DeepSeek R1 sorgte im Januar für Aufsehen: Ein chinesisches KI-Modell, das mit offenen Gewichten und ausgefeiltem Chain-of-Thought Reasoning die etablierten US-amerikanischen Modelle wie o1 herausfordert – und das zu einem Bruchteil der bisher als notwendig erachteten Kosten. Die Ankündigung ließ sogar die Aktienkurse namhafter Chiphersteller einbrechen. Wie gelang DeepSeek dieser Durchbruch? Welche innovativen Engineering-Ansätze ermöglichten den Sprung vom klassischen Foundation Model zum leistungsstarken Reasoning-Modell? Ole und Robert nehmen die Evolution von DeepSeek R1 unter die Lupe und analysieren die mehrschichtigen technischen Innovationen, die hinter diesem Erfolg stehen. Sie diskutieren außerdem die konkreten Auswirkungen dieser Entwicklung auf den deutschen Unternehmenssektor.

Shownotes:

Buch: "Thinking, Fast and Slow"

Chain of Thought Prompting

How cheap, outsourced labour in Africa is shaping AI English (RLHF)

AlphaGo: The Movie

Group Relative Policy Optimization (GRPO)

Running DeepSeek V3 671B on M4 Mac Mini Cluster

DeepSeek FAQ von Ben Thompson auf Stratecherry

Gewinner und Verlierer nach dem KI-Erdbeben: Analyse von Marcel Weiß für FAZ (Paywall)

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning (das Paper zur Veröffentlichung von R1)

DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models

ARC Prize: ARC-AGI Benchmark

...more

More shows like INNOQ Podcast

Freak Show by Metaebene Personal Media - Tim Pritlove

Freak Show

9 Listeners

Sternengeschichten by Florian Freistetter

Sternengeschichten

48 Listeners

Lage der Nation - der Politik-Podcast aus Berlin by Philip Banse & Ulf Buermeyer

Lage der Nation - der Politik-Podcast aus Berlin

224 Listeners

Eine Stunde History - Deutschlandfunk Nova by Deutschlandfunk Nova

Eine Stunde History - Deutschlandfunk Nova

111 Listeners

c’t uplink - der IT-Podcast aus Nerdistan by c’t Magazin

c’t uplink - der IT-Podcast aus Nerdistan

10 Listeners

Logbuch:Netzpolitik by Metaebene Personal Media - Tim Pritlove

Logbuch:Netzpolitik

5 Listeners

Computer und Kommunikation by Deutschlandfunk

Computer und Kommunikation

9 Listeners

ARD Klima Update by ARD

ARD Klima Update

9 Listeners

INNOQ Security Podcast by INNOQ

INNOQ Security Podcast

0 Listeners

Software Architektur im Stream by Eberhard Wolff

Software Architektur im Stream

0 Listeners

Quarks Science Cops by Quarks

Quarks Science Cops

16 Listeners

KI verstehen by Deutschlandfunk

KI verstehen

13 Listeners

11KM: der tagesschau-Podcast by tagesschau

11KM: der tagesschau-Podcast

24 Listeners

KI-Update – ein heise-Podcast by Isabel Grünewald, heise online

KI-Update – ein heise-Podcast

7 Listeners

Schreiben & Schreddern by radioeins (rbb)

Schreiben & Schreddern

4 Listeners

CTO Need To Know by INNOQ

CTO Need To Know

0 Listeners

Fest & Flauschig by Jan Böhmermann & Olli Schulz

Fest & Flauschig

17 Listeners