INNOQ Podcast

DeepSeek R1


Listen Later

Ein Wal liegt am Strand

DeepSeek R1 sorgte im Januar für Aufsehen: Ein chinesisches KI-Modell, das mit offenen Gewichten und ausgefeiltem Chain-of-Thought Reasoning die etablierten US-amerikanischen Modelle wie o1 herausfordert – und das zu einem Bruchteil der bisher als notwendig erachteten Kosten. Die Ankündigung ließ sogar die Aktienkurse namhafter Chiphersteller einbrechen. Wie gelang DeepSeek dieser Durchbruch? Welche innovativen Engineering-Ansätze ermöglichten den Sprung vom klassischen Foundation Model zum leistungsstarken Reasoning-Modell? Ole und Robert nehmen die Evolution von DeepSeek R1 unter die Lupe und analysieren die mehrschichtigen technischen Innovationen, die hinter diesem Erfolg stehen. Sie diskutieren außerdem die konkreten Auswirkungen dieser Entwicklung auf den deutschen Unternehmenssektor.

Shownotes:
  • Buch: "Thinking, Fast and Slow"
  • Chain of Thought Prompting
  • How cheap, outsourced labour in Africa is shaping AI English (RLHF)
  • AlphaGo: The Movie
  • Group Relative Policy Optimization (GRPO)
  • Running DeepSeek V3 671B on M4 Mac Mini Cluster
  • DeepSeek FAQ von Ben Thompson auf Stratecherry
  • Gewinner und Verlierer nach dem KI-Erdbeben: Analyse von Marcel Weiß für FAZ (Paywall)
  • DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning (das Paper zur Veröffentlichung von R1)
  • DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models
  • ARC Prize: ARC-AGI Benchmark
  • ...more
    View all episodesView all episodes
    Download on the App Store

    INNOQ PodcastBy INNOQ

    • 5
    • 5
    • 5
    • 5
    • 5

    5

    1 ratings


    More shows like INNOQ Podcast

    View all
    Freak Show by Metaebene Personal Media - Tim Pritlove

    Freak Show

    9 Listeners

    Sternengeschichten by Florian Freistetter

    Sternengeschichten

    44 Listeners

    Lage der Nation - der Politik-Podcast aus Berlin by Philip Banse & Ulf Buermeyer

    Lage der Nation - der Politik-Podcast aus Berlin

    225 Listeners

    Eine Stunde History - Deutschlandfunk Nova by Deutschlandfunk Nova

    Eine Stunde History - Deutschlandfunk Nova

    104 Listeners

    c’t uplink - der IT-Podcast aus Nerdistan by c’t Magazin

    c’t uplink - der IT-Podcast aus Nerdistan

    6 Listeners

    Logbuch:Netzpolitik by Metaebene Personal Media - Tim Pritlove

    Logbuch:Netzpolitik

    5 Listeners

    Computer und Kommunikation by Deutschlandfunk

    Computer und Kommunikation

    10 Listeners

    ARD Klima Update by ARD

    ARD Klima Update

    8 Listeners

    INNOQ Security Podcast by INNOQ

    INNOQ Security Podcast

    0 Listeners

    Software Architektur im Stream by Eberhard Wolff

    Software Architektur im Stream

    0 Listeners

    Quarks Science Cops by Quarks

    Quarks Science Cops

    18 Listeners

    KI verstehen by Deutschlandfunk

    KI verstehen

    8 Listeners

    11KM: der tagesschau-Podcast by tagesschau

    11KM: der tagesschau-Podcast

    27 Listeners

    KI-Update – ein heise-Podcast by Isabel Grünewald, heise online

    KI-Update – ein heise-Podcast

    2 Listeners

    Schreiben & Schreddern by radioeins (rbb)

    Schreiben & Schreddern

    9 Listeners

    CTO Need To Know by INNOQ

    CTO Need To Know

    0 Listeners

    Fest & Flauschig by Jan Böhmermann & Olli Schulz

    Fest & Flauschig

    22 Listeners