INNOQ Podcast

DeepSeek R1


Listen Later

Ein Wal liegt am Strand

DeepSeek R1 sorgte im Januar für Aufsehen: Ein chinesisches KI-Modell, das mit offenen Gewichten und ausgefeiltem Chain-of-Thought Reasoning die etablierten US-amerikanischen Modelle wie o1 herausfordert – und das zu einem Bruchteil der bisher als notwendig erachteten Kosten. Die Ankündigung ließ sogar die Aktienkurse namhafter Chiphersteller einbrechen. Wie gelang DeepSeek dieser Durchbruch? Welche innovativen Engineering-Ansätze ermöglichten den Sprung vom klassischen Foundation Model zum leistungsstarken Reasoning-Modell? Ole und Robert nehmen die Evolution von DeepSeek R1 unter die Lupe und analysieren die mehrschichtigen technischen Innovationen, die hinter diesem Erfolg stehen. Sie diskutieren außerdem die konkreten Auswirkungen dieser Entwicklung auf den deutschen Unternehmenssektor.

Shownotes:
  • Buch: "Thinking, Fast and Slow"
  • Chain of Thought Prompting
  • How cheap, outsourced labour in Africa is shaping AI English (RLHF)
  • AlphaGo: The Movie
  • Group Relative Policy Optimization (GRPO)
  • Running DeepSeek V3 671B on M4 Mac Mini Cluster
  • DeepSeek FAQ von Ben Thompson auf Stratecherry
  • Gewinner und Verlierer nach dem KI-Erdbeben: Analyse von Marcel Weiß für FAZ (Paywall)
  • DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning (das Paper zur Veröffentlichung von R1)
  • DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models
  • ARC Prize: ARC-AGI Benchmark
  • ...more
    View all episodesView all episodes
    Download on the App Store

    INNOQ PodcastBy INNOQ

    • 5
    • 5
    • 5
    • 5
    • 5

    5

    1 ratings


    More shows like INNOQ Podcast

    View all
    Chaosradio by Chaos Computer Club Berlin

    Chaosradio

    6 Listeners

    Freak Show by Metaebene Personal Media - Tim Pritlove

    Freak Show

    10 Listeners

    Podcast SoftwareArchitekTOUR (iX/heise Developer) by iX/heise Developer

    Podcast SoftwareArchitekTOUR (iX/heise Developer)

    1 Listeners

    Logbuch:Netzpolitik by Metaebene Personal Media - Tim Pritlove

    Logbuch:Netzpolitik

    9 Listeners

    c’t uplink - der IT-Podcast aus Nerdistan by c’t Magazin

    c’t uplink - der IT-Podcast aus Nerdistan

    8 Listeners

    heiseshow by heise online

    heiseshow

    4 Listeners

    Lage der Nation - der Politik-Podcast aus Berlin by Philip Banse & Ulf Buermeyer

    Lage der Nation - der Politik-Podcast aus Berlin

    267 Listeners

    Mac & i - der Apple-Podcast by Mac & i

    Mac & i - der Apple-Podcast

    0 Listeners

    INNOQ Security Podcast by INNOQ

    INNOQ Security Podcast

    0 Listeners

    Geld ganz einfach - von Saidi by Finanztip

    Geld ganz einfach - von Saidi

    10 Listeners

    Software Architektur im Stream by Eberhard Wolff

    Software Architektur im Stream

    0 Listeners

    Bit-Rauschen: Der Prozessor-Podcast von c’t by c't Magazin

    Bit-Rauschen: Der Prozessor-Podcast von c’t

    1 Listeners

    KI-Update – ein heise-Podcast by Isabel Grünewald, heise online

    KI-Update – ein heise-Podcast

    3 Listeners

    KI verstehen by Deutschlandfunk

    KI verstehen

    8 Listeners

    What the Wirtschaft?! - Deutschlandfunk Nova by Deutschlandfunk Nova

    What the Wirtschaft?! - Deutschlandfunk Nova

    2 Listeners

    CTO Need To Know by INNOQ

    CTO Need To Know

    0 Listeners

    Passwort - der Podcast von heise security by Dr. Christopher Kunz, Sylvester Tremmel

    Passwort - der Podcast von heise security

    3 Listeners