February 23, 2025

DeepSeek V3 & R1：AI 界的新突破

13 minutes

第一集總結：DeepSeek V3 & R1——LLM 進化的未來

在這一集中，我們介紹了 DeepSeek V3 和 R1 這兩個突破性的 LLM 模型。 DeepSeek V3 是一個「考試型 AI 天才」，透過預訓練 (Pretraining) 累積知識、監督微調 (SFT) 精進表達、強化學習 (RL) 提升推理能力。它還擁有 MLA 記憶壓縮技術、MoE 專家架構和 DualPipe 高效運算，讓 AI 更聰明、更高效。 DeepSeek R1 則顛覆傳統 AI 訓練方式，不需要人工標註數據，透過 GRPO 強化學習和「Aha Moment」頓悟機制，讓 AI 能自主學習推理。聽完本集，你將理解 AI 如何學習、為何突破極限，並掌握 AI 未來發展的關鍵！

...more

View all episodes

By Cruise

February 23, 2025

DeepSeek V3 & R1：AI 界的新突破

13 minutes

第一集總結：DeepSeek V3 & R1——LLM 進化的未來

...more

Share DeepSeek V3 & R1：AI 界的新突破

Sign up to save your podcasts

DeepSeek V3 & R1：AI 界的新突破

DeepSeek V3 & R1：AI 界的新突破