Cruise Control: Mach 10 AI

DeepSeek V3 & R1:AI 界的新突破


Listen Later

 第一集總結:DeepSeek V3 & R1——LLM 進化的未來 

 在這一集中,我們介紹了 DeepSeek V3 和 R1 這兩個突破性的 LLM 模型。 DeepSeek V3 是一個「考試型 AI 天才」,透過 預訓練 (Pretraining) 累積知識、監督微調 (SFT) 精進表達、強化學習 (RL) 提升推理能力。它還擁有 MLA 記憶壓縮技術、MoE 專家架構 和 DualPipe 高效運算,讓 AI 更聰明、更高效。 DeepSeek R1 則顛覆傳統 AI 訓練方式,不需要人工標註數據,透過 GRPO 強化學習 和 「Aha Moment」頓悟機制,讓 AI 能自主學習推理。 聽完本集,你將理解 AI 如何學習、為何突破極限,並掌握 AI 未來發展的關鍵! 

...more
View all episodesView all episodes
Download on the App Store

Cruise Control: Mach 10 AIBy Cruise