矽谷輕鬆談 Just Kidding Tech

S2E20 最聰明 AI 誕生:Grok 4 靠巨量 RL 打爆人類最終測驗


Listen Later

全球最聰明的 AI 誕生了,而且它不是 GPT。

xAI 推出的 Grok 4,在最新的 AI 大魔王考試裡,不只全場最高分,甚至學會了怎麼自己叫工具、自己算數學、還自己訂貨賣東西,靠經營虛擬販賣機賺了 4694 美金,撐了 324 天不崩潰。

它的祕密武器叫做——巨量強化學習。


這集我們就來聊聊:

📌 Grok 4 的架構到底哪裡跟別人不一樣?

📌 強化學習不是拿來下圍棋的嗎?怎麼變成新的 pretraining?

📌 人類最終測驗是什麼?為什麼它比你所有面試都難一百倍?

📌 Vending-Bench 是什麼鬼?為什麼可以逼瘋大模型?

📌 Grok Heavy 值不值得每月 300 美金?

📌 如果每個 AI 都能考滿分,下一步是什麼?


🎧 喜歡最前線的 AI 訓練技術、尖端模型設計與超酷 benchmark,這集你一定會聽得超過癮。

🔗 《矽谷輕鬆談》傳送門 ➡️ https://linktr.ee/jktech


(00:00) 開頭

(00:58) 說走就走的旅行來去 Minneapolis

(04:35) 愛情來得太快就像龍捲風

(08:21) Grok 4 登場拿下最聰明 AI 寶座

(10:30) 人類最終測驗到底有多難?

(12:47) 為什麼 Benchmark 越來越不重要?

(14:12) Grok 4 vs Heavy 版到底差在哪?

(15:51) 巨量強化學習:訓練方式的大突破

(19:04) RL 是新的預訓練?效果到底有多猛?

(20:48) Grok 的語音模型:生動、即時、很會演

(22:02) ARC-AGI 測驗:人類秒解,AI 煩死

(23:45) Grok 經營虛擬販賣機 324 天賺爆

(26:03) Grok 的強項與罩門:推理很強,但日常還是 GPT?

(27:34) 我對 AI 的未來想像:內容自動化個人化 + 科學突破


...more
View all episodesView all episodes
Download on the App Store

矽谷輕鬆談 Just Kidding TechBy 柯柯與肯吉在矽谷

  • 4.8
  • 4.8
  • 4.8
  • 4.8
  • 4.8

4.8

156 ratings


More shows like 矽谷輕鬆談 Just Kidding Tech

View all
IEO 看什麼?國際財經、產業、科技觀察 by IEO 國際經濟觀察版主

IEO 看什麼?國際財經、產業、科技觀察

37 Listeners

M觀點 | 科技X商業X投資 by Miula - 科技巨頭解碼主筆

M觀點 | 科技X商業X投資

155 Listeners

游庭皓的財經皓角 by 游庭皓的財經皓角

游庭皓的財經皓角

47 Listeners

Gooaye 股癌 by 謝孟恭

Gooaye 股癌

733 Listeners

財報狗 - 掌握台股美股時事議題 by 財報狗 - 台灣最大基本面投資平台

財報狗 - 掌握台股美股時事議題

64 Listeners

曼報 Manny's Newsletter by Manny Li

曼報 Manny's Newsletter

36 Listeners

MacroMicro 財經M平方 by MacroMicro

MacroMicro 財經M平方

62 Listeners

矽谷夫妻Chitchatting by 矽谷夫妻 Annie & Jack

矽谷夫妻Chitchatting

174 Listeners

美股投資學-財女珍妮 by 財女Jenny

美股投資學-財女珍妮

67 Listeners

塞掐 Side Chat by INSIDE

塞掐 Side Chat

7 Listeners

科技工作講 Tech Job N Talk by Tech Job N Talk 科技工作講

科技工作講 Tech Job N Talk

23 Listeners

矽谷台勞 by Silicon Tailao

矽谷台勞

104 Listeners

VK科技閱讀時間 by VK

VK科技閱讀時間

10 Listeners

科技浪 Tech.wav by 哈利

科技浪 Tech.wav

76 Listeners

異溫層 Podcast by 雕大 & 房房

異溫層 Podcast

11 Listeners