矽谷輕鬆談 Just Kidding Tech

S2E22 AI 想越久越笨?最強推理模型 Gemini Deep Think 怎麼破解?


Listen Later

AI 想越久越笨?Anthropic 最新研究震撼業界,模型越推理越跑偏,還自信滿滿腦補出一整段錯誤邏輯。

這不是 Bug,是一種全新的現象,名字叫做 Inverse Scaling in Test-Time Compute。

研究人員發現,在某些邏輯問題中,推理時間拉長反而讓模型表現變差,答案不只錯,還會越講越離譜。


這集我們就來聊聊:

📌 Anthropic 發現了什麼?哪些問題最容易讓模型越想越笨?

📌 為什麼推理時間拉長反而讓模型表現變差?

📌 我們該怎麼修?Tree-of-Thoughts、反思模組、平行推理各有什麼用?

📌 平行推理是不是解方?還是只是把廢話講成團?

📌 Gemini Deep Think 怎麼解題?為什麼它不會中招?


🎧 如果你對推理模型、模型幻覺、AI 訓練技巧、高階模型架構有興趣,這集你會聽得很過癮。

🔗 《矽谷輕鬆談》傳送門 ➡️ https://linktr.ee/jktech


(00:00) 開場

(01:12) 強推白天運動,真的有差!

(04:19) 五件事,讓你人生持續快樂

(07:12) Anthropic 最新研究:推理時間越長,模型反而越差?(08:49) 蘋果橘子陷阱題:你答得比 AI 還聰明嗎?

(10:29) 模型也會有「存在危機」?

(11:48) 為什麼 AI 越想越笨?

(14:09) 怎麼救?從 Prompt 到模型架構一次整理

(16:24) 平行推理是萬靈丹還是團體腦補?

(18:22) 可解釋性可以幫上什麼忙?

(19:43) 模型要重新分級了:高階推理模型登場

(20:24) Gemini Deep Think 最強模型拿下 IMO 金牌

(21:46) 從 2024 銀牌到 2025 金牌:Google 怎麼辦到的?

(24:18) 模型進步飛快,為什麼你用的還是一樣笨?


...more
View all episodesView all episodes
Download on the App Store

矽谷輕鬆談 Just Kidding TechBy 柯柯與肯吉在矽谷

  • 4.8
  • 4.8
  • 4.8
  • 4.8
  • 4.8

4.8

156 ratings


More shows like 矽谷輕鬆談 Just Kidding Tech

View all
IEO 看什麼?國際財經、產業、科技觀察 by IEO 國際經濟觀察版主

IEO 看什麼?國際財經、產業、科技觀察

36 Listeners

M觀點 | 科技X商業X投資 by Miula - 科技巨頭解碼主筆

M觀點 | 科技X商業X投資

151 Listeners

游庭皓的財經皓角 by 游庭皓的財經皓角

游庭皓的財經皓角

51 Listeners

Gooaye 股癌 by 謝孟恭

Gooaye 股癌

736 Listeners

財報狗 - 掌握台股美股時事議題 by 財報狗 - 台灣最大基本面投資平台

財報狗 - 掌握台股美股時事議題

68 Listeners

曼報 Manny's Newsletter by Manny Li

曼報 Manny's Newsletter

39 Listeners

MacroMicro 財經M平方 by MacroMicro

MacroMicro 財經M平方

65 Listeners

矽谷夫妻Chitchatting by 矽谷夫妻 Annie & Jack

矽谷夫妻Chitchatting

175 Listeners

美股投資學-財女珍妮 by 財女Jenny

美股投資學-財女珍妮

70 Listeners

塞掐 Side Chat by INSIDE

塞掐 Side Chat

8 Listeners

科技工作講 Tech Job N Talk by Tech Job N Talk 科技工作講

科技工作講 Tech Job N Talk

23 Listeners

矽谷台勞 by Silicon Tailao

矽谷台勞

105 Listeners

VK科技閱讀時間 by VK

VK科技閱讀時間

10 Listeners

科技浪 Tech.wav by 哈利

科技浪 Tech.wav

75 Listeners

異溫層 Podcast by 雕大 & 房房

異溫層 Podcast

10 Listeners