May 11, 2025

S2E12 LLM 可解釋性 Part 2：如果我們無法看懂 AI，它會怎麼毀掉我們？

33 minutes

想像一下，2027 年，一座資料中心裡跑著一群諾貝爾等級的天才。他們可以主導經濟、操縱輿論、影響國家安全——但我們完全搞不懂他們怎麼做出決策。

Anthropic CEO Dario Amodei 最近寫了一篇超硬派文章，直接警告：「如果我們還看不懂 AI 它們在想什麼，人類很可能會被自己創造的東西毀掉。」

但問題來了——他為什麼這麼急？這篇文章真的只是為了拯救世界，還是為了讓 Anthropic 在 AI 安全這局搶下先機？

這集我們聊聊：

📌 可解釋性是什麼？為什麼模型愈強大，黑箱問題愈危險？

📌 稀疏自編碼器 + 自我解釋機制 + 電路追蹤：如何看懂 AI 腦袋裡的「思考路線」？

📌 Anthropic 是怎麼從 OpenAI 出走、組成七人創業團隊，打出安全第一的差異化定位？

📌 Dario 主張出口管制、輕度監管，是真的為了全球安全，還是想幫自己圍一條護城河？

📌 如果 2027 年真的出現「國家級天才 AI」，我們真的準備好了嗎？

00:00 開頭

04:11 Anthropic 的創立故事

07:46 Claude 原本可以在 ChatGPT 之前問世

09:20 「一年後 AI 會寫全部程式碼」

11:43 工程師的黃金年代結束了？

15:24 AI 是種出來的，不是蓋出來的

17:53 AI 的最大風險？

21:11 解鎖 AI 腦袋：近幾年技術的重大突破

25:55 2027 會有諾貝爾獎等級 AI？

29:17 可解釋性背後的戰略布局

🎧 如果你也覺得「看懂 AI 的思考」不只是技術問題，而是影響整個社會安全的關鍵，歡迎留言告訴我你的看法。

🔗 《矽谷輕鬆談》一鍵收聽 ➡️ ⁠https://linktr.ee/jktech⁠

...more

View all episodes

By 柯柯與肯吉在矽谷

4.8

160160 ratings

May 11, 2025

S2E12 LLM 可解釋性 Part 2：如果我們無法看懂 AI，它會怎麼毀掉我們？

33 minutes

Anthropic CEO Dario Amodei 最近寫了一篇超硬派文章，直接警告：「如果我們還看不懂 AI 它們在想什麼，人類很可能會被自己創造的東西毀掉。」

但問題來了——他為什麼這麼急？這篇文章真的只是為了拯救世界，還是為了讓 Anthropic 在 AI 安全這局搶下先機？

這集我們聊聊：

📌 可解釋性是什麼？為什麼模型愈強大，黑箱問題愈危險？

📌 稀疏自編碼器 + 自我解釋機制 + 電路追蹤：如何看懂 AI 腦袋裡的「思考路線」？

📌 Anthropic 是怎麼從 OpenAI 出走、組成七人創業團隊，打出安全第一的差異化定位？

📌 Dario 主張出口管制、輕度監管，是真的為了全球安全，還是想幫自己圍一條護城河？

📌 如果 2027 年真的出現「國家級天才 AI」，我們真的準備好了嗎？

00:00 開頭

04:11 Anthropic 的創立故事

07:46 Claude 原本可以在 ChatGPT 之前問世

09:20 「一年後 AI 會寫全部程式碼」

11:43 工程師的黃金年代結束了？

15:24 AI 是種出來的，不是蓋出來的

17:53 AI 的最大風險？

21:11 解鎖 AI 腦袋：近幾年技術的重大突破

25:55 2027 會有諾貝爾獎等級 AI？

29:17 可解釋性背後的戰略布局

🎧 如果你也覺得「看懂 AI 的思考」不只是技術問題，而是影響整個社會安全的關鍵，歡迎留言告訴我你的看法。

🔗 《矽谷輕鬆談》一鍵收聽 ➡️ ⁠https://linktr.ee/jktech⁠

...more

More shows like 矽谷輕鬆談 Just Kidding Tech

View all

科技報橘

5 Listeners

IEO 看什麼？國際財經、產業、科技觀察

35 Listeners

M觀點 | 科技X商業X投資

157 Listeners

游庭皓的財經皓角

55 Listeners

Gooaye 股癌

762 Listeners

財報狗 - 掌握台股美股時事議題

65 Listeners

MacroMicro 財經M平方

62 Listeners

矽谷夫妻Chitchatting

175 Listeners

美股投資學-財女珍妮

74 Listeners

VK科技閱讀時間

14 Listeners

矽谷台勞

119 Listeners

科技浪 Tech.wav

84 Listeners

塞掐 Side Chat

9 Listeners

異溫層 Podcast

9 Listeners

國際大事收藏版

42 Listeners

Share S2E12 LLM 可解釋性 Part 2：如果我們無法看懂 AI，它會怎麼毀掉我們？

Sign up to save your podcasts

S2E12 LLM 可解釋性 Part 2：如果我們無法看懂 AI，它會怎麼毀掉我們？

S2E12 LLM 可解釋性 Part 2：如果我們無法看懂 AI，它會怎麼毀掉我們？

More shows like 矽谷輕鬆談 Just Kidding Tech

科技報橘

IEO 看什麼？國際財經、產業、科技觀察

M觀點 | 科技X商業X投資

游庭皓的財經皓角

Gooaye 股癌

財報狗 - 掌握台股美股時事議題

MacroMicro 財經M平方

矽谷夫妻Chitchatting

美股投資學-財女珍妮

VK科技閱讀時間

矽谷台勞

科技浪 Tech.wav

塞掐 Side Chat

異溫層 Podcast

國際大事收藏版