✨簡立峰/Google 台灣前董事總經理
📢收聽這集,你可以得知:
一、認識 DeepSeek
✨如何看 DeepSeek 這個模型?
✨DeepSeek 真的是開源嗎?Open Source、Open Weights,它開放哪些?
✨DeepSeek 有什麼是沒有開放給大家檢視的?為什麼?別的開源也是這樣嗎?
✨DeepSeek 有分成「開源版」跟「線上服務版」,有什麼不同?
✨為什麼即使是開源的版本,都不見得代表 100% 安全?
✨為什麼 DeepSeek 問世,是讓 AI 的發展再平衡,讓 AI 產業邁向多元化?
二、DeepSeek 對台灣的影響
✨怎麼從 DeepSeek 看台灣主權模型和基礎建設?
✨為什麼 DeepSeek 問世會帶來硬體產業的改變?台灣受惠的產業會有哪些?
✨從 AI PC、AI Phone 到 ASIC 的晶片加速器,為什麼任何因為 AI 而在終端裡頭加速的東西,都會受益?
✨從雲端業者到 Edge AI,必須掌握哪些產業機會?
✨為什麼 DeepSeek 問世,NVIDIA 股價跌得比較多,台積電跌得比較少?
✨以前說台灣沒算力、沒數據、不具 AI 軟體產業優勢,現在 DeepSeek 證明了不需要基礎模型,台灣軟體產業有什麼改變的契機?
✨為什麼軟體產業在這波要領先的關鍵,是掌握 Edge AI 的 App?
三、DeepSeek 爭議&言論審查
✨開源社群很多人在努力,想試圖關掉言論審查的部分,做得到嗎?
✨如何從「權重參數」和「內容過濾」兩個部分,來看 DeepSeek 的言論審查?
四、開源的競爭
✨同樣是開源,為什麼是 LLaMA 把步調變慢,而不是 DeepSeek 追上了?
✨LLaMA 的研發步調為什麼不快?是為了要讓開發者熟悉?還是因為訓練成本高昂?
✨DeepSeek 如今問世,對 LLaMA 的影響會是什麼?
✨LLaMA 會被迫要加速嗎?會導致 Training Cost 提升嗎?
五、推理模型
✨推理模型跟大型語言模型有什麼不一樣?
✨哪些問題適合用推理、哪些適合用大型語言模型?
✨為什麼推理模型可以讓模型的穩定度上升?
✨為什麼推理模型使用起來比較慢?
六、AGI (Artificial General Intelligence)
✨AGI 是什麼?分成哪幾個 Level?未來想要發展到什麼階段?
✨聊天機器人用的大型語言模型是哪一級?推理模型是哪一級?正在大力發展的 AI Agent,又屬於哪個層級?
✨DeepMind 的 CEO Demis Hassabis 說 AGI 五年內問世,如何看 AGI 的發展趨勢?
✨為什麼 AI 解決問題的層級會不斷改變,從被動導向主動?
-------------------
🔆科技報橘|https://buzzorange.com/techorange/
🟠Facebook|https://www.facebook.com/TechOrange/
🔆LinkedIn|https://tw.linkedin.com/showcase/techorange
🟠Line|https://page.line.me/vvx9094k?openQrModal=true
🔆YouTube|https://www.youtube.com/channel/UCs-pAaEq43d3ghKpmIx-Fnw
--
Hosting provided by SoundOn