半球观察

Vol.12.【漫谈AGI】从DeepSeek聊聊通向AGI的模式之争:量化向左,互联网向右


Listen Later

在上一期Vol.11. 【漫谈AGI】DeepSeek炸场硅谷:属于中国大模型的GPT时刻是如何炼成的? 的节目中,我们与大家详细聊了聊DeepSeek对美国科技界的冲击与两位主播对DeepSeek的粗略看法。

DeepSeek火爆出圈的另一面,也引发了创投圈对于AGI范式的广泛讨论。背靠量化公司的DeepSeek,无疑成为了这条赛道上一条巨大的鲶鱼,不同于传统互联网公司的AGI研发模式,DeepSeek所代表的“量化模式”无疑为未来的AGI研发公司带来了崭新的可能性。

在本期【漫谈AGI】中,让我们来从研发模式和技术角度来详细聊聊,DeepSeek所代表的“量化模式”与OpenAI及一众大厂所代表的“互联网模式”的优劣得失,以及哪个模式可以带领人们通向最终的AGI道路。 本期《半球观察》,与您相约。


【本期您将听到】


PART 0 写在前面:一些硬核技术播客节目的推荐与分享

0:05 本期播客事前说明与硬核技术播客推荐

  • 逐篇讲解DeepSeek的九篇论文
  • 逐篇讲解DeepSeek和Kimi等模型的技术报告硅谷101: DeepSeek技术解析-为何引起英伟达股价下跌?
  • 律人行:DeepSeek的辟谣与法律政治风险科普
  • Lex Fridman: DeepSeek, China, OpenAI, NVIDIA, xAI, TSMC, Stargate, and AI Megaclusters


PART 1 DeepSeek引发的LLM技术路线之争

  • 00:03:29 Dense Model与MoE的架构之争,MoE架构技术简析
  • 00:10:49 MLA(多头潜在注意力机制)技术简析 (DeepSeek V2)
  • 00:16:42 美国的显卡禁运,CUDA的护城河与国产卡之争


PART 2 量化公司和互联网公司的优劣

  • 00:25:35 互联网公司和量化公司的技术栈区别
  • 00:27:54 量化交易公司在做什么?相比于互联网公司,量化公司也许更技术更Geek
  • 00:31:02 互联网模式和量化模式,研发AGI/大模型会有什么不同?
  • 00:49:30 MTP(多Token预测)与FP08技术简析(DeepSeek V3)


PART 3 各国对DeepSeek的政治围堵

  • 00:55:32 各国政府对DeepSeek的态度变化
  • 00:59:40 硬件与人才的围堵违背硅谷精神,并不会真正奏效
  • 01:04:11 主播们对未来政治围堵的看法
  • 也欢迎收听我们Vol.06. 特朗普再当选,会开启制裁新纪元吗?聊一聊历史上的各种制裁 这期节目了解更多关于制裁的内容


出场人物:阿P,P特

剪辑:P特

文本:P特


欢迎添加两位主播的微信号 philgroup、Peter-Banqiu或者小🍠搜索“半球观察”加入听友群与我们互动~

...more
View all episodesView all episodes
Download on the App Store

半球观察By 阿P,P特