屠龙大实话

16.DeepSeek report读后感-模型的哲学,产业的影响和国家的竞争


Listen Later

Hi hi 大家好,我上周末把DeepSeek V3的technical report看完了,明白了很多事情,这期给大家讲讲我学到的东西,即便不做模型的同学也能听懂。

我会在播客里给大家普及V3和R1这两个模型的概念、大模型概念,以及广义和狭义人工智能的区别。

还会谈到DeepSeek模型的特点,比如V3大语言模型优势,和它对AI生态的积极影响。

我们还讨论了,在美国限制英伟达出口的情况下,幻方量化是怎么通过GPU囤货,通过技术手段突破算力限制、增强了数学稳定性,让美国专家破防的。

我看完report之后,觉得“世界破破烂烂,小梁缝缝补补”。

我会在播客里告诉大家为什么我会这样想,为什么对梁文锋和他的年轻团队有很高的崇敬之情,为什么他们研发的模型在数学和编程方面如此先进,以至于能带动计算科学发展。

我还从中学到了一些哲学思想,比如运用时间换空间、用数量换质量。这些思想特别有意思。

我在播客还分析了:为什么打造全球共享的 AI 生态系统,对中国乃至全球都有好处,它是如何降低使用门槛、解放生产力的。

希望这期播客能够让大家从不同的视角看待DeepSeek,如果有说错的地方,也欢迎做模型的同学指正。

(播客中提到的视频:

1:科罗拉多大学的Tom Yeh教授,拿DeepSeek为例,用Excel表格讲解其原理:weibo.com

2. 哔哩哔哩:EZ encoder【EZ撸paper: DeepSeek-V3 技术报告详细解读 part1 | 开源最强模型 | 性价比之王】

欢迎大家收听,也请大家订阅“屠龙大实话”。如果大家有更想听屠龙讲的内容,欢迎留言~

时间戳

01:38 介绍DeepSeek的两个模型:V3和R1

01:52 什么是大模型?

02:44 什么是大语言模型?

03:01 什么是推理模型?

05:30 V3大语言模型的优势及对AI生态的影响

12:11 为什么屠龙觉得“世界破破烂烂,小梁缝缝补补”?

17:32 美国是怎么卡芯片出口的?

25:36小梁缝缝补补,缝补的是什么?

26:43 V3模型在计算科学方面的优势

32:29 模型里的两个哲学思想

35:17 开放模型的好处是什么?

53:30 DeepSeek团队难能可贵的地方:没有框架

55:26 AI对普通人有影响,该以什么心态面对?

62:20 下一期深入解读模型中的哲学思想

背景音乐:Hero-Family Of The Year

欢迎大家关注主播账号

微博:@屠龙的胭脂井 @思维螺旋 @百科成长课 @屠龙星球(就是主播鸡仔)

小红书:@屠龙的胭脂井 @屠龙的口袋 @屠龙职场进化论 @屠龙两性脑科学

公众号:屠龙手段 百科成长课

其他【屠龙大实话】发布平台

网易云音乐|喜马拉雅|荔枝FM | 苹果Podcast | 微博音频,全网同名。

...more
View all episodesView all episodes
Download on the App Store

屠龙大实话By echo海燕

  • 5
  • 5
  • 5
  • 5
  • 5

5

7 ratings


More shows like 屠龙大实话

View all
声东击西 by ETW Studio

声东击西

327 Listeners

没理想编辑部 by 看理想新媒体部

没理想编辑部

164 Listeners

来都来了 | 听了再走 by 来都来了_

来都来了 | 听了再走

156 Listeners

出逃在即 by 出逃studio

出逃在即

56 Listeners

知行小酒馆 by 有知有行

知行小酒馆

367 Listeners

声动早咖啡 by 声动活泼

声动早咖啡

291 Listeners

思文,败类 by 思文败类

思文,败类

159 Listeners

搞钱女孩 by 搞钱女孩小辉

搞钱女孩

89 Listeners

独树不成林 by 鬼鬼祟祟的树

独树不成林

333 Listeners

肥话连篇 by 肥杰

肥话连篇

125 Listeners

李诞 by 李诞

李诞

253 Listeners

天真不天真 by 杨天真本真

天真不天真

292 Listeners

脑袋空空 empty mind by 生龙活虎的七七

脑袋空空 empty mind

20 Listeners

蒋方舟·一寸 by 蒋方舟

蒋方舟·一寸

63 Listeners

你,静不下来 by 李静

你,静不下来

19 Listeners