智者访谈

10. 清华翟季冬:DeepSeek 百倍算力效能背后的系统革命


Listen Later

2025 年伊始,全球 AI 业界被 DeepSeek 刷屏。当 OpenAI 宣布 5000 亿美元的「星际之门」计划,Meta 在建规模超 130 万 GPU 的数据中心时,这个来自中国的团队打破了大模型军备竞赛的既定逻辑:用 2048 张 H800 GPU,两个月训练出了一个媲美全球顶尖水平的模型。

这一突破不仅撼动了英伟达万亿市值,更引发了整个行业的反思:在通往 AGI 的征程上,我们是否过于盲信算力规模,而忽视了一条更加务实且充满创新可能的路径?

与 2023 年「更大即更好」的粗放发展观不同,2025 年 AI 发展或将更像是一场精打细算的技术炼金:如何用最少的资源最大化模型效能,如何在特定场景实现极致效率。DeepSeek 已经展现出这种方式的威力——开发者总是倾向于选择性价比更高的开源方案,当千千万万的应用都以 DeepSeek 为基座,由此构建的生态将如何重塑 AI 产业格局?

本期《智者访谈》邀请到清华大学计算机系长聘教授、高性能计算研究所所长翟季冬,深入探讨大模型时代的 AI 算力优化之道。翟季冬教授指出,DeepSeek 实现百倍性价比提升的一个重要原因,是其在系统软件层面的深度创新。

「性能优化是一个无止境的过程,」翟季冬教授表示,在中国面临算力资源挑战的背景下,通过系统软件创新提升算力效能,是产业突围的关键。这不仅需要在编程语言、编译器、通信库、编程框架等多个技术层面发力,更需要建立起完整的基础软件体系。

当下,一个值得深思的现象是:尽管 AI 算力需求持续攀升,但国内众多智算中心的国产算力资源却存在闲置。供需错配的背后,暴露出基础软件体系的短板。

但困境也蕴含着重要机遇:如何打通从应用到系统软件,再到自主芯片的完整链路,探索出一条符合中国现实的发展路径?这不仅是技术创新,更是战略抉择。

在算力主导 AI 竞争力的时代,如何让每一份计算资源都能释放最大价值,这个问题本身,与答案同样重要。

【时间线】

03:35  DeepSeek 与算力需求未来趋势

06:41  算力效能评估新视角

10:26  中美硬件差异下的软件思考

14:00  为何还没 Transformer 专用芯片

17:41  万卡集群训练难点

21:01  降本增效:推理优化的关键

24:41  Infra 如何为下一代大模型做好准备

27:19  大规模异构集群的算力管理

29:42  智算供需错配:系统软件如何补位

【栏目简介】

这是国内人工智能垂直媒体机器之心旗下的「智者访谈」播客栏目。栏目聚焦于人工智能领域的顶尖专家和学者,旨在洞悉人工智能的核心技术与行业趋势,深化行业认知,激发创新思考。

【主播】

闻菲,机器之心合伙人总监

【嘉宾】

翟季冬

• 清华大学计算机系长聘教授,博导,高性能计算研究所所长

• 青海大学计算机技术与应用学院院长

• CCF高性能计算专委副主任

• 清程极智首席科学家

【联系方式】

公众号:机器之心

收听渠道:Apple Podcast | 小宇宙 | 喜马拉雅

其他平台:bilibili(机器之心官方) | 视频号(机器之心)| 小红书(机器之心)

联系我们:[email protected] | [email protected]

...more
View all episodesView all episodes
Download on the App Store

智者访谈By 机器之心