网事头条|畅听版

0127晚报|DeepSeek超越ChatGPT登顶苹果美区下载榜;B站回应春晚答题题库泄露


Listen Later

网事头条畅聊社群成员招募中 

快来与更多听众一起畅聊每日新鲜事


没用尖端芯片,中国AI大模型惊艳世界

DeepSeek超越ChatGPT登顶苹果美区下载榜

DeepSeek多岗位招新

阿里云通义开源首个长文本新模型

钉钉推出“小紫包”,加入春节“送礼大战”

樊振东等奥运冠军获得多哈世乒赛资格

OneRepublic将登上春晚

B站回应春晚答题题库泄露

2025春节档预售票房已超去年最终成绩

热点:没用尖端芯片,中国AI大模型惊艳世界

近日,大模型DeepSeek-R1正式发布,并迅速引发海内外开发者和投资者的热议。

就有网友好奇,国内外各类大模型那么多,DeepSeek到底有什么特别之处?

对此,中国工程院院士、清华大学计算机系教授郑纬民及多位AI圈人士指出了DeepSeek成功出圈的关键所在。

目前,业界对于DeepSeek的关注点主要集中在三个方面。

第一,在技术层面,DeepSeek 背后的DeepSeek-V3以及公司新近推出的DeepSeek-R1两款模型,分别实现了比肩OpenAI 4o和o1模型的能力。而在第三方基准测试中,DeepSeek-R1的表现更是优于OpenAI、Meta和Anthropic等知名人工智能公司。

第二,DeepSeek研发的这两款模型成本更低,训练成本仅为557.6万美元,不到同类模型训练成本的10%。而作为一款“100%开源”的模型,R1比国外同类模型便宜了96.4%,同时还提供了类似的性能。

第三,DeepSeek把大模型的技术都开源了,让更多的AI团队,能够基于最先进同时成本最低的模型,开发更多的AI原生应用。

就有不少海内外科技大佬、投资机构称:DeepSeek有可能彻底改变训练和推理领域的游戏规则。

甚至有媒体报道称:DeepSeek开源的先进AI,让试图出售技术赚取巨额利润的美国AI公司“天塌了”。

还有美国学者称:中国的系统工程师人才库比美国大得多,即使没有最好的芯片他们也可以充分利用计算资源以更便宜的成本训练和运行模型。

同时,也有消息称:市场亦将英伟达周五的大跌归因于DeepSeek的火爆。市场认为:DeepSeek R1的成功,可能削弱了市场对英伟达AI芯片需求的预期。因为DeepSeek似乎以极低的成本构建了一个突破性的人工智能模型,并且无需使用尖端芯片。这也让人对投入芯片行业的数千亿美元资本支出的实际效用产生了质疑。

...more
View all episodesView all episodes
Download on the App Store

网事头条|畅听版By 听梦想小分队