敢想科技说

阿里Qwen3系列大模型震撼发布,开源界迎来新王者


Listen Later

大家好,我是敢想老田。今天咱们聊点硬核的阿里刚刚发布的Qwen3系列大模型,这可不是一般的更新,简直是给AI界扔了颗核弹!

昨晚凌晨,阿里Qwen团队一口气放出了8款大模型,直接把开源界的门槛拉高了好几个档次。这8款模型里,有2个是MOE模型,6个是Dense模型,性能直接碾压了DeepSeek R1,甚至在某些方面还超过了OpenAI的闭源模型o1。

最让我震惊的是那个旗舰型号Qwen3235BA22B,2350亿参数啊朋友们!这是什么概念?相当于把整个维基百科的内容都装进了一个模型里。在代码数学这些硬核测试中,它的表现直逼Google的Gemini 25Pro,这简直就是国产AI的骄傲!

更绝的是Qwen3的双模式设计。你可以让它快思考,像闪电一样给出答案也可以切换到慢思考,让它像老教授一样深思熟虑。这种设计太聪明了,既省电又高效,阿里这次真是把用户体验研究透了。

说到省电,那个Qwen330BA3B模型简直是个节能冠军。300亿总参数,但每次推理只激活30亿,性能却比前代72B的模型还强。这技术,简直是把既要马儿跑,又要马儿不吃草变成了现实。

作为国内首个混合推理模型,Qwen3支持119种语言,编程能力也大幅提升。现在在Hugging FaceModelScope这些平台都能免费用到,普通用户直接上官网就能体验。

老田我特意去试了试,那个代码生成功能简直绝了。写Python就像说话一样简单,调试代码的速度比我徒弟快十倍。更夸张的是,有网友在苹果M2 Ultra上跑235B模型,每秒能生成28个token,这性能,啧啧啧

阿里这次是真下血本了,预训练用了36万亿token,是前代的两倍。分三个阶段训练,从基础知识到专业能力再到长文本处理,这套方法论值得所有AI公司学习。

现在Qwen系列的开源模型已经超过10万个,直接碾压了Meta的Llama。外媒Venturebeat都说,企业切换到这个模型只要几小时,成本还低得吓人。

老田我觉得啊,Qwen3的发布不只是技术突破,更代表着中国AI开始引领全球开源潮流。想想看,从笔记本测试到多卡集群无缝衔接,这种易用性,这种性能,这种开源精神,这才是真正的中国智造!

最后说句实在话,在AI这个赛道上,我们终于不用再追着别人跑了。Qwen3这一波,直接让我们站到了领跑位置。各位开发者,还等什么?赶紧去试试这个开源神器吧!

...more
View all episodesView all episodes
Download on the App Store

敢想科技说By 无何有老田