April 29, 2025

阿里Qwen3系列大模型震撼发布，开源界迎来新王者

2 minutes

大家好，我是敢想老田。今天咱们聊点硬核的阿里刚刚发布的Qwen3系列大模型，这可不是一般的更新，简直是给AI界扔了颗核弹！

昨晚凌晨，阿里Qwen团队一口气放出了8款大模型，直接把开源界的门槛拉高了好几个档次。这8款模型里，有2个是MOE模型，6个是Dense模型，性能直接碾压了DeepSeek R1，甚至在某些方面还超过了OpenAI的闭源模型o1。

最让我震惊的是那个旗舰型号Qwen3235BA22B，2350亿参数啊朋友们！这是什么概念？相当于把整个维基百科的内容都装进了一个模型里。在代码数学这些硬核测试中，它的表现直逼Google的Gemini 25Pro，这简直就是国产AI的骄傲！

更绝的是Qwen3的双模式设计。你可以让它快思考，像闪电一样给出答案也可以切换到慢思考，让它像老教授一样深思熟虑。这种设计太聪明了，既省电又高效，阿里这次真是把用户体验研究透了。

说到省电，那个Qwen330BA3B模型简直是个节能冠军。300亿总参数，但每次推理只激活30亿，性能却比前代72B的模型还强。这技术，简直是把既要马儿跑，又要马儿不吃草变成了现实。

作为国内首个混合推理模型，Qwen3支持119种语言，编程能力也大幅提升。现在在Hugging FaceModelScope这些平台都能免费用到，普通用户直接上官网就能体验。

老田我特意去试了试，那个代码生成功能简直绝了。写Python就像说话一样简单，调试代码的速度比我徒弟快十倍。更夸张的是，有网友在苹果M2 Ultra上跑235B模型，每秒能生成28个token，这性能，啧啧啧

阿里这次是真下血本了，预训练用了36万亿token，是前代的两倍。分三个阶段训练，从基础知识到专业能力再到长文本处理，这套方法论值得所有AI公司学习。

现在Qwen系列的开源模型已经超过10万个，直接碾压了Meta的Llama。外媒Venturebeat都说，企业切换到这个模型只要几小时，成本还低得吓人。

老田我觉得啊，Qwen3的发布不只是技术突破，更代表着中国AI开始引领全球开源潮流。想想看，从笔记本测试到多卡集群无缝衔接，这种易用性，这种性能，这种开源精神，这才是真正的中国智造！

最后说句实在话，在AI这个赛道上，我们终于不用再追着别人跑了。Qwen3这一波，直接让我们站到了领跑位置。各位开发者，还等什么？赶紧去试试这个开源神器吧！

...more

By 无何有老田

April 29, 2025

2 minutes

大家好，我是敢想老田。今天咱们聊点硬核的阿里刚刚发布的Qwen3系列大模型，这可不是一般的更新，简直是给AI界扔了颗核弹！

现在Qwen系列的开源模型已经超过10万个，直接碾压了Meta的Llama。外媒Venturebeat都说，企业切换到这个模型只要几小时，成本还低得吓人。

...more

Share 阿里Qwen3系列大模型震撼发布，开源界迎来新王者