4 月 23 日,腾讯混元 Hy3 preview 语言模型发布并开源。
值得注意的是,这也是姚顺雨加盟腾讯后,带队重建混元的第一个重要成果,也是混元迄今最智能的模型。
作为一个快慢思考融合的混合专家模型,Hy3 preview总参数 295B,激活参数 21B,最大支持 256K 上下文长度。在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅的提升。
开源和发布
混元大模型重建的第一步
2026年2月,腾讯混元重建了预训练和强化学习的基础设施,并提出模型追求实用性的三项原则:一是能力体系化,不推崇“偏科”,强调多种能力的深度协同;二是评测真实性,主动跳出易被“刷榜”的公开榜单,通过自建题目、最新考试、人工评测、产品众测等多种方式评估和改进模型的真实战斗力;三是性价比追求,深度协同模型架构和推理框架的设计,大幅降低任务成本。
腾讯首席AI科学家姚顺雨表示,Hy3 preview是混元大模型重建的第一步。“我们希望通过这次开源和发布,获得来自开源社区和用户的真实反馈,帮助提升 Hy3 正式版的实用性。与此同时,我们也在继续扩大预训练和强化学习的规模,提升模型的智能上限,并通过与腾讯众多产品的深度Co-Design,持续提升模型在真实场景中的综合表现,并开始探索特色模型能力。”姚顺雨说。
在实用性方面,Hy3 preview在多个真实生产与生活场景中表现突出。在复杂推理能力上,该模型在FrontierScience-Olympiad、IMOAnswerBench等高难度理工科推理任务中表现优异,并在清华大学求真书院数学博士资格考试和全国中学生生物学联赛中取得国内最高分,展现了可泛化的强推理能力。
在代码和智能体方面,Hy3 preview提升最为显著。该模型在SWE-Bench Verified、Terminal-Bench 2.0等主流代码智能体基准以及BrowseComp、WideSearch等主流搜索智能体基准中取得有竞争力的结果,在ClawEval和WildClawBench等评测中表现突出。
个人版定价最低28元/月
适用 Agent开发和“养虾”
目前,Hy3 preview 已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享等首发上线,微信公众号、和平精英、微信读书等多个主线产品也在陆续上线。另外,Hy3 preview 支持接入流行的开源智能体产品,如OpenClaw、OpenCode、KiloCode等,并已上架腾讯云大模型服务平台 TokenHub。
得益于模型和推理框架的深度协同及全方面优化,Hy3 preview整体推理效率提升40%,成本较上一代模型大幅下降。
在腾讯云大模型服务平台 TokenHub 上,Hy3 preview 输入价格最低1.2元/百万tokens,输入命中缓存价格0.4元/百万tokens,输出价格最低4元/百万tokens。同时,腾讯云联合混元推出定制的 Hy3 preview Token Plan 套餐,个人版定价最低28元/月,为Agent开发和打造“龙虾”应用提供更具性价比选择。
从元宝到和平精英NPC
已在腾讯主要AI业务获收益
在正式上线前,Hy3 preview已在腾讯主要AI业务进行产品测试,获得明显正向收益。在元宝端,模型在意图理解精准度、文本创作质量、深度搜索等指标上表现提升;在ima知识库问答场景下,处理长文能力出色;在CodeBuddy、WorkBuddy产品上,首token延迟降低54%,端到端时长降低47%,成功率提升至99.99%以上,已稳定驱动最长495步的复杂智能体工作流。
此外,在和平精英 AI NPC 场景评测中,和平精英团队在 Hy3 preview上线后,第一时间针对 AI NPC场景完成接入并开展评测,整体表现令人印象深刻。
在游戏局外的人设扮演场景中,Hy3 Preview 不仅能够精准理解角色设定,还能针对开放性问题输出高度关联、富有增量价值的内容,带来了更加真实、自然、沉浸的对话体验。而在游戏局内的复杂对战场景中,模型回复节奏贴近真实玩家聊天体验,展现出优秀的稳定性与出色的拟人化扮演能力,整体效果表现亮眼。
文|记者 王丹阳
图|腾讯混元提供