Tongyi DeepResearch,这是一款致力于实现自主研究能力的开源人工智能智能体。该模型采用创新的端到端训练范式,通过阶段性环境模拟和大规模高质量合成数据,显著提升了其在复杂任务中的规划、搜索及知识整合能力。依托于 Qwen3-30B-A3B 基座,它在仅激活 33亿参数 的情况下,于 Humanity's Last Exam 和 GAIA 等多项深度研究基准测试中超越了 OpenAI-o3 等顶尖商业模型。报告详细阐述了其上下文管理机制与强化学习框架,有效克服了长程任务中的信息过载与环境不稳定性问题。此外,Heavy Mode 模式通过多智能体并行探索与结果综合,进一步挖掘了测试时计算的性能潜力。通义实验室通过开源相关代码与工具,旨在推动通用人工智能体在科研与专业领域的生态发展。