Nemotron-Cascade 2,一款由英伟达(NVIDIA)开发的 30B 参数混合专家(MoE)开源大模型。该模型通过创新的 级联强化学习(Cascade RL) 和 多领域在线策略蒸馏(MOPD) 技术,在仅有 3B 激活参数的情况下,展现出极高的“智能密度”。它在 2025 年国际数学奥林匹克(IMO) 和 国际信息学奥林匹克(IOI) 中均获得了金牌水平的成绩,其数学推理和编程能力足以媲美规模大得多的顶尖模型。报告详细阐述了从 有监督微调(SFT) 到多阶段强化学习的全流程,并开放了模型权重与训练数据。测试结果证明,该模型在 指令遵循、长文本处理及智能体任务 等多个基准测试中均达到了行业领先水平。