2026年4月24日,DeepSeek 正式发布并开源了其最新旗舰模型 V4,这是一次全方位的技术突破。
V4 推出了 Pro 和 Flash 两个版本,均采用 MoE(混合专家)架构,在保证强大能力的同时大幅降低算力消耗。最引人注目的是,两个版本都标配了 100 万 token 的超长上下文,相当于一次性处理《三体》三部曲的全部内容,而成本仅为上一代的 10%-27%。
在性能上,V4-Pro 已经站到了世界第一梯队。代码竞赛方面,Codeforces 评分达到 3206,超越 GPT-5.4,达到人类顶尖选手水平;世界知识准确性测试中表现优异,超过了除 Gemini 之外的所有模型;在 Agent 能力、数学推理、长文本处理等方面都有显著提升。真实任务测试显示,V4 在中文写作、专业文档、代码工程等场景表现出色。
技术创新方面,V4 采用了混合注意力机制、全新的 On-Policy Distillation 后训练方法,以及 FP4 量化感知训练。基础设施层面更是从编译器到推理框架全链路重构,运行速度提升 1.5-2 倍。
定价极具竞争力:V4-Flash 输入仅 0.2元/百万 token,V4-Pro 输出 24 元/百万 token,且全部开源,采用 MIT 协议。
正如 DeepSeek 在技术报告中引用《荀子》所言:"不诱于誉,不恐于诽,率道而行,端然正己。"这次发布再次证明了中国 AI 企业的技术实力和长期主义精神。