敢想科技说

重磅!DeepSeek-R1正式开源:编程能力媲美Gemini 2.5 Pro


Listen Later

今日凌晨,国内AI公司深度求索(DeepSeek)正式开源了其最新语言模型DeepSeek-R1,这一消息迅速在开源社区引发轰动。据官方披露,该模型在编程能力上表现尤为突出,性能已可媲美Google的Gemini 2.5 Pro

核心亮点
  • 基于DeepSeek-V3-0324的660B参数模型训练
  • 编程能力达到Claude 4Gemini 2.5 Pro水平
  • 支持长时思考,单任务可运行30-60分钟
  • Live Code Bench基准测试中表现优异
技术突破

DeepSeek-R1采用了创新的深度推理架构,能够像Google模型一样进行复杂推理。其文本生成更加自然,格式处理能力显著提升。

推理风格

又快又缜密,支持多轮复杂推理

编程能力

漫反射、球体运动等复杂编程任务表现出色

性能对比

模型编程能力推理深度响应速度DeepSeek-R1优秀优秀良好Gemini 2.5 Pro优秀优秀优秀Claude 4优秀良好良好

技术标签

编程能力 深度推理 长时思考 Live Code Bench 660B参数

获取方式

开发者现可通过以下渠道获取DeepSeek-R1模型:

  • 官网:chat.deepseek.com
  • Hugging Face:模型页面
  • GitHub:官方仓库(即将开放)
专家点评

"DeepSeek-R1的开源标志着中国AI企业在大型语言模型领域已具备国际竞争力。其编程能力的突破将极大推动AI辅助编程的发展。" —— AI领域资深研究员张教

...more
View all episodesView all episodes
Download on the App Store

敢想科技说By 无何有老田