本期焦点:DeepSeek R1 深度解析,iPhone SE 4 或推迟
新闻速览
• iPhone SE 4 或推迟: 彭博社 Mark Gurman 称发布会可能延期,外形接近 iPhone 14,搭载 A18 芯片,支持 Apple Intelligence。
• Apple ID 规则更新: 允许用户迁移购买项目至其他账户(欧盟、英国、印度除外)。
• 谷歌 I/O 开发者大会定档: 5 月 20-21 日,预计发布 Gemini AI 新功能、Project Astra AI 助手等。
• 微软终止 HoloLens 硬件研发: 硬件交由 Anduril,转向云服务与 AI,为美国陆军 IVAS 项目提供支持。
• 国内创投大佬齐聚华为: 徐新、何小鹏、王兴兴、李大海等与任正非闭门交流,探讨科技、企业、文化与治理。
轻解读:DeepSeek R1 引领推理模型新潮流
• 推理过程: 不直接给答案,而是像人一样多步骤思考,展示“思维链”。
• 实现方式: 深入理解问题意图,动态展示思考过程。
• 应用场景: 适用于解谜、高数题、编程难题等复杂任务,但不适合简单问题。
• 优势与局限: 复杂任务表现优异,但效率低、成本高,可能易出错。
DeepSeek R1 模型家族
• DeepSeek-R1-Zero: 仅使用强化学习训练,未经过监督微调 (SFT)。
• DeepSeek-R1: 在 R1-Zero 基础上增加 SFT 和强化学习,性能更强。
• DeepSeek-R1-Distill: 用 R1 生成的 SFT 数据微调小模型,提升推理能力。
推理时扩展技术
• DeepSeek R1 vs OpenAI: R1 可能采用 OpenAI o1、o3 类似技术,增加计算资源,让模型有更多时间“思考”。
小模型上的实验
• Qwen-32B: 纯强化学习不如蒸馏有效,SFT 对小模型更重要。
• Sky-T1 & TinyZero: 预算有限的情况下,仍可探索推理模型研究。
推理模型的未来应用
• 企业级应用: 现有 Agent 框架可能需要更新,企业客户会更谨慎选择推理模型。
• OpenAI o3 的 PMF: 可能是联网搜索 + 深度思考,但机器思维链能否真正替代人类思维链仍需验证。
• 2024 年 LLM “专业化”趋势: 领域优化加速,推理模型是 AI 发展的重要方向之一。
DeepSeek R1 引发对推理模型价值与潜力的重新思考,AI 领域正迎来新一轮创新变革。欢迎在评论区分享你的看法!感谢收听,下期再见!