每日AI

By 每日新闻

畅读AI学术论文，聚焦前沿趋势，普及人工智能... more

· Technology

Download on the App Store

Download on the App Store

Get it on Google Play

FAQs about 每日AI:

How many episodes does 每日AI have?

The podcast currently has 265 episodes available.

每日AI episodes:

May 29, 2026 Carnegie Mellon：大语言模型休眠离线循环优化内存
这篇文章介绍了一种名为“LLM Sleep”的新型模型机制，旨在解决大型语言模型在处理长上下文时面临的推理深度与计算效率之间的矛盾。受生物睡眠启发，该研究提出在清空注意力缓存之前，让模型进行多次离线循环传递，将即时信息整合进状态空间模型（SSM）的权重中。这种方式能让模型在不增加预测阶段延迟的前提下，更有效地处理需要深度逻辑转化的任务。实验表明，增加“睡眠时间”即循环次数，能显著提升模型在细胞自动机、图检索以及复杂数学推理任务中的表现。这一方法证明了通过离线计算强化长程记忆质量，是实现高效长序列建模的有效途径。
...more
23min
May 29, 2026 Allen Institute：大模型MoE架构的最优配方
这篇文章系统地研究了混合专家模型（MoE）的设计优化，通过对超过2,000次预训练运行的详尽实验，分析了专家数量、粒度和路由机制对性能的影响。研究发现，在固定计算预算下，模型性能会随着总专家参数量的增加而持续提升，且最优的专家粒度主要取决于激活参数的规模。实验结果表明，复杂的专家异构性和共享专家（Generalists）设计并不能显著改善效果，甚至可能导致性能下降。相比之下，采用无丢弃路由（Dropless Routing）则能带来稳定的收益。作者最后提出了一套简化的MoE配置方案，建议开发者将优化重心放在专家总数和粒度上，而无需过度纠结于复杂的负载均衡调节。
...more
15min
May 29, 2026 Meituan：LongCat-Video-Avatar 1.5 技术报告开源音视频生成框架
LongCat-Video-Avatar 1.5 是由美团龙猫团队开发的开源音视频生成框架，旨在将学术原型提升至商业级应用水平。该系统通过升级 Whisper-large 音频编码器和实施严苛的数据清洗流水线，显著增强了唇形同步、身份一致性以及长视频的稳定性。技术上，它结合了 GRPO 强化学习以优化视觉质量，并利用 DMD2 蒸馏技术将推理速度加速至 8 步，实现了效率与画质的平衡。研究报告显示，该模型在多角色互动、动画及动物等复杂场景中表现出极强的泛化能力。在针对 500 多个案例的人类评估中，其在真实感、肢体合理性和时序稳定性方面均达到或超越了 HeyGen 和 Kling 等主流闭源系统。通过开放源代码，该项目为工业化部署高质量、低延迟的数字人技术提供了重要方案。
...more
25min
May 28, 2026 Meta：SAM 3 目标物体精准检测、分割与跟踪大模型
SAM 3 是由 Meta 公司开发的全新通用分割模型，旨在通过文本短语或图像示例实现对目标物体的精准检测、分割与跟踪。该模型引入了“可提示概念分割”（PCS）任务，使其不仅能识别单个物体，还能捕捉图像或视频中符合某一概念的所有实例。为了支撑这一技术，研究团队构建了一个包含 400万个唯一概念标签 的大规模高质量数据集，并开发了结合人工与人工智能的高效数据引擎。SAM 3 采用解耦的检测器与跟踪器架构，配合创新的“存在头”设计，显著提升了在开放词汇环境下的识别准确度。此外，该系统支持交互式微调，用户可以通过增加正负示例点来修正分割结果，使其在性能上超越了前代版本。这一成果通过开源模型代码、基准测试集及在线演示，为多模态视觉人工智能领域提供了强大的基础工具。
...more
19min
May 28, 2026 Mila：生成式递归推理模型多轨迹概率计算框架用随机扰动破解AI逻辑迷宫
生成式递归推理模型（GRAM），旨在解决传统递归模型在处理复杂推理任务时因确定性路径导致的方案单一与易陷入局部最优的问题。GRAM 通过引入随机潜变量轨迹，将推理过程建模为概率生成过程，从而能够同时探索多种不同的解决策略。该框架支持多路径并行采样，实现了推理规模在深度与广度上的双向扩展，有效提升了复杂约束下的推理质量。实验结果显示，GRAM 在数独、ARC-AGI 等逻辑谜题以及多解约束任务中显著优于传统模型，并展现出卓越的无条件生成能力。这种将随机性与循环细化相结合的设计，为未来构建具备不确定性管理与自主探索能力的神经网络推理系统提供了新方向。
...more
23min
May 28, 2026 Code as Agent Harness：代码是AI智能体的脚手架
代码即智能体装束（Code as Agent Harness）这一概念，将代码从单纯的生成目标重塑为AI系统的运行基座**。该架构由三个层级组成：首先是装束接口，代码在此充当推理引擎、行动媒介和环境建模工具；其次是装束机制，通过规划、存储和工具调用确保长程任务的可靠性；最后是装束扩展，支持多智能体在共享代码库中的协同。通过将代码视为可执行、可检验且具备状态的中介，智能体能够实现闭环的自我演进与验证。该研究还涵盖了代码助手、科学发现和具身智能等应用领域，并指出了评估与安全等未来挑战。
...more
24min
May 27, 2026 OpenAI：积极对齐促进人类繁荣的AI新范式
这份研究报告提出了一种名为“正面对齐”（Positive Alignment）的全新AI开发范式，旨在超越现有的、仅侧重于防范伤害与安全合规的“负面对齐”模式。作者主张将人类繁荣（Human Flourishing）作为技术优化的核心目标，使AI系统能够主动支持人类的身心健康、自主性与道德成长，而不仅仅是遵循避害规则。通过动力系统的视角，报告阐述了如何引导模型向有益的“正面吸引子”演化，从而解决谄媚倾向和认知脆弱等现有对齐难题。文中详细规划了涵盖数据筛选、预训练及多智能体协作的全生命周期技术路径，并强调需结合心理学与神经科学来量化繁荣指标。此外，该框架提倡多中心治理，通过社区定制与去中心化的架构来维护多元价值，防止单一机构定义幸福。总之，这一议程呼吁将AI从简单的任务工具转化为能够与人类共同进化的智慧伙伴。
...more
19min
May 27, 2026 SDFT：自蒸馏治好AI偏科自我蒸馏消除语言模型微调分布偏差
这篇文章介绍了一种名为自我蒸馏微调 (SDFT) 的新方法，旨在解决大型语言模型在特定任务微调过程中出现的灾难性遗忘问题。研究人员发现，传统微调会导致模型在获取新技能的同时，丧失原有的通用指令遵循能力和安全对齐性。SDFT 通过引导模型重写任务数据集，生成与其原始分布更匹配的蒸馏数据，从而缩小分布差距。实验证明，该技术在数学推理和代码生成等任务中表现优异，能有效保留模型的原始知识与安全性。这种方法具有较强的普适性，适用于不同的模型架构和微调技术。总之，SDFT 为在提升模型专业性能的同时维持其通用综合能力提供了一个简单而有效的方案。
...more
23min
May 27, 2026 MIT：SDFT 自蒸馏微调基于在线学习的持续学习方法
这项研究介绍了一种名为自我蒸馏微调 (SDFT) 的新方法，旨在解决大型语言模型在学习新技能时容易产生灾难性遗忘的核心难题。与传统的监督微调 (SFT) 不同，SDFT 是一种在线学习机制，它利用模型自身的上下文学习能力，让模型在参考专家演示的同时充当自己的老师。通过最小化学生分布与教师分布之间的散度，该方法能有效将新知识整合进模型参数，同时保持原有的通用能力。实验结果表明，SDFT 在技能获取、知识更新以及多任务连续学习场景下均显著优于现有技术。此外，该方法在处理推理任务和大规模模型时表现出更强的优越性，为构建能够持续进化的基础模型提供了切实可行的路径。
...more
26min
May 26, 2026 Tencent：混元Hy-MT2多语言翻译模型技术报告 440MB离线翻译超越大模型
这份材料介绍了由腾讯混yuan团队开发的 Hy-MT2 多语言翻译模型家族。该系列涵盖了从 1.8B 到 30B-A3B 等不同规模，旨在解决现实应用中专业领域翻译、指令遵循以及端侧部署效率等核心痛点。通过采用混合专家架构（MoE）和超低比特量化技术，模型在保持极高性能的同时显著提升了推理速度并降低了存储占用。研究展示了模型在金融、医疗等专业领域以及处理复杂翻译约束（如风格控制和格式保留）方面的卓越能力。实验数据证明，Hy-MT2 在多项基准测试中超越了 GPT-5.5 等领先模型，为全球用户提供了快速、精准且灵活的翻译解决方案。
...more
24min

FAQs about 每日AI:

How many episodes does 每日AI have?

The podcast currently has 265 episodes available.