May 10, 2025

【周末特辑】5月第2周最火AI论文 | 零数据自博弈推理；多模态长推理模型综述

11 minutes

本期的 5 篇论文如下：

[00:42] TOP1(🔥93) | 🚀 Absolute Zero: Reinforced Self-play Reasoning with Zero Data（绝对零度：基于零数据的强化自博弈推理）

[02:38] TOP2(🔥91) | 🧠 Perception, Reason, Think, and Plan: A Survey on Large Multimodal Reasoning Models（感知、推理、思考与规划：大型多模态推理模型综述）

[04:44] TOP3(🔥83) | 🧠 Unified Multimodal Chain-of-Thought Reward Model through Reinforcement Fine-Tuning（基于强化微调的统一多模态思维链奖励模型）

[06:35] TOP4(🔥77) | 🤖 Voila: Voice-Language Foundation Models for Real-Time Autonomous Interaction and Voice Role-Play（Voila：用于实时自主交互和语音角色扮演的语音-语言基础模型）

[08:52] TOP5(🔥77) | 🧠 Grokking in the Wild: Data Augmentation for Real-World Multi-Hop Reasoning with Transformers（野外Grokking：使用Transformers进行真实世界多跳推理的数据增强）

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

...more