January 25, 2025

【周末特辑】1月第3周最火AI论文 | DeepSeek-R1强化学习提升LLM推理能力，进化搜索优化复杂任务解决。

12 minutes

本期的 5 篇论文如下：

[00:37] TOP1(🔥167) | 🧠 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning（DeepSeek-R1：通过强化学习激励大语言模型的推理能力）

[02:59] TOP2(🔥95) | 🧠 Evolving Deeper LLM Thinking（演化更深层次的LLM思维）

[05:07] TOP3(🔥73) | 🤔 Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training（Agent-R：通过迭代自训练使语言模型代理具备反思能力）

[07:15] TOP4(🔥73) | 🎥 MMVU: Measuring Expert-Level Multi-Discipline Video Understanding（MMVU：专家级多学科视频理解的测量）

[09:29] TOP5(🔥64) | 👁 VideoLLaMA 3: Frontier Multimodal Foundation Models for Image and Video Understanding（VideoLLaMA 3：面向图像与视频理解的前沿多模态基础模型）

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

...more

View all episodes

By duan

22 ratings

January 25, 2025

【周末特辑】1月第3周最火AI论文 | DeepSeek-R1强化学习提升LLM推理能力，进化搜索优化复杂任务解决。

12 minutes

本期的 5 篇论文如下：

[00:37] TOP1(🔥167) | 🧠 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning（DeepSeek-R1：通过强化学习激励大语言模型的推理能力）

[02:59] TOP2(🔥95) | 🧠 Evolving Deeper LLM Thinking（演化更深层次的LLM思维）

[05:07] TOP3(🔥73) | 🤔 Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training（Agent-R：通过迭代自训练使语言模型代理具备反思能力）

[07:15] TOP4(🔥73) | 🎥 MMVU: Measuring Expert-Level Multi-Discipline Video Understanding（MMVU：专家级多学科视频理解的测量）

[09:29] TOP5(🔥64) | 👁 VideoLLaMA 3: Frontier Multimodal Foundation Models for Image and Video Understanding（VideoLLaMA 3：面向图像与视频理解的前沿多模态基础模型）

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

...more

More shows like HuggingFace 每日AI论文速递

View all

硅谷101|中国版

56 Listeners

商业就是这样

292 Listeners

声动早咖啡

293 Listeners

思文，败类

157 Listeners

不开玩笑 Jokes Aside

136 Listeners

人民公园说AI

7 Listeners

數創實驗室 - AI時代的學習指南

1 Listeners

AI可可AI生活

0 Listeners

Share 【周末特辑】1月第3周最火AI论文 | DeepSeek-R1强化学习提升LLM推理能力，进化搜索优化复杂任务解决。

Sign up to save your podcasts

【周末特辑】1月第3周最火AI论文 | DeepSeek-R1强化学习提升LLM推理能力，进化搜索优化复杂任务解决。

【周末特辑】1月第3周最火AI论文 | DeepSeek-R1强化学习提升LLM推理能力，进化搜索优化复杂任务解决。

More shows like HuggingFace 每日AI论文速递

硅谷101|中国版

商业就是这样

声动早咖啡

思文，败类

不开玩笑 Jokes Aside

人民公园说AI

數創實驗室 - AI時代的學習指南

AI可可AI生活