April 26, 2025

【周末特辑】4月第4周最火AI论文 | 阿拉伯语模型扩展成功；强化学习提升有限。

11 minutes

本期的 5 篇论文如下：

[00:33] TOP1(🔥108) | 💡 Kuwain 1.5B: An Arabic SLM via Language Injection（Kuwain 1.5B：一种基于语言注入的阿拉伯语SLM）

[02:43] TOP2(🔥98) | 🤔 Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?（强化学习真的能激励大语言模型产生超越基础模型的推理能力吗？）

[04:58] TOP3(🔥78) | 🤖 TTRL: Test-Time Reinforcement Learning（测试时强化学习）

[07:12] TOP4(🔥71) | 💡 Learning to Reason under Off-Policy Guidance（基于离策略指导的学习推理）

[09:12] TOP5(🔥62) | 🦅 Eagle 2.5: Boosting Long-Context Post-Training for Frontier Vision-Language Models（Eagle 2.5：提升前沿视觉-语言模型长文本后训练性能）

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

...more

View all episodes

By duan

22 ratings

April 26, 2025

【周末特辑】4月第4周最火AI论文 | 阿拉伯语模型扩展成功；强化学习提升有限。

11 minutes

本期的 5 篇论文如下：

[00:33] TOP1(🔥108) | 💡 Kuwain 1.5B: An Arabic SLM via Language Injection（Kuwain 1.5B：一种基于语言注入的阿拉伯语SLM）

[04:58] TOP3(🔥78) | 🤖 TTRL: Test-Time Reinforcement Learning（测试时强化学习）

[07:12] TOP4(🔥71) | 💡 Learning to Reason under Off-Policy Guidance（基于离策略指导的学习推理）

[09:12] TOP5(🔥62) | 🦅 Eagle 2.5: Boosting Long-Context Post-Training for Frontier Vision-Language Models（Eagle 2.5：提升前沿视觉-语言模型长文本后训练性能）

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

...more

More shows like HuggingFace 每日AI论文速递

View all

硅谷101|中国版

56 Listeners

商业就是这样

292 Listeners

声动早咖啡

293 Listeners

思文，败类

156 Listeners

不开玩笑 Jokes Aside

136 Listeners

人民公园说AI

7 Listeners

數創實驗室 - AI時代的學習指南

1 Listeners

AI可可AI生活

0 Listeners

Share 【周末特辑】4月第4周最火AI论文 | 阿拉伯语模型扩展成功；强化学习提升有限。

Sign up to save your podcasts

【周末特辑】4月第4周最火AI论文 | 阿拉伯语模型扩展成功；强化学习提升有限。

【周末特辑】4月第4周最火AI论文 | 阿拉伯语模型扩展成功；强化学习提升有限。

More shows like HuggingFace 每日AI论文速递

硅谷101|中国版

商业就是这样

声动早咖啡

思文，败类

不开玩笑 Jokes Aside

人民公园说AI

數創實驗室 - AI時代的學習指南

AI可可AI生活