December 28, 2024

【周末特辑】12月第4周最火AI论文 | 鲁棒微调提升大模型抗噪能力，并行生成加速视觉模型效率。

12 minutes

本期的 5 篇论文如下：

[00:37] TOP1(🔥78) | 🛡 RobustFT: Robust Supervised Fine-tuning for Large Language Models under Noisy Response（RobustFT：在噪声响应下的大语言模型的鲁棒监督微调）

[02:57] TOP2(🔥47) | ⚡ Parallelized Autoregressive Visual Generation（并行自回归视觉生成）

[05:16] TOP3(🔥38) | 🔄 B-STaR: Monitoring and Balancing Exploration and Exploitation in Self-Taught Reasoners（B-STaR：监控和平衡自学习推理器中的探索与利用）

[07:23] TOP4(🔥37) | 🧠 Diving into Self-Evolving Training for Multimodal Reasoning（深入自进化训练的多模态推理）

[09:53] TOP5(🔥33) | 🧠 Offline Reinforcement Learning for LLM Multi-Step Reasoning（基于离线强化学习的大语言模型多步推理）

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

...more

View all episodes

By duan

22 ratings

December 28, 2024

【周末特辑】12月第4周最火AI论文 | 鲁棒微调提升大模型抗噪能力，并行生成加速视觉模型效率。

12 minutes

本期的 5 篇论文如下：

[00:37] TOP1(🔥78) | 🛡 RobustFT: Robust Supervised Fine-tuning for Large Language Models under Noisy Response（RobustFT：在噪声响应下的大语言模型的鲁棒监督微调）

[02:57] TOP2(🔥47) | ⚡ Parallelized Autoregressive Visual Generation（并行自回归视觉生成）

[05:16] TOP3(🔥38) | 🔄 B-STaR: Monitoring and Balancing Exploration and Exploitation in Self-Taught Reasoners（B-STaR：监控和平衡自学习推理器中的探索与利用）

[07:23] TOP4(🔥37) | 🧠 Diving into Self-Evolving Training for Multimodal Reasoning（深入自进化训练的多模态推理）

[09:53] TOP5(🔥33) | 🧠 Offline Reinforcement Learning for LLM Multi-Step Reasoning（基于离线强化学习的大语言模型多步推理）

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

...more

More shows like HuggingFace 每日AI论文速递

View all

硅谷101|中国版

56 Listeners

商业就是这样

292 Listeners

声动早咖啡

293 Listeners

思文，败类

157 Listeners

不开玩笑 Jokes Aside

136 Listeners

人民公园说AI

7 Listeners

數創實驗室 - AI時代的學習指南

1 Listeners

AI可可AI生活

0 Listeners

Share 【周末特辑】12月第4周最火AI论文 | 鲁棒微调提升大模型抗噪能力，并行生成加速视觉模型效率。

Sign up to save your podcasts

【周末特辑】12月第4周最火AI论文 | 鲁棒微调提升大模型抗噪能力，并行生成加速视觉模型效率。

【周末特辑】12月第4周最火AI论文 | 鲁棒微调提升大模型抗噪能力，并行生成加速视觉模型效率。

More shows like HuggingFace 每日AI论文速递

硅谷101|中国版

商业就是这样

声动早咖啡

思文，败类

不开玩笑 Jokes Aside

人民公园说AI

數創實驗室 - AI時代的學習指南

AI可可AI生活