HuggingFace 每日AI论文速递

【周末特辑】12月第4周最火AI论文 | 鲁棒微调提升大模型抗噪能力,并行生成加速视觉模型效率。


Listen Later

本期的 5 篇论文如下:

[00:37] TOP1(🔥78) | 🛡 RobustFT: Robust Supervised Fine-tuning for Large Language Models under Noisy Response(RobustFT:在噪声响应下的大语言模型的鲁棒监督微调)

[02:57] TOP2(🔥47) | ⚡ Parallelized Autoregressive Visual Generation(并行自回归视觉生成)

[05:16] TOP3(🔥38) | 🔄 B-STaR: Monitoring and Balancing Exploration and Exploitation in Self-Taught Reasoners(B-STaR:监控和平衡自学习推理器中的探索与利用)

[07:23] TOP4(🔥37) | 🧠 Diving into Self-Evolving Training for Multimodal Reasoning(深入自进化训练的多模态推理)

[09:53] TOP5(🔥33) | 🧠 Offline Reinforcement Learning for LLM Multi-Step Reasoning(基于离线强化学习的大语言模型多步推理)

【关注我们】

您还可以在以下平台找到我们,获得播客内容以外更多信息

小红书: AI速递

...more
View all episodesView all episodes
Download on the App Store

HuggingFace 每日AI论文速递By duan