AI Podcast

By weedge

Latest podcasts about AI Technology and Papers.... more

· Technology

Download on the App Store

Download on the App Store

Get it on Google Play

FAQs about AI Podcast:

How many episodes does AI Podcast have?

The podcast currently has 427 episodes available.

AI Podcast episodes:

June 16, 2025 MuseTalk专题：实时高保真视频配音的革新
深入探讨MuseTalk如何通过创新的时空采样策略和两阶段训练框架，解决视频配音中的“三难困境”，实现实时、高保真的口型同步效果。讨论其核心技术、实验结果以及对未来多媒体应用的影响。
...more
12min
June 16, 2025 文本语音驱动的全身动画技术深度解析
本期节目深入探讨了一项前沿的全身动画合成系统，该系统能够根据输入的文本和语音实时生成逼真的面部表情和身体动作。我们详细解析了其面部动画的深度学习方法和身体动画的图模型方法，以及它们如何协同工作，实现高度同步和富有表现力的虚拟形象动画。
...more
12min
June 10, 2025 深入探讨对数线性注意力机制
本期播客，我们深入探讨了一篇关于“对数线性注意力”（Log-Linear Attention）的最新研究论文，这是一种旨在平衡传统注意力机制的表达能力与线性注意力机制计算效率的新方法。我们将讨论其核心思想、技术实现、实验结果以及潜在影响。
...more
10min
June 09, 2025 AI Radio FM - 技术频道：深入探讨Skywork R1V2的多模态混合强化学习推理
本期播客深入探讨了下一代多模态推理模型 Skywork R1V2。我们讨论了其核心的混合强化学习范式（MPO 和 GRPO 的结合）、创新的选择性样本缓冲（SSB）机制，以及它如何在解决复杂推理任务的同时平衡泛化能力并减少视觉幻觉。节目还将涵盖其在多个基准测试中的卓越表现、与现有模型的对比，以及对未来多模态人工智能发展的启示。
...more
16min
June 07, 2025 ReTool深度解析：强化学习赋能大语言模型战略性工具应用
本期播客深入探讨ReTool框架，解析其如何通过强化学习，特别是结合代码解释器，显著提升大语言模型在复杂数学推理等任务中的能力、效率和智能化水平。
...more
14min
June 06, 2025 AI Radio FM：深入探讨Search-R1——用强化学习训练大语言模型掌握推理与搜索
本期节目，我们深入探讨了最新的研究Search-R1，它提出了一种创新的强化学习框架，旨在训练大语言模型（LLM）在进行逐步推理时，能够自主且高效地利用搜索引擎获取外部知识和最新信息。我们将讨论Search-R1的核心机制、实验成果及其对未来LLM发展的意义。
...more
12min
June 06, 2025 深入探讨强化学习在推理搜索型LLM智能体中的应用
本期节目，我们将深入探讨一篇关于强化学习（RL）在训练大型语言模型（LLM）进行复杂推理和与搜索引擎交互的实证研究。我们将讨论奖励机制设计、底层LLM的选择以及搜索引擎在RL过程中的作用等关键因素。
...more
15min
June 06, 2025 深入探讨StreamRL：大规模语言模型强化学习的革新之路
本期播客深入探讨了StreamRL这一创新的强化学习框架，它如何通过解耦架构优化大规模语言模型的训练，解决资源耦合、流水线气泡和长尾分布等核心痛点，并展望其在异构硬件和跨数据中心部署中的巨大潜力。
...more
20min
June 03, 2025 ProRL: 延长强化学习拓展大语言模型推理边界
深入探讨ProRL（Prolonged Reinforcement Learning）如何通过延长强化学习训练，结合KL散度控制、参考策略重置和多样化任务，显著提升大语言模型的推理能力，甚至发掘出基础模型无法触及的全新解题策略。本期节目将详细解析ProRL的技术细节、Nemotron-Research-Reasoning-Qwen-1.5B模型的惊人表现，以及这对AI未来发展的深远影响。
...more
15min
June 02, 2025 深入剖析DAPO：大规模开源LLM强化学习系统
本期播客深入探讨了DAPO（解耦裁剪与动态采样策略优化）算法，这是一个在Qwen2.5-32B基础模型上实现AIME 2024测试50分的先进大规模强化学习系统。我们详细讨论了其四项关键技术：Clip-Higher、动态采样、词元级策略梯度损失和超长奖励修正，以及它们如何解决熵塌陷、梯度消失、长CoT场景下的学习不平衡和奖励噪声等问题，并介绍了其开放源代码、训练代码和精心处理的数据集对社区的贡献。
...more
13min

FAQs about AI Podcast:

How many episodes does AI Podcast have?

The podcast currently has 427 episodes available.