Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 413 episodes available.
June 07, 2025ReTool深度解析:强化学习赋能大语言模型战略性工具应用本期播客深入探讨ReTool框架,解析其如何通过强化学习,特别是结合代码解释器,显著提升大语言模型在复杂数学推理等任务中的能力、效率和智能化水平。...more14minPlay
June 06, 2025AI Radio FM:深入探讨Search-R1——用强化学习训练大语言模型掌握推理与搜索本期节目,我们深入探讨了最新的研究Search-R1,它提出了一种创新的强化学习框架,旨在训练大语言模型(LLM)在进行逐步推理时,能够自主且高效地利用搜索引擎获取外部知识和最新信息。我们将讨论Search-R1的核心机制、实验成果及其对未来LLM发展的意义。...more12minPlay
June 06, 2025深入探讨强化学习在推理搜索型LLM智能体中的应用本期节目,我们将深入探讨一篇关于强化学习(RL)在训练大型语言模型(LLM)进行复杂推理和与搜索引擎交互的实证研究。我们将讨论奖励机制设计、底层LLM的选择以及搜索引擎在RL过程中的作用等关键因素。...more15minPlay
June 06, 2025深入探讨StreamRL:大规模语言模型强化学习的革新之路本期播客深入探讨了StreamRL这一创新的强化学习框架,它如何通过解耦架构优化大规模语言模型的训练,解决资源耦合、流水线气泡和长尾分布等核心痛点,并展望其在异构硬件和跨数据中心部署中的巨大潜力。...more20minPlay
June 03, 2025ProRL: 延长强化学习拓展大语言模型推理边界深入探讨ProRL(Prolonged Reinforcement Learning)如何通过延长强化学习训练,结合KL散度控制、参考策略重置和多样化任务,显著提升大语言模型的推理能力,甚至发掘出基础模型无法触及的全新解题策略。本期节目将详细解析ProRL的技术细节、Nemotron-Research-Reasoning-Qwen-1.5B模型的惊人表现,以及这对AI未来发展的深远影响。...more15minPlay
June 02, 2025深入剖析DAPO:大规模开源LLM强化学习系统本期播客深入探讨了DAPO(解耦裁剪与动态采样策略优化)算法,这是一个在Qwen2.5-32B基础模型上实现AIME 2024测试50分的先进大规模强化学习系统。我们详细讨论了其四项关键技术:Clip-Higher、动态采样、词元级策略梯度损失和超长奖励修正,以及它们如何解决熵塌陷、梯度消失、长CoT场景下的学习不平衡和奖励噪声等问题,并介绍了其开放源代码、训练代码和精心处理的数据集对社区的贡献。...more13minPlay
June 02, 2025HybridFlow:灵活高效的RLHF框架深度解析本期节目深入探讨了HybridFlow框架,这是一个旨在提高大型语言模型(LLM)通过人类反馈进行强化学习(RLHF)的灵活性和效率的创新系统。我们将讨论其混合编程模型、3D-HybridEngine以及自动设备映射等核心组件,并解析其如何克服现有RLHF系统的局限性,实现显著的性能提升。...more15minPlay
June 02, 2025揭秘AceReason-Nemotron:强化学习如何革新AI数学与代码推理深入探讨AceReason-Nemotron研究,解析通过强化学习提升中小型模型数学和代码推理能力的创新方法、数据管理策略以及关键训练技巧。探索AI推理的新边界!...more16minPlay
June 02, 2025深入探讨Tülu 3:开放语言模型后训练的新前沿本期节目,我们将与AI专家Weedge一起,深入探讨艾伦人工智能研究所发布的Tülu 3系列模型。我们将详细解析其创新的后训练方法、开放的数据集和评估框架,以及它如何挑战现有模型的性能边界。...more23minPlay
June 02, 2025深入探讨DeepSeekMath:开源语言模型数学推理的新高峰本期节目,我们深入探讨了DeepSeekMath的最新研究,这是一款在数学推理领域取得突破性进展的开源语言模型。我们将讨论其预训练、监督微调、创新的GRPO强化学习算法,以及它如何在多个数学基准测试中超越现有模型,甚至逼近GPT-4的性能。...more17minPlay
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 413 episodes available.