Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 397 episodes available.
June 02, 2025HybridFlow:灵活高效的RLHF框架深度解析本期节目深入探讨了HybridFlow框架,这是一个旨在提高大型语言模型(LLM)通过人类反馈进行强化学习(RLHF)的灵活性和效率的创新系统。我们将讨论其混合编程模型、3D-HybridEngine以及自动设备映射等核心组件,并解析其如何克服现有RLHF系统的局限性,实现显著的性能提升。...more15minPlay
June 02, 2025揭秘AceReason-Nemotron:强化学习如何革新AI数学与代码推理深入探讨AceReason-Nemotron研究,解析通过强化学习提升中小型模型数学和代码推理能力的创新方法、数据管理策略以及关键训练技巧。探索AI推理的新边界!...more16minPlay
June 02, 2025深入探讨Tülu 3:开放语言模型后训练的新前沿本期节目,我们将与AI专家Weedge一起,深入探讨艾伦人工智能研究所发布的Tülu 3系列模型。我们将详细解析其创新的后训练方法、开放的数据集和评估框架,以及它如何挑战现有模型的性能边界。...more23minPlay
June 02, 2025深入探讨DeepSeekMath:开源语言模型数学推理的新高峰本期节目,我们深入探讨了DeepSeekMath的最新研究,这是一款在数学推理领域取得突破性进展的开源语言模型。我们将讨论其预训练、监督微调、创新的GRPO强化学习算法,以及它如何在多个数学基准测试中超越现有模型,甚至逼近GPT-4的性能。...more17minPlay
June 01, 2025深入探讨小米MiMo-VL:下一代视觉语言模型本期AI广播FM技术频道,我们与技术专家weedge一同深入探讨小米最新发布的MiMo-VL技术报告,解析其强大的视觉理解、多模态推理能力以及创新的训练方法。...more13minPlay
June 01, 2025MiMo-7B:解锁语言模型的推理潜力本期节目深入探讨了MiMo-7B模型,一个专为推理任务而生的大语言模型。我们讨论了其从预训练到后训练的全方位优化,包括创新的数据处理方法、模型架构设计、以及强化学习策略,揭示了MiMo-7B在数学、代码和通用推理任务上超越同类甚至更大规模模型的卓越表现。...more18minPlay
May 31, 2025深入探讨Atlas:学习在测试时优化记忆上下文本期节目,我们将深入探讨名为“Atlas”的最新研究,它提出了一种新颖的方法来优化序列模型中的长期记忆。我们将讨论当前模型的局限性以及Atlas如何通过其创新的记忆模块和学习规则来解决这些问题。...more16minPlay
May 30, 2025深入探讨Linear-MoE:线性序列建模与专家混合的结合本期AI Radio FM科技频道,我们与技术专家weedge一起,深入探讨了Linear-MoE这一创新的大规模模型架构。我们将讨论其核心理念、系统构成、训练效率以及它如何结合线性序列建模(LSM)和专家混合(MoE)的优势,为下一代基础模型带来的潜力与挑战。...more14minPlay
May 26, 2025BAGEL模型:统一多模态预训练的新里程碑本期节目深入探讨了BAGEL模型,这是一个开源的基础模型,通过在万亿级多模态交错数据上进行预训练,展现了在复杂多模态推理方面的惊人新兴能力。我们将讨论其统一理解与生成的设计、数据策略、训练细节以及其在各项基准测试中的卓越表现。...more13minPlay
May 25, 2025深入探讨LoRA:大型语言模型的低秩适应技术本期播客将深入探讨LoRA(Low-Rank Adaptation)技术,一种用于高效适应大型语言模型的新方法。我们将讨论LoRA如何解决全量微调的挑战,其核心原理、显著优势以及在各种模型和任务上的表现。...more11minPlay
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 397 episodes available.