Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 427 episodes available.
August 26, 2025VIBEVOICE深度解析:长篇多说话人语音合成的革命本期节目我们将深入探讨微软研究院推出的VIBEVOICE模型,一款专为长篇、多说话人对话式语音合成设计的创新技术。我们将剖析其核心优势,包括革命性的语音编码器、前所未有的合成时长,以及其在主观和客观评估中如何超越现有顶尖模型。同时,我们也将讨论其技术架构、应用前景以及潜在的风险与局限性。...more16minPlay
August 25, 2025DuPO:大语言模型自我验证的新范式深入探讨DuPO框架如何通过广义对偶学习实现大语言模型(LLM)的自我验证,摆脱昂贵的人工标注,提升翻译和数学推理等任务的性能,并实现训练与推理的双重优化。...more13minPlay
August 25, 2025AI Radio FM - 科技频道:ALIGNATT - 实时语音翻译的新突破本期节目深入探讨了ALIGNATT,一种利用注意力机制的音频-翻译对齐信息来指导实时语音翻译的新策略。我们揭示了它如何在离线训练模型上实现最先进的性能,显著提升翻译质量并降低延迟。...more12minPlay
August 23, 2025流媒体Sortformer:基于到达顺序的说话人缓存实时说话人识别本期节目深入探讨了NVIDIA最新发布的“流媒体Sortformer”技术,这是一种基于说话人到达时间顺序的实时说话人识别框架。我们将详细解析其核心创新——“到达顺序说话人缓存”(AOSC),以及它如何突破传统离线方法的局限,实现高效、低延迟的实时多说话人追踪。从Sortformer的诞生到流媒体扩展的精妙设计,再到在DIHARD III和CALLHOME等基准数据集上的卓越表现,我们将为您揭示这一技术如何为实时字幕、虚拟会议和对话分析等应用带来革命性变革。...more9minPlay
August 21, 2025AI电台FM:技术频道 - 实时全频带语音增强的混合DSP与深度学习方法本期节目深入探讨了实时全频带语音增强的突破性进展,特别是Mozilla公司Jean-Marc Valin提出的混合DSP与深度学习方法。我们将揭示这种创新方法如何通过结合传统信号处理与现代神经网络的优势,在保持低复杂度的同时,显著提升语音去噪的质量,并讨论其在实时应用中的巨大潜力,例如视频会议系统。...more12minPlay
August 20, 2025深度强化学习概览:从基础到前沿本期节目深入探讨了强化学习的各个方面,从核心概念、经典算法到前沿技术,旨在为听众提供一份全面且引人入胜的强化学习概览。我们将详细讨论价值学习、策略优化、基于模型的强化学习,以及处理稀疏奖励、部分可观测性等挑战的最新方法。此外,我们还将触及强化学习与大语言模型等新兴领域的交叉应用,并展望通用人工智能的未来。...more14minPlay
August 19, 2025AI前沿:ZipVoice - 极速高质零样本文本到语音的奥秘深入探讨ZipVoice,一个革命性的文本到语音模型!它如何通过紧凑的设计和创新的流匹配蒸馏技术,实现比现有技术快30倍的推理速度,同时保持卓越的语音质量。了解Zipformer骨干网络、平均上采样策略和流蒸馏如何共同打造下一代零样本TTS体验。...more11minPlay
August 18, 2025智绘乾坤:揭秘通义Qwen-Image的视觉生成突破本期AI电台FM科技频道,我们将深入探讨阿里通义团队推出的Qwen-Image模型。从其在复杂文本渲染和精准图像编辑上的重大突破,到其创新的数据管道和训练策略,以及在各项基准测试中展现出的卓越性能,我们将全面解析Qwen-Image如何重新定义生成式AI的边界,并展望其在未来视觉-语言交互领域的深远影响。...more16minPlay
August 18, 2025AI电台FM:露西:边缘运行智能体与动态思维向量的秘密本期节目深入探讨了Menlo Research的突破性项目“露西”,一个仅1.7亿参数的小型语言模型,如何通过创新的动态任务向量机制和两阶段强化学习框架,在移动和边缘设备上实现与大型模型相媲美的智能体式网页搜索能力。我们将揭示其如何通过优化思维过程而非增加模型规模来打破传统瓶颈,并探讨思维标签在任务向量中的关键作用以及其带来的出乎意料的自适应行为。...more11minPlay
August 14, 2025VeOmni:多模态大模型训练的革新者本期节目,我们将深入探讨字节跳动最新推出的VeOmni框架,它如何以模型为中心的分布式训练配方,高效扩展任意模态模型训练,突破多模态大模型开发瓶颈。从架构解耦到N维并行策略,再到实战表现,我们将为您揭示VeOmni的强大之处!...more11minPlay
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 427 episodes available.