Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 397 episodes available.
August 14, 2025OpenCUA:开启通用计算机代理的新篇章本期播客深入探讨了OpenCUA框架,一个旨在为计算机使用代理(CUA)研究建立开放基础的创新项目。我们将详细解读其数据收集、处理、模型训练的独特方法,以及OpenCUA-32B如何在OSWorld-Verified基准测试中超越GPT-4o,成为开源模型的里程碑。...more27minPlay
August 13, 2025SecoustiCodec:下一代流媒体语音编解码技术深入探讨开创性的语音编解码器SecoustiCodec,它通过解耦语义和副语言信息,实现了高保真、低比特率和实时流媒体传输。我们将剖析其VAE+FSQ量化、跨模态对比学习等创新方法,并解读其令人瞩目的SOTA性能。...more9minPlay
August 13, 2025Sortformer: AI革命性的语音识别新篇章在本期节目中,我们深入探讨了英伟达(NVIDIA)的创新模型Sortformer。我们将揭示它如何通过一种名为“排序损失”(Sort Loss)的新颖方法,巧妙地解决了语音分离(说话人日志)中的“排列问题”,从而彻底改变了多说话人自动语音识别(ASR)技术。我们将讨论Sortformer如何与ASR系统无缝集成,通过创新的“说话人核函数”和“排序序列化转录”技术,实现端到端的联合优化。准备好了解这项让机器更懂对话的突破性技术吧!...more9minPlay
August 13, 2025流式 Sortformer:实时语音日记的新突破深入探讨 NVIDIA 的最新研究“流式 Sortformer”,这是一种基于说话人缓存的在线说话人日志框架。我们将解析其核心创新“按到达顺序排列的说话人缓存”(AOSC)如何解决实时多说话人追踪的难题,并讨论其在实时字幕、虚拟会议等领域的应用前景。...more7minPlay
August 13, 2025Llasa+: 加速和流式语音合成的免费午餐本期节目,我们将深入探讨 Llasa+,这是一种基于 Llasa 模型构建的加速和流式文本到语音(TTS)模型。我们将讨论其核心技术,包括多令牌预测(MTP)和创新的验证算法,如何实现显著的速度提升而又不牺牲语音质量。同时,我们还将介绍其流式声码器 XCodec2-S 的实现。...more10minPlay
August 12, 2025FP4一路狂飙:全量化训练大型语言模型的新纪元本期播客深入探讨了一项开创性的研究,该研究首次实现了使用4比特浮点数(FP4)对大型语言模型进行全面的量化训练。我们邀请了技术专家Weedge,共同讨论了这项技术如何通过优化FP4格式(如NVFP4)、创新的分裂式舍入策略以及一个关键的理论阈值,成功地在保持与BF16基线相当性能的同时,极大地提升了训练效率。我们将揭示FP4训练从理论到大规模实践的全过程,包括它如何巧妙地利用量化感知微调(QAF)来弥补最后的性能差距,预示着AI训练硬件和算法的下一个革命。...more11minPlay
August 12, 2025GLM-V:用强化学习打造通用多模态推理新标杆深入解读GLM-4.1V-Thinking和GLM-4.5V的技术报告。我们将探讨其创新的以推理为中心的训练框架,大规模强化学习中的挑战与突破,以及这些模型如何推动多模态人工智能的边界。...more8minPlay
August 12, 2025GLM-4.5深度解析:智能体、推理与编码三位一体的AI新王者本期节目,我们深入探讨智谱AI和清华大学联合发布的GLM-4.5模型。这款拥有3550亿参数的开源巨兽,如何在智能体(Agentic)、推理(Reasoning)和编码(Coding)三大核心能力上实现顶级性能?从独特的训练方法到惊艳的评测结果,我们为您全方位解读GLM-4.5的强大之处。...more7minPlay
August 06, 2025'高效流式语言模型与注意力汇聚点'(Efficient Streaming Language Models with Attention Sinks)深入探讨的是一篇关于'高效流式语言模型与注意力汇聚点'(Efficient Streaming Language Models with Attention Sinks)的论文。...more9minPlay
August 06, 2025深入探讨OpenAI的开源新贵:gpt-oss-120b与20b模型本期节目,我们将深入探讨OpenAI最新发布的两个开源权重模型,gpt-oss-120b和gpt-oss-20b。我们将讨论它们的模型架构、核心功能、性能评估,以及大家最关心的安全问题,包括OpenAI是如何进行对抗性测试来评估潜在风险的。...more8minPlay
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 397 episodes available.