Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 399 episodes available.
April 07, 2025AI Radio FM: WavTokenizer - 极致压缩与高保真音频编码新突破本期节目深入探讨WavTokenizer,一种创新的音频编解码器,它利用单一量化器实现了前所未有的压缩率,同时保持了业界领先的重建质量和更丰富的语义信息。我们将讨论其核心技术、与现有SOTA模型的对比及其在下游任务(如TTS)中的潜力。...more10minPlay
April 03, 2025HybridFlow:灵活高效的RLHF框架深度解析深入探讨HybridFlow框架,解析其混合编程模型、3D-HybridEngine和自动设备映射如何解决现有RLHF系统的局限性,实现显著的性能提升。...more9minPlay
April 02, 2025AI Radio FM - 探讨 Language-Codec:为语音语言模型量身打造的音频编解码器本期节目深入探讨了 Language-Codec 这项创新的音频编解码技术。我们讨论了现有编解码器与大型语音语言模型之间的差距,Language-Codec 如何通过 MCRVQ 机制、更大的数据集和改进的结构来弥补这些差距,以及它在音频重建和下游零样本 TTS 任务中的卓越表现。...more14minPlay
April 02, 2025AI Radio FM - Technology Channel: WavTokenizer深度解析欢迎收听AI Radio FM - 技术频道。本期节目,我们深入探讨WavTokenizer,一个旨在实现极致压缩和高质量音频重建的创新性声学编解码器。我们将讨论它如何通过单一量化器、扩展的VQ空间和改进的解码器结构,在保持丰富语义信息的同时,挑战现有技术。...more14minPlay
April 02, 2025AI Radio FM: MegaTTS 3 - 语音合成新突破:稀疏对齐与扩散模型本期 AI Radio FM 深入探讨 MegaTTS 3,一项创新的零样本语音合成技术。我们讨论了它如何通过稀疏对齐策略解决现有 TTS 模型的对齐难题,利用多条件无分类器指导实现灵活的口音控制,并通过 PeRFlow 技术加速生成。一起了解 MegaTTS 3 如何在语音质量、自然度、鲁棒性和效率方面达到业界领先水平。...more11minPlay
March 28, 2025Qwen2.5-Omni: 通往通用人工智能的多模态统一模型深入探讨 Qwen2.5-Omni 技术报告,解析其创新的多模态处理、流式生成能力以及卓越的性能表现。...more11minPlay
March 26, 2025深入探讨Bitnet.cpp:边缘设备上的高效三元大语言模型推理本期节目深入探讨Bitnet.cpp,一个为BitNet b1.58等三元大语言模型在边缘设备上进行高效推理而优化的系统。我们将详细解析其创新的混合精度矩阵乘法(mpGEMM)库、TL(三元查找表)和I2_S(带缩放的Int2)内核,如何实现显著的速度提升和无损推理。...more16minPlay
March 25, 2025LLM推理与TGI - Adyen知识中心技术故事深入探讨使用HuggingFace的文本生成推理(TGI)优化大型语言模型(LLM)以实现高效推理的过程。了解TGI的服务器和推理引擎组件,以及相关的性能指标和注意事项。...more4minPlay
March 21, 2025SNAC:多尺度神经音频编解码器本播客讨论了SNAC(多尺度神经音频编解码器),这是一种新的音频压缩方法,它通过在多个时间分辨率上运行量化器来提高压缩效率。...more9minPlay
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 399 episodes available.