Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 397 episodes available.
October 14, 2025Muon优化器:AI训练提速的秘密武器本期节目,我们将深入探讨Muon优化器,这个在神经网络隐藏层训练中表现卓越的新技术。它如何通过独特的正交化更新机制,显著提升CIFAR-10和NanoGPT等任务的训练速度,甚至超越AdamW等主流优化器?我们还将揭示其设计原理,包括Newton-Schulz迭代的巧妙应用、系数调优的奥秘,以及它如何有效解决优化器研究中常见的“基线不足”问题。此外,我们还将讨论其与Shampoo等先行者的异同,以及未来在大规模模型训练中的潜力。锁定AI Radio FM,一起探索AI加速训练的前沿!...more14minPlay
October 11, 2025月光私酿:边缘设备上的微型专业ASR模型深入探讨“月光私酿”项目,揭示了小型单语ASR模型如何在资源受限的边缘设备上,超越大型多语模型,为小语种提供卓越的语音识别能力。本期播客将详细介绍其独特架构、数据策略和令人瞩目的性能表现。...more10minPlay
October 03, 2025轻量级混合双通道语音增强系统:低信噪比下的清晰之声在AI电台FM科技频道,我们深入探讨了一篇关于轻量级混合双通道语音增强系统的前沿研究。该系统巧妙结合了独立向量分析(IVA)与改进的GTCRN网络,旨在解决低信噪比环境下语音增强面临的计算资源限制与性能挑战。我们讨论了其创新架构、关键技术细节、实验成果及其在边缘设备实时应用中的巨大潜力。...more13minPlay
October 03, 2025轻量级语音增强引导的目标语音提取:嘈杂多说话人场景的新突破本期节目我们深入探讨了一项关于在嘈杂多说话人场景中进行目标语音提取的最新研究。我们将一起了解LGTSE和D-LGTSE如何利用轻量级语音增强模型,通过降噪无关的参考语音指导和失真感知训练,显著提升语音提取的性能和鲁棒性。...more15minPlay
October 03, 2025UL-UNAS:面向实时语音增强的超轻量级U-Net与网络架构搜索之旅欢迎收听《AI电台FM - 科技频道》,本期节目我们将深入探讨一篇关于“通过网络架构搜索实现实时语音增强的超轻量级U-Net模型”的创新研究。我们将揭示UL-UNAS如何在极低的计算资源下,实现卓越的语音增强效果,并探讨其核心技术:高效卷积块、新型激活函数APReLU、因果时频注意力cTFA以及神经网络架构搜索的奥秘。本研究不仅超越了现有超轻量级模型,更与资源密集型基线模型性能媲美,为边缘设备的实时语音增强提供了强大的解决方案。...more13minPlay
September 30, 2025TileLang:AI系统可组合平铺编程模型本期节目深入探讨了TileLang,一个为AI系统设计的新型可组合平铺编程模型。我们讨论了现代AI工作负载中高性能内核编程的挑战,现有领域专用编译器的局限性,以及TileLang如何通过解耦数据流与调度、提供精细控制和自动化优化来实现卓越性能。节目还分享了TileLang在不同硬件平台和AI工作负载上的实验成果,展示了其在提升编程效率和计算性能方面的巨大潜力。...more17minPlay
September 29, 2025深入探索DeepSeek-V3.2-Exp:稀疏注意力如何提升长上下文效率?本期AI电台FM将深入探讨DeepSeek-AI最新推出的实验性稀疏注意力模型DeepSeek-V3.2-Exp。我们将揭秘其核心技术——DeepSeek稀疏注意力(DSA)如何通过闪电索引器和精细化令牌选择机制,在保持模型性能的同时,显著提升长上下文场景下的训练和推理效率。从架构设计到训练策略,再到实战评估,weedge专家将为您带来全面而生动的解读。...more12minPlay
September 29, 2025模态流形:神经网络优化的新范式深入探讨“模态流形”这一创新概念,揭示如何通过限制神经网络权重张量在特定流形上来优化训练过程,提升模型稳定性与性能。从张量健康的重要性,到流形优化算法的数学原理,再到模态流形如何实现跨层学习率预算,我们为您呈现一个激动人心的未来AI训练图景。...more17minPlay
September 24, 2025AI Radio FM - 技术频道: Qwen3-Omni 多模态模型的突破之旅本期节目深入探讨了Qwen团队发布的Qwen3-Omni技术报告,揭示了这一首次实现多模态(文本、图像、音频、视频)性能无损且达到SOTA的单一模型。我们将详细解析其创新的Thinker-Talker MoE架构、超低延迟的实时语音生成技术、以及在各项基准测试中超越闭源模型(如Gemini-2.5-Pro, GPT-4o-Transcribe)的卓越表现。此外,还将讨论其广泛的语言支持、独特的多模态位置编码以及未来的发展方向。...more17minPlay
September 20, 2025OneSearch:电商搜索端到端生成式框架的深度探索欢迎来到AI Radio FM - 科技频道!本期节目,我们将深入探讨快手科技提出的革命性电商搜索框架OneSearch。这个框架旨在克服传统多级级联架构的限制,通过引入关键词增强分层量化编码、多视图用户行为序列注入和偏好感知奖励系统,实现电商搜索的端到端生成。我们将详细解析OneSearch如何提升搜索效率、优化用户体验,并带来显著的业务增长和成本节约。...more18minPlay
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 397 episodes available.