Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 427 episodes available.
March 18, 2025AI Radio FM - প্রযুক্তির চ্যানেলCUTLASS中高效GEMM的层次结构、线程块、Warp和线程级GEMM,以及各种优化策略的讨论。...more5minPlay
March 18, 2025AI Radio FM - 科技频道:Transformer模型的快速推理本期播客讨论了通过推测解码实现Transformer模型的快速推理,这是一种在不改变输出的情况下加速自回归模型采样的方法。...more6minPlay
March 18, 2025FlashInfer:面向大语言模型推理服务的可定制高效注意力引擎本播客深入探讨FlashInfer,这是一种专为大语言模型(LLM)推理服务设计的高效且可定制的注意力引擎。FlashInfer通过块稀疏格式和可组合格式解决KV缓存存储异构性,优化内存访问并减少冗余。它还提供可定制的注意力模板,通过即时编译适应各种设置。此外,FlashInfer的负载均衡调度算法适应用户请求的动态性,同时保持与CUDAGraph的兼容性。...more5minPlay
March 18, 2025AI Radio FM - 跨越对话语音的“恐怖谷”探索Sesame研究团队如何通过情感智能、对话动态、上下文感知和一致的个性,实现“语音存在”,使数字语音助手更具吸引力和实用性。...more6minPlay
March 18, 2025AI语音增强新突破:LLaSE-G1模型深度解析本期播客深入探讨了基于LLaMA的语音增强模型LLaSE-G1,该模型如何通过最大化声学信息保留和统一多任务处理,在噪声抑制、丢包隐藏、目标说话人提取、回声消除等多个语音增强任务中取得显著成果。...more7minPlay
March 17, 2025AI Radio FM - 探索音频大语言模型中的思维链推理本期播客深入探讨了将思维链(CoT)推理整合到大型音频语言模型(LALM)中,以增强其在声音、音乐和语音领域的推理能力。我们评估了几种具有代表性的CoT方法,分析了它们在信息提取和推理任务中的表现,并讨论了CoT方法在处理复杂任务时的局限性。...more4minPlay
March 17, 2025AI Radio FM - 深度音频推理本期播客深入探讨了Audio-Reasoner模型,这是一个大型音频语言模型,专为音频任务中的深度推理而设计。我们讨论了它的训练方法、结构化CoT方法、以及名为CoTA的大规模数据集。CoTA数据集通过自动注释、推理链创建和验证,为音频推理提供了坚实的基础。...more7minPlay
March 17, 2025AI Radio FM - 强化学习与音频问答本期播客探讨了强化学习(RL)在音频问答(AQA)任务中的应用,以及如何通过小组相对策略优化(GRPO)算法提升大型音频语言模型(LALM)的性能。研究表明,即使在有限数据集下,RL也能显著优于监督微调(SFT),并揭示了LALM在音频理解和推理方面仍有巨大提升空间。...more4minPlay
March 16, 2025AI Radio FM - 揭秘StreamingLLM:无限长度文本处理的革新本期播客深入探讨了StreamingLLM,这是一种新的大型语言模型(LLM)框架,它解决了在流式应用中部署LLM的关键挑战。通过引入“注意力沉淀”的概念,StreamingLLM使得LLM能够处理无限长度的文本输入,而无需进行微调,同时保持了效率和性能。...more5minPlay
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 427 episodes available.