Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 399 episodes available.
March 21, 2025AI Radio FM - 深入解读无分类器引导的扩散模型本期播客深入探讨了一篇关于扩散模型的新研究,该研究提出了一种名为“模型引导”(Model-guidance, MG)的新方法,旨在取代传统的无分类器引导(Classifier-free Guidance, CFG)。我们将讨论MG如何提高训练和推理速度,同时在ImageNet基准测试上取得最先进的成果。...more5minPlay
March 21, 2025AI Radio FM - Technology Channel本期播客深入探讨了一篇关于多模态大型语言模型(MLLM)与人类偏好对齐的综述论文。我们将讨论现有对齐算法的应用场景、对齐数据集的构建、评估方法以及未来的发展方向。...more6minPlay
March 18, 2025AI Radio FM - প্রযুক্তির চ্যানেলCUTLASS中高效GEMM的层次结构、线程块、Warp和线程级GEMM,以及各种优化策略的讨论。...more5minPlay
March 18, 2025AI Radio FM - 科技频道:Transformer模型的快速推理本期播客讨论了通过推测解码实现Transformer模型的快速推理,这是一种在不改变输出的情况下加速自回归模型采样的方法。...more6minPlay
March 18, 2025FlashInfer:面向大语言模型推理服务的可定制高效注意力引擎本播客深入探讨FlashInfer,这是一种专为大语言模型(LLM)推理服务设计的高效且可定制的注意力引擎。FlashInfer通过块稀疏格式和可组合格式解决KV缓存存储异构性,优化内存访问并减少冗余。它还提供可定制的注意力模板,通过即时编译适应各种设置。此外,FlashInfer的负载均衡调度算法适应用户请求的动态性,同时保持与CUDAGraph的兼容性。...more5minPlay
March 18, 2025AI Radio FM - 跨越对话语音的“恐怖谷”探索Sesame研究团队如何通过情感智能、对话动态、上下文感知和一致的个性,实现“语音存在”,使数字语音助手更具吸引力和实用性。...more6minPlay
March 18, 2025AI语音增强新突破:LLaSE-G1模型深度解析本期播客深入探讨了基于LLaMA的语音增强模型LLaSE-G1,该模型如何通过最大化声学信息保留和统一多任务处理,在噪声抑制、丢包隐藏、目标说话人提取、回声消除等多个语音增强任务中取得显著成果。...more7minPlay
March 17, 2025AI Radio FM - 探索音频大语言模型中的思维链推理本期播客深入探讨了将思维链(CoT)推理整合到大型音频语言模型(LALM)中,以增强其在声音、音乐和语音领域的推理能力。我们评估了几种具有代表性的CoT方法,分析了它们在信息提取和推理任务中的表现,并讨论了CoT方法在处理复杂任务时的局限性。...more4minPlay
March 17, 2025AI Radio FM - 深度音频推理本期播客深入探讨了Audio-Reasoner模型,这是一个大型音频语言模型,专为音频任务中的深度推理而设计。我们讨论了它的训练方法、结构化CoT方法、以及名为CoTA的大规模数据集。CoTA数据集通过自动注释、推理链创建和验证,为音频推理提供了坚实的基础。...more7minPlay
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 399 episodes available.