Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 397 episodes available.
September 19, 2025AI Radio FM - 科技频道:小米MiMo-Audio——通用语音智能的里程碑本期节目深入探讨了小米MiMo-Audio音频语言模型。通过前所未有的大规模预训练,MiMo-Audio展现出惊人的少样本学习能力,实现了语音领域的“GPT-3时刻”。我们详细讨论了其创新的分词器、多模态架构、分阶段训练策略,以及在语音理解、生成和对话方面取得的领先成果,包括超越开源模型并接近甚至超越闭源模型的表现。节目还将探讨该模型的独特优势、目前面临的挑战和未来的发展方向。...more14minPlay
September 14, 2025LLM推理的确定性之战:揭秘非确定性根源与解决方案欢迎收听AI Radio FM - 科技频道!本期节目,我们将深入探讨大型语言模型推理中令人头疼的非确定性问题。从浮点数非结合性到批量不变性,我们将一步步揭示LLM推理结果不一致的真正原因,并分享如何实现真正可复现、确定性结果的创新方法,包括对RMSNorm、矩阵乘法和注意力机制的批处理不变性改造。此外,我们还将讨论确定性推理对真实在线强化学习的关键意义。跟随我们的专家,weedge,一起攻克这个技术难题!...more13minPlay
September 10, 2025智能体AI的未来:小型语言模型将如何颠覆行业?本期节目深入探讨了一篇引人深思的论文,该论文提出小型语言模型(SLMs)将成为智能体AI的未来。我们将揭示SLMs为何在能力、经济性和灵活性上优于大型语言模型(LLMs),探讨其在智能体系统中的独特优势,并讨论将LLMs转换为SLMs的实际路径、面临的挑战以及未来的发展潜力。...more20minPlay
September 10, 2025XQuant:突破大型语言模型推理的内存瓶颈本期节目我们将深入探讨XQuant,一项通过巧妙利用计算能力超越内存限制的创新技术。它如何通过量化输入激活X而非KV缓存,实现高达12.5倍的内存节省,同时保持接近FP16的精度,为LLM推理带来革命性变革?我们还将揭示XQuant-CL如何利用跨层相似性,以及如何支持GQA模型,共同探讨这项面向未来的技术如何加速大模型应用!...more16minPlay
September 01, 2025(VibeVoice版)腾讯混元大模型:语言翻译新篇章——低资源语种的突破与融合智慧本期节目,我们将深入探讨腾讯混元团队发布的开创性翻译模型Hunyuan-MT-7B和Hunyuan-MT-Chimera-7B。我们将解析其独特的训练框架,如何在通用预训练、面向翻译的预训练、SFT、强化学习和弱到强强化学习的结合下,实现卓越的翻译性能,尤其是在曼德林与少数民族语言双向翻译方面的突破。通过详尽的案例分析和权威的基准测试结果,揭示这些模型如何超越业界领先水平,甚至在某些特定场景下超越人类专家。...more18minPlay
September 01, 2025腾讯混元大模型:语言翻译新篇章——低资源语种的突破与融合智慧本期节目,我们将深入探讨腾讯混元团队发布的开创性翻译模型Hunyuan-MT-7B和Hunyuan-MT-Chimera-7B。我们将解析其独特的训练框架,如何在通用预训练、面向翻译的预训练、SFT、强化学习和弱到强强化学习的结合下,实现卓越的翻译性能,尤其是在曼德林与少数民族语言双向翻译方面的突破。通过详尽的案例分析和权威的基准测试结果,揭示这些模型如何超越业界领先水平,甚至在某些特定场景下超越人类专家。...more19minPlay
September 01, 2025LongCat-Flash:5600亿参数 MoE 模型的效率与智能双重突破 (VibeVoice版本)深入探讨美团LongCat团队发布的5600亿参数MoE语言模型LongCat-Flash。我们将解析其两大创新架构:零计算专家和快捷连接MoE,如何实现计算效率和代理能力的飞跃。同时,还会揭示其在万亿级数据训练、推理优化以及Agent任务上的卓越表现,并分享其背后的稳定训练策略和基础设施保障。...more16minPlay
September 01, 2025LongCat-Flash:5600亿参数 MoE 模型的效率与智能双重突破深入探讨美团LongCat团队发布的5600亿参数MoE语言模型LongCat-Flash。我们将解析其两大创新架构:零计算专家和快捷连接MoE,如何实现计算效率和代理能力的飞跃。同时,还会揭示其在万亿级数据训练、推理优化以及Agent任务上的卓越表现,并分享其背后的稳定训练策略和基础设施保障。...more19minPlay
August 30, 2025AI自信深思:大语言模型推理效率与性能的飞跃深入探讨DeepConf这一创新方法,它如何通过模型内部的置信度信号,动态筛选低质量推理路径,显著提升大语言模型在复杂推理任务中的效率和准确性,同时大幅减少计算成本。...more14minPlay
August 29, 2025Step-Audio 2:赋能下一代智能语音交互本期节目深入探讨了Step-Audio 2,一个端到端的多模态大语音语言模型。我们将揭示它是如何通过创新的架构、海量数据训练和强化学习,在语音识别、音频理解、语音翻译和多模态对话等领域实现最先进性能的。更令人兴奋的是,Step-Audio 2如何理解并生成富有情感和风格的语音,甚至能调用外部工具进行实时信息检索和音色切换,为我们带来前所未有的智能语音交互体验。...more15minPlay
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 397 episodes available.