AI Podcast

By weedge

Latest podcasts about AI Technology and Papers.... more

· Technology

Download on the App Store

Download on the App Store

Get it on Google Play

FAQs about AI Podcast:

How many episodes does AI Podcast have?

The podcast currently has 427 episodes available.

AI Podcast episodes:

September 19, 2025 AI Radio FM - 科技频道：小米MiMo-Audio——通用语音智能的里程碑
本期节目深入探讨了小米MiMo-Audio音频语言模型。通过前所未有的大规模预训练，MiMo-Audio展现出惊人的少样本学习能力，实现了语音领域的“GPT-3时刻”。我们详细讨论了其创新的分词器、多模态架构、分阶段训练策略，以及在语音理解、生成和对话方面取得的领先成果，包括超越开源模型并接近甚至超越闭源模型的表现。节目还将探讨该模型的独特优势、目前面临的挑战和未来的发展方向。
...more
14min
September 14, 2025 LLM推理的确定性之战：揭秘非确定性根源与解决方案
欢迎收听AI Radio FM - 科技频道！本期节目，我们将深入探讨大型语言模型推理中令人头疼的非确定性问题。从浮点数非结合性到批量不变性，我们将一步步揭示LLM推理结果不一致的真正原因，并分享如何实现真正可复现、确定性结果的创新方法，包括对RMSNorm、矩阵乘法和注意力机制的批处理不变性改造。此外，我们还将讨论确定性推理对真实在线强化学习的关键意义。跟随我们的专家，weedge，一起攻克这个技术难题！
...more
13min
September 10, 2025 智能体AI的未来：小型语言模型将如何颠覆行业？
本期节目深入探讨了一篇引人深思的论文，该论文提出小型语言模型（SLMs）将成为智能体AI的未来。我们将揭示SLMs为何在能力、经济性和灵活性上优于大型语言模型（LLMs），探讨其在智能体系统中的独特优势，并讨论将LLMs转换为SLMs的实际路径、面临的挑战以及未来的发展潜力。
...more
20min
September 10, 2025 XQuant：突破大型语言模型推理的内存瓶颈
本期节目我们将深入探讨XQuant，一项通过巧妙利用计算能力超越内存限制的创新技术。它如何通过量化输入激活X而非KV缓存，实现高达12.5倍的内存节省，同时保持接近FP16的精度，为LLM推理带来革命性变革？我们还将揭示XQuant-CL如何利用跨层相似性，以及如何支持GQA模型，共同探讨这项面向未来的技术如何加速大模型应用！
...more
16min
September 01, 2025 (VibeVoice版)腾讯混元大模型：语言翻译新篇章——低资源语种的突破与融合智慧
本期节目，我们将深入探讨腾讯混元团队发布的开创性翻译模型Hunyuan-MT-7B和Hunyuan-MT-Chimera-7B。我们将解析其独特的训练框架，如何在通用预训练、面向翻译的预训练、SFT、强化学习和弱到强强化学习的结合下，实现卓越的翻译性能，尤其是在曼德林与少数民族语言双向翻译方面的突破。通过详尽的案例分析和权威的基准测试结果，揭示这些模型如何超越业界领先水平，甚至在某些特定场景下超越人类专家。
...more
18min
September 01, 2025 腾讯混元大模型：语言翻译新篇章——低资源语种的突破与融合智慧
本期节目，我们将深入探讨腾讯混元团队发布的开创性翻译模型Hunyuan-MT-7B和Hunyuan-MT-Chimera-7B。我们将解析其独特的训练框架，如何在通用预训练、面向翻译的预训练、SFT、强化学习和弱到强强化学习的结合下，实现卓越的翻译性能，尤其是在曼德林与少数民族语言双向翻译方面的突破。通过详尽的案例分析和权威的基准测试结果，揭示这些模型如何超越业界领先水平，甚至在某些特定场景下超越人类专家。
...more
19min
September 01, 2025 LongCat-Flash：5600亿参数 MoE 模型的效率与智能双重突破 (VibeVoice版本)
深入探讨美团LongCat团队发布的5600亿参数MoE语言模型LongCat-Flash。我们将解析其两大创新架构：零计算专家和快捷连接MoE，如何实现计算效率和代理能力的飞跃。同时，还会揭示其在万亿级数据训练、推理优化以及Agent任务上的卓越表现，并分享其背后的稳定训练策略和基础设施保障。
...more
16min
September 01, 2025 LongCat-Flash：5600亿参数 MoE 模型的效率与智能双重突破
深入探讨美团LongCat团队发布的5600亿参数MoE语言模型LongCat-Flash。我们将解析其两大创新架构：零计算专家和快捷连接MoE，如何实现计算效率和代理能力的飞跃。同时，还会揭示其在万亿级数据训练、推理优化以及Agent任务上的卓越表现，并分享其背后的稳定训练策略和基础设施保障。
...more
19min
August 30, 2025 AI自信深思：大语言模型推理效率与性能的飞跃
深入探讨DeepConf这一创新方法，它如何通过模型内部的置信度信号，动态筛选低质量推理路径，显著提升大语言模型在复杂推理任务中的效率和准确性，同时大幅减少计算成本。
...more
14min
August 29, 2025 Step-Audio 2：赋能下一代智能语音交互
本期节目深入探讨了Step-Audio 2，一个端到端的多模态大语音语言模型。我们将揭示它是如何通过创新的架构、海量数据训练和强化学习，在语音识别、音频理解、语音翻译和多模态对话等领域实现最先进性能的。更令人兴奋的是，Step-Audio 2如何理解并生成富有情感和风格的语音，甚至能调用外部工具进行实时信息检索和音色切换，为我们带来前所未有的智能语音交互体验。
...more
15min

FAQs about AI Podcast:

How many episodes does AI Podcast have?

The podcast currently has 427 episodes available.