Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 413 episodes available.
September 01, 2025(VibeVoice版)腾讯混元大模型:语言翻译新篇章——低资源语种的突破与融合智慧本期节目,我们将深入探讨腾讯混元团队发布的开创性翻译模型Hunyuan-MT-7B和Hunyuan-MT-Chimera-7B。我们将解析其独特的训练框架,如何在通用预训练、面向翻译的预训练、SFT、强化学习和弱到强强化学习的结合下,实现卓越的翻译性能,尤其是在曼德林与少数民族语言双向翻译方面的突破。通过详尽的案例分析和权威的基准测试结果,揭示这些模型如何超越业界领先水平,甚至在某些特定场景下超越人类专家。...more18minPlay
September 01, 2025腾讯混元大模型:语言翻译新篇章——低资源语种的突破与融合智慧本期节目,我们将深入探讨腾讯混元团队发布的开创性翻译模型Hunyuan-MT-7B和Hunyuan-MT-Chimera-7B。我们将解析其独特的训练框架,如何在通用预训练、面向翻译的预训练、SFT、强化学习和弱到强强化学习的结合下,实现卓越的翻译性能,尤其是在曼德林与少数民族语言双向翻译方面的突破。通过详尽的案例分析和权威的基准测试结果,揭示这些模型如何超越业界领先水平,甚至在某些特定场景下超越人类专家。...more19minPlay
September 01, 2025LongCat-Flash:5600亿参数 MoE 模型的效率与智能双重突破 (VibeVoice版本)深入探讨美团LongCat团队发布的5600亿参数MoE语言模型LongCat-Flash。我们将解析其两大创新架构:零计算专家和快捷连接MoE,如何实现计算效率和代理能力的飞跃。同时,还会揭示其在万亿级数据训练、推理优化以及Agent任务上的卓越表现,并分享其背后的稳定训练策略和基础设施保障。...more16minPlay
September 01, 2025LongCat-Flash:5600亿参数 MoE 模型的效率与智能双重突破深入探讨美团LongCat团队发布的5600亿参数MoE语言模型LongCat-Flash。我们将解析其两大创新架构:零计算专家和快捷连接MoE,如何实现计算效率和代理能力的飞跃。同时,还会揭示其在万亿级数据训练、推理优化以及Agent任务上的卓越表现,并分享其背后的稳定训练策略和基础设施保障。...more19minPlay
August 30, 2025AI自信深思:大语言模型推理效率与性能的飞跃深入探讨DeepConf这一创新方法,它如何通过模型内部的置信度信号,动态筛选低质量推理路径,显著提升大语言模型在复杂推理任务中的效率和准确性,同时大幅减少计算成本。...more14minPlay
August 29, 2025Step-Audio 2:赋能下一代智能语音交互本期节目深入探讨了Step-Audio 2,一个端到端的多模态大语音语言模型。我们将揭示它是如何通过创新的架构、海量数据训练和强化学习,在语音识别、音频理解、语音翻译和多模态对话等领域实现最先进性能的。更令人兴奋的是,Step-Audio 2如何理解并生成富有情感和风格的语音,甚至能调用外部工具进行实时信息检索和音色切换,为我们带来前所未有的智能语音交互体验。...more15minPlay
August 26, 2025VIBEVOICE深度解析:长篇多说话人语音合成的革命本期节目我们将深入探讨微软研究院推出的VIBEVOICE模型,一款专为长篇、多说话人对话式语音合成设计的创新技术。我们将剖析其核心优势,包括革命性的语音编码器、前所未有的合成时长,以及其在主观和客观评估中如何超越现有顶尖模型。同时,我们也将讨论其技术架构、应用前景以及潜在的风险与局限性。...more16minPlay
August 25, 2025DuPO:大语言模型自我验证的新范式深入探讨DuPO框架如何通过广义对偶学习实现大语言模型(LLM)的自我验证,摆脱昂贵的人工标注,提升翻译和数学推理等任务的性能,并实现训练与推理的双重优化。...more13minPlay
August 25, 2025AI Radio FM - 科技频道:ALIGNATT - 实时语音翻译的新突破本期节目深入探讨了ALIGNATT,一种利用注意力机制的音频-翻译对齐信息来指导实时语音翻译的新策略。我们揭示了它如何在离线训练模型上实现最先进的性能,显著提升翻译质量并降低延迟。...more12minPlay
August 23, 2025流媒体Sortformer:基于到达顺序的说话人缓存实时说话人识别本期节目深入探讨了NVIDIA最新发布的“流媒体Sortformer”技术,这是一种基于说话人到达时间顺序的实时说话人识别框架。我们将详细解析其核心创新——“到达顺序说话人缓存”(AOSC),以及它如何突破传统离线方法的局限,实现高效、低延迟的实时多说话人追踪。从Sortformer的诞生到流媒体扩展的精妙设计,再到在DIHARD III和CALLHOME等基准数据集上的卓越表现,我们将为您揭示这一技术如何为实时字幕、虚拟会议和对话分析等应用带来革命性变革。...more9minPlay
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 413 episodes available.