AI Podcast

By weedge

Latest podcasts about AI Technology and Papers.... more

· Technology

Download on the App Store

Download on the App Store

Get it on Google Play

FAQs about AI Podcast:

How many episodes does AI Podcast have?

The podcast currently has 427 episodes available.

AI Podcast episodes:

July 10, 2025 Skywork-R1V3: 革命性的多模态推理与强化学习
深入探讨Skywork-R1V3技术报告，揭示其如何通过强化学习解锁顶尖的视觉推理能力。本期节目将剖析其独特的训练框架，包括关键的连接器模块、创新的“关键令牌熵”指标，以及使其能够媲美顶级闭源模型的一系列精巧策略。我们将一同见证开源多模态模型如何实现重大飞跃。
...more
9min
July 09, 2025 AI新范式：解读Fast and Simplex 2-单纯注意力
本期节目，我们深入探讨一篇名为《Fast and Simplex: 2-Simplicial Attention in Triton》的前沿论文，讨论它如何通过提升词元效率，挑战现有的大模型缩放定律，为人工智能的未来发展开辟新道路。
...more
7min
July 08, 2025 OmniAvatar：用音频驱动的全身动画革命
在本期节目中，我们深入探讨了 OmniAvatar，一个开创性的音频驱动全身视频生成模型。我们讨论了它如何通过创新的像素级多层次音频嵌入策略和基于 LoRA 的训练方法，解决了现有技术在唇形同步和自然身体动作方面的挑战。我们还将分析其在各种应用场景中的卓越表现，以及它如何通过精确的文本控制来生成富有表现力的虚拟人视频。
...more
6min
July 08, 2025 HumanOmniV2: 超越理解，迈向全模态推理
深入探讨HumanOmniV2论文，讨论其如何通过强制模型在推理前理解上下文，来解决多模态AI中的“捷径问题”。我们将探索其新颖的奖励机制、全新的IntentBench基准测试，以及其令人印象深刻的成果。
...more
7min
July 08, 2025 深入剖析GLM-4.1V-Thinking：迈向通用多模态推理的新篇章
在本期节目中，我们将深入探讨一款名为GLM-4.1V-Thinking的全新视觉语言模型。我们将详细解析其独特的以推理为核心的训练框架，包括大规模预训练、监督微调，以及创新的“带课程采样的强化学习”（RLCS）技术。我们将讨论该模型如何以90亿的参数规模，在多项基准测试中挑战甚至超越体量远超于它的模型（如72B模型和GPT-4o），并探讨其在跨领域泛化方面的惊人表现、面临的挑战与未来的发展方向。
...more
9min
July 07, 2025 IndexTTS2：革新语音合成的情感与时长控制
深入探讨开创性的文本转语音模型IndexTTS2。我们讨论了它在自回归系统中精确控制语音时长的独特能力、其将声音与情感分离的先进情感控制功能，以及它如何为语音质量和表现力设定新标准。
...more
9min
July 06, 2025 Kwai Keye-VL: 赋能短视频时代的80亿参数多模态大模型
深入探讨 Kwai Keye-VL 技术报告。我们将探讨其创新的架构、独特的四阶段预训练和两阶段后训练方法，以及其最先进的性能，尤其是在理解动态短视频方面。我们还将讨论其定制的基准测试 KC-MMBench 以及未来的挑战。
...more
6min
July 04, 2025 WavReward：教会AI“察言观色”的秘密武器
本期播客深入探讨了WavReward，一个专为评估端到端语音对话模型而设计的创新奖励模型。我们讨论了当前评估方法的局限性，并详细介绍了WavReward如何通过强化学习、思维链推理和非线性奖励机制，准确评估模型的“智商”和“情商”。同时，我们还介绍了为其量身定制的ChatReward-30K数据集，它如何通过丰富的声学维度和隐式对话场景，推动语音AI向更自然、更人性化的方向发展。
...more
8min
July 02, 2025 MirrorMe: 实时高保真音频驱动的半身数字人动画
本期节目深入探讨了MirrorMe框架，一个旨在解决实时、高保真、可控的音频驱动数字人动画挑战的先进技术。我们将讨论其基于LTX视频模型的创新架构，包括身份保留、音频融合和渐进式训练策略，以及它如何实现业界领先的性能和效率。
...more
10min
July 01, 2025 深入解读文心大模型4.5技术报告
在本期节目中，我们将深入探讨百度最新发布的ERNIE 4.5技术报告。我们将解析其创新的多模态异构混合专家（MoE）架构、高效的训练与推理框架，以及在各大基准测试中取得的卓越性能，全面了解这款前沿大模型的背后技术。
...more
9min

FAQs about AI Podcast:

How many episodes does AI Podcast have?

The podcast currently has 427 episodes available.