Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 413 episodes available.
June 23, 2025深入探讨Ming-Omni:统一多模态感知与生成模型本期播客将深入探讨 Ming-Omni,一个统一的多模态模型,它能够处理图像、文本、音频和视频,并在语音和图像生成方面表现出色。我们将讨论其核心架构、训练方法、数据构建以及在各项基准测试中的卓越表现。...more15minPlay
June 20, 2025揭秘混元视频数字人:高保真音频驱动的多角色动画技术深入探讨腾讯混元最新的HunyuanVideo-Avatar技术,它如何通过创新的角色图像注入、音频情感模块和面部感知音频适配器,实现动态、情感可控的多角色对话视频生成。...more17minPlay
June 16, 2025AdaMesh深入解析:个性化3D面部动画的革新本期AI Radio FM技术频道,我们邀请专家weedge与主持人共同探讨AdaMesh技术。AdaMesh能够从短短10秒的参考视频中学习个性化的说话风格,生成包含丰富面部表情和多样头部姿态的3D面部动画。我们将深入剖析其核心组件,如针对表情的MoLoRA技术和针对头部姿态的语义感知适配策略,并讨论其在虚拟现实、电影制作等领域的巨大潜力。...more8minPlay
June 16, 2025EmoTalk:语音驱动的3D人脸动画情感解耦技术深度解析本期播客深入探讨了EmoTalk技术,一种旨在从语音中解耦内容和情感,以生成富有表现力的3D人脸动画的端到端神经网络。我们将讨论其核心组件、创新的数据集构建以及实验结果。...more14minPlay
June 16, 2025TaoAvatar:实时逼真的全身对话虚拟化身与增强现实本期播客深入探讨了 TaoAvatar 技术,一种基于三维高斯散点的实时、逼真全身对话虚拟化身创建方法,特别关注其在增强现实设备上的应用、创新点、性能表现以及面临的挑战。...more14minPlay
June 16, 2025LAM解读:单张图片生成可动高斯头部模型的革命深入探讨LAM(大型虚拟形象模型)如何通过单张图像实现可立即动画化和渲染的高斯头部模型。我们将讨论其创新方法、核心技术(如FLAME模型集成、Transformer架构和高斯溅射)、与现有方法的比较、多平台部署能力以及未来的应用前景与局限性。...more15minPlay
June 16, 2025MuseTalk专题:实时高保真视频配音的革新深入探讨MuseTalk如何通过创新的时空采样策略和两阶段训练框架,解决视频配音中的“三难困境”,实现实时、高保真的口型同步效果。讨论其核心技术、实验结果以及对未来多媒体应用的影响。...more12minPlay
June 16, 2025文本语音驱动的全身动画技术深度解析本期节目深入探讨了一项前沿的全身动画合成系统,该系统能够根据输入的文本和语音实时生成逼真的面部表情和身体动作。我们详细解析了其面部动画的深度学习方法和身体动画的图模型方法,以及它们如何协同工作,实现高度同步和富有表现力的虚拟形象动画。...more12minPlay
June 10, 2025深入探讨对数线性注意力机制本期播客,我们深入探讨了一篇关于“对数线性注意力”(Log-Linear Attention)的最新研究论文,这是一种旨在平衡传统注意力机制的表达能力与线性注意力机制计算效率的新方法。我们将讨论其核心思想、技术实现、实验结果以及潜在影响。...more10minPlay
June 09, 2025AI Radio FM - 技术频道:深入探讨Skywork R1V2的多模态混合强化学习推理本期播客深入探讨了下一代多模态推理模型 Skywork R1V2。我们讨论了其核心的混合强化学习范式(MPO 和 GRPO 的结合)、创新的选择性样本缓冲(SSB)机制,以及它如何在解决复杂推理任务的同时平衡泛化能力并减少视觉幻觉。节目还将涵盖其在多个基准测试中的卓越表现、与现有模型的对比,以及对未来多模态人工智能发展的启示。...more16minPlay
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 413 episodes available.