AI Podcast

By weedge

Latest podcasts about AI Technology and Papers.... more

· Technology

Download on the App Store

Download on the App Store

Get it on Google Play

FAQs about AI Podcast:

How many episodes does AI Podcast have?

The podcast currently has 427 episodes available.

AI Podcast episodes:

July 01, 2025 GUIRoboTron-Speech：用声音操控万物，AI交互新革命
在本期节目中，我们将深入探讨 GUIRoboTron-Speech，这是首个能够直接通过语音指令和屏幕截图来操作手机和电脑的端到端自主GUI代理。我们讨论了它如何解决现有基于文本的AI代理的局限性，特别是在需要解放双手的场景中。我们还将揭示其创新的数据收集方法，即利用随机音色的文本转语音技术（TTS）来创建训练数据，以及其独特的“混合指令训练策略”如何克服了预训练模型中的“模态不平衡”问题。最后，我们将分析其实验结果，证明语音作为一种指令模态在驱动GUI代理方面的巨大潜力和广泛适用性。
...more
9min
June 29, 2025 Stream-Omni: 高效灵活的多模态交互新范式
深入探讨Stream-Omni模型，解析其如何创新性地对齐文本、视觉和语音。我们将讨论其独特的架构、高效的训练过程，以及在创建无缝、实时多模态体验方面的卓越表现。
...more
9min
June 28, 2025 让他们开口：音频驱动的多人对话视频生成
本期节目深入探讨了名为MultiTalk的创新框架，该框架专注于一项全新任务：音频驱动的多人对话视频生成。我们讨论了该技术如何解决多路音频与视频中人物的精确绑定问题，特别是通过一种名为L-RoPE（标签旋转位置嵌入）的新方法。此外，我们还将揭示其独特的训练策略，例如部分参数训练和多任务训练，是如何在保留模型指令遵循能力方面发挥关键作用的。
...more
8min
June 26, 2025 深入探讨OmniGen2：迈向高级多模态生成
本期节目，我们深入探讨了OmniGen2这一先进的开源多模态生成模型，涵盖其创新的模型架构、独特的数据集构建策略、全新的OmniContext评测基准，以及在各项生成任务上的实验表现和未来展望。
...more
11min
June 23, 2025 深入探讨Ming-Omni：统一多模态感知与生成模型
本期播客将深入探讨 Ming-Omni，一个统一的多模态模型，它能够处理图像、文本、音频和视频，并在语音和图像生成方面表现出色。我们将讨论其核心架构、训练方法、数据构建以及在各项基准测试中的卓越表现。
...more
15min
June 20, 2025 揭秘混元视频数字人：高保真音频驱动的多角色动画技术
深入探讨腾讯混元最新的HunyuanVideo-Avatar技术，它如何通过创新的角色图像注入、音频情感模块和面部感知音频适配器，实现动态、情感可控的多角色对话视频生成。
...more
17min
June 16, 2025 AdaMesh深入解析：个性化3D面部动画的革新
本期AI Radio FM技术频道，我们邀请专家weedge与主持人共同探讨AdaMesh技术。AdaMesh能够从短短10秒的参考视频中学习个性化的说话风格，生成包含丰富面部表情和多样头部姿态的3D面部动画。我们将深入剖析其核心组件，如针对表情的MoLoRA技术和针对头部姿态的语义感知适配策略，并讨论其在虚拟现实、电影制作等领域的巨大潜力。
...more
8min
June 16, 2025 EmoTalk：语音驱动的3D人脸动画情感解耦技术深度解析
本期播客深入探讨了EmoTalk技术，一种旨在从语音中解耦内容和情感，以生成富有表现力的3D人脸动画的端到端神经网络。我们将讨论其核心组件、创新的数据集构建以及实验结果。
...more
14min
June 16, 2025 TaoAvatar：实时逼真的全身对话虚拟化身与增强现实
本期播客深入探讨了 TaoAvatar 技术，一种基于三维高斯散点的实时、逼真全身对话虚拟化身创建方法，特别关注其在增强现实设备上的应用、创新点、性能表现以及面临的挑战。
...more
14min
June 16, 2025 LAM解读：单张图片生成可动高斯头部模型的革命
深入探讨LAM（大型虚拟形象模型）如何通过单张图像实现可立即动画化和渲染的高斯头部模型。我们将讨论其创新方法、核心技术（如FLAME模型集成、Transformer架构和高斯溅射）、与现有方法的比较、多平台部署能力以及未来的应用前景与局限性。
...more
15min

FAQs about AI Podcast:

How many episodes does AI Podcast have?

The podcast currently has 427 episodes available.