Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 427 episodes available.
November 27, 2025解锁音频智能:Step-Audio-R1如何让声音“深思熟虑”本期节目,我们将深入探讨Step-Audio-R1模型,它如何突破音频领域长久以来的“推理困境”,首次成功实现音频的深度推理能力。我们将揭秘其创新的模态融合推理蒸馏(MGRD)框架,以及它在语音理解、环境音分析和音乐鉴赏等方面的卓越表现,并探讨它如何超越现有顶尖模型,开启多模态推理系统的新篇章。...more12minPlay
November 20, 2025ParaS2S:解锁智能语音助手情绪和风格感知的未来深入探讨字节跳动与台湾大学合作的ParaS2S框架,一个旨在提升语音到语音(S2S)模型副语言感知能力(如情感、语调、说话者属性)的创新基准和强化学习对齐框架。我们揭示了现有S2S模型的“语调迟钝”问题,并展示了ParaS2S如何在大幅减少标注成本的同时,实现内容和风格匹配度的显著提升,引领S2S交互迈向更自然、更人性化的新时代。...more12minPlay
November 20, 2025VASA-3D:单张图像驱动的超逼真3D高斯头部化身深入探讨VASA-3D如何从单张肖像图生成实时、栩栩如生的3D头部化身,其背后融合了VASA-1的强大2D动态捕捉能力和3D Gaussian Splatting技术。我们将解析这项创新技术如何克服传统挑战,实现前所未有的表情细节和沉浸式虚拟互动,并探讨其在AI应用及负责任AI方面的考量。...more13minPlay
November 19, 2025AgentEvolver:迈向高效自进化智能体系统本期节目深入探讨AgentEvolver,一个创新性的自进化智能体系统,它通过“自提问”、“自导航”和“自归因”三大核心机制,显著提升了大型语言模型(LLM)驱动智能体的学习效率和自主性,解决了传统训练中任务稀缺、探索低效和样本利用率低的问题。...more17minPlay
November 18, 2025明-全能:多模态统一感知与生成模型的突破本期节目将深入探讨“明-全能”(Ming-Omni)模型,这是一个创新的统一多模态模型,它能够处理图像、文本、音频和视频,并在语音和图像生成方面展现出卓越能力。我们将揭示其独特的架构设计、创新的训练策略以及在多项基准测试中取得的领先成果,特别是其作为首个开源模型对标GPT-4o的里程碑意义。...more11minPlay
November 18, 2025OmniVinci:开放全模态大模型的未来揭秘欢迎收听AI Radio FM - 科技频道!本期节目我们将深入探讨NVIDIA最新发布的OmniVinci项目,一个旨在构建强大、开源全模态大模型的创新计划。我们将详细解析其革命性的模型架构设计,包括OmniAlignNet、时序嵌入分组和受限旋转时间嵌入,以及独特的数据策展和训练策略。weedge专家将带我们了解OmniVinci如何在性能上超越现有模型,同时大幅提升训练效率,并在机器人、医疗AI和智能工厂等多个下游应用中展现出非凡潜力。准备好一起探索全模态理解的未来了吗?...more11minPlay
November 18, 2025探索LongCat-Flash-Omni:5600亿参数全模态巨兽的实时音视频交互秘密欢迎收听AI Radio FM - 科技频道!本期节目,我们将深入探讨美团LongCat团队发布的LongCat-Flash-Omni,一个拥有5600亿参数的开源全模态模型。我们将揭秘其卓越的实时音视频交互能力、创新的多阶段训练策略、高效的训练基础设施,以及它如何克服多模态领域的重重挑战,成为开源社区的SOTA。从架构设计到数据策略,从预训练到推理部署,Weedge专家将带我们一探究竟,感受人工智能通用能力的未来。...more17minPlay
November 16, 2025AI电台FM - 科技频道:自我演化智能体:通往人工超级智能之路本期节目深入探讨了自我演化智能体的最新研究综述,揭示了它们如何从静态大型语言模型演变为能自主学习、适应和改进的动态系统。我们将分析智能体演化的核心维度——演化什么、何时演化、如何演化,以及其在编码、医疗、教育等领域的应用和未来发展方向。...more23minPlay
November 13, 2025智能体组织时代:语言模型如何学会异步思考深入探讨AsyncThink,一种新颖的LLM推理范式,它通过组织者-工作者协议、两阶段训练以及强化学习,实现了更高效、更准确的复杂问题解决能力,并能泛化到新任务。我们将详细解读其核心机制、训练过程、实验结果以及未来潜力。...more22minPlay
November 12, 2025MemOS:AI系统的记忆操作系统——革新LLM的记忆能力本期节目,我们将深入探讨 MemOS,一个专为大型语言模型(LLM)设计的记忆操作系统。我们将解析其如何统一管理参数记忆、激活记忆和明文记忆,通过创新的 MemCube 概念,赋予LLM卓越的记忆可控性、可塑性和可演化性。从长程依赖到知识演化,再到个性化定制和跨平台迁移,MemOS 不仅解决了现有LLM的记忆瓶颈,更预示着未来AI系统持续学习和自我进化的新范式。加入我们,一同见证LLM记忆管理的革命性突破!...more7minPlay
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 427 episodes available.