AI Podcast

By weedge

Latest podcasts about AI Technology and Papers.... more

· Technology

Download on the App Store

Download on the App Store

Get it on Google Play

FAQs about AI Podcast:

How many episodes does AI Podcast have?

The podcast currently has 427 episodes available.

AI Podcast episodes:

July 24, 2025 深入探讨Boson AI的Higgs Audio V2：开源音频生成的革命
在本期节目中，我们将深入探讨Boson AI最新发布的开源音频生成模型——Higgs Audio V2。我们将讨论其突破性的多说话人对话能力、情感表达、背后的技术创新以及在各项基准测试中的卓越表现。这不仅仅是一次技术升级，更是对未来音频交互方式的一次大胆探索。
...more
11min
July 24, 2025 揭秘字节跳动Seed LiveInterpret 2.0：AI同声传译的革命
本期播客深入探讨字节跳动发布的最新研究成果——Seed LiveInterpret 2.0。这不仅仅是一个翻译工具，更是一个能实现端到端、超低延迟、并带有语音克隆功能的同声传译系统。它如何解决行业痛点？其背后的强化学习框架和双重奖励机制又是如何运作的？我们一同揭开这项技术的神秘面纱，探讨它如何将AI同传的延迟从近10秒缩短到3秒，并在质量上超越现有商业解决方案。
...more
10min
July 24, 2025 揭秘Fast Conformer：更快、更强、更可扩展的语音识别新架构
在本期节目中，我们将深入探讨Fast Conformer模型，这是一种革命性的语音处理架构。我们将讨论其核心的下采样技术如何实现惊人的速度提升，它如何通过创新的注意力机制处理长达11小时的音频，以及它在自动语音识别（ASR）、语音翻译（ST）和口语理解（SLU）等多个任务中的卓越表现和惊人的可扩展性。
...more
9min
July 23, 2025 深入解析Seed-X：70亿参数模型如何挑战GPT-4o的翻译霸权
深入探讨全新的开源多语言翻译模型Seed-X。我们将剖析其创新的训练流程，从数据准备、预训练策略，到思维链和强化学习等高级后训练技术。我们还将解读其惊人的评测结果——这个70亿参数的模型如何与GPT-4o、Claude-3.5等巨头一较高下，并揭示其成功背后的关键洞见。
...more
9min
July 18, 2025 MirageLSD: 实时无限AI视频生成的革命
本期节目深入探讨了Decart发布的革命性AI视频模型MirageLSD。我们讨论了它如何实现零延迟、实时、无限的视频流生成，解决了困扰业界的错误累积和性能瓶颈。从“历史增强”技术到专门为GPU优化的“巨型内核”，我们将揭开这项技术的神秘面紗，并展望它对直播、游戏和视频通话的颠覆性影响。
...more
10min
July 18, 2025 深入解析Audio Flamingo 3：开启全开源音频大模型新纪元
本期节目，我们将深入探讨英伟达最新发布的Audio Flamingo 3模型。这是一款完全开源的、业界领先的大型音频语言模型，它在语音、声音和音乐的推理与理解方面取得了重大突破。我们将讨论其创新的统一音频编码器AF-Whisper、四大全新策划的训练数据集（AudioSkills-XL, LongAudio-XL, AF-Think, AF-Chat），以及其独特的五阶段课程式训练策略。此外，我们还将分析AF3如何在超过20个基准测试中超越现有模型，并探讨其在多轮多音频对话、按需思考和长音频处理方面的新功能。
...more
8min
July 15, 2025 AI模型真的需要“三思而后行”吗？深入解析NoWait技术
在本期节目中，我们深入探讨了一篇名为《我们不需要“等待”！》的前沿研究论文。该论文提出了一种名为“NoWait”的创新方法，旨在解决大型推理模型（LRMs）在推理过程中存在的“过度思考”问题。我们将讨论这种方法如何通过在推理时抑制“等待”、“嗯”等反思性词语，在不牺牲模型准确性的前提下，将思想链（CoT）的长度缩短高达51%，从而大幅提升文本、视觉乃至视频等多模态任务的推理效率。这是一种即插即用的解决方案，为高效、实用的多模态推理提供了全新的视角。
...more
10min
July 15, 2025 天工-VL奖励模型：多模态对齐新篇章
深入探讨天工-VL奖励模型(Skywork-VL Reward)，本期播客将详细解析其创新的数据集构建方法、独特的模型架构，以及在多模态AI评估中取得的顶尖性能。我们将讨论它如何解决现有模型的局限性，并在幻觉检测和复杂推理任务中树立新的标杆。
...more
9min
July 14, 2025 WebSailor：引领超越人类推理的网络智能体
在本期节目中，我们将深入探讨来自阿里巴巴通义实验室的最新研究成果 WebSailor。该研究提出了一套完整的后训练方法，旨在解决开源大型语言模型在复杂信息检索任务中面临的“极端不确定性”挑战，从而弥合与顶级专有系统之间的能力差距。我们将讨论其创新的数据合成技术 SailorFog-QA、独特的专家轨迹重构方法，以及高效的强化学习算法 DUPO。欢迎收听。
...more
10min
July 14, 2025 CCQ：压缩巨兽 - 两比特大语言模型的革命
本期播客深入探讨了名为CCQ（卷积码量化）的突破性技术。面对大型语言模型（LLMs）日益增长的部署成本和障碍，CCQ提出了一种创新的极低比特量化方案。我们将讨论CCQ如何通过结合卷积码、混合编码和码簇等技术，在几乎不损失模型精度的前提下，将模型压缩至2.0到2.75比特。同时，我们也会探讨其独特的免查找表和位移解码设计如何解决了传统矢量量化的推理速度瓶颈，并实现了在单个GPU上部署超大型模型（如文心4.5）的壮举。欢迎收听，了解这项可能改变大模型部署格局的黑科技。
...more
9min

FAQs about AI Podcast:

How many episodes does AI Podcast have?

The podcast currently has 427 episodes available.