Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 399 episodes available.
May 01, 2025DeepSeek-Prover-V2: 形式化数学推理的新篇章本期节目深入探讨 DeepSeek-AI 开源的 DeepSeek-Prover-V2 模型。我们讨论了它如何利用 DeepSeek-V3 进行子目标分解,结合强化学习,在 Lean 4 形式化定理证明中取得突破性进展,特别是在 MiniF2F 和 PutnamBench 等基准测试上的卓越表现,以及新引入的 ProverBench 和 AIME 问题的挑战。...more9minPlay
April 28, 2025Step1X-Edit:缩小开源与闭源图像编辑差距本期节目深入探讨了最新的开源图像编辑模型 Step1X-Edit。我们将讨论其创新的数据创建流程、模型架构、全新的 GEdit-Bench 评估基准,以及它如何在性能上追赶甚至超越 GPT-4o 等顶尖闭源模型。...more10minPlay
April 28, 2025AI Radio FM: 深入探讨UI-TARS - 下一代原生GUI智能体本期AI Radio FM深入探讨了UI-TARS这篇开创性的论文,讨论了原生图形用户界面(GUI)智能体的演进、核心能力以及UI-TARS模型本身。我们分析了其架构、创新的感知、动作建模、系统2推理和迭代学习机制,并解读了其在多个基准测试中超越现有框架(如GPT-4o和Claude)的卓越表现。...more14minPlay
April 26, 2025AI Radio FM - Technology Channel: MoonCast 播客生成技术深度解析深入探讨 MoonCast 技术,一个用于高质量零样本播客生成的解决方案。讨论其如何解决长语音和自发性对话的挑战,采用长上下文语言模型和创新的剧本生成模块,实现从纯文本生成自然、多说话人的播客语音。...more12minPlay
April 26, 2025Kimi-Audio 技术报告深度解读深入探讨 Kimi-Audio,一个开源的音频基础模型。我们将讨论其架构、数据处理、训练方法、评估结果以及未来的挑战与机遇。...more14minPlay
April 22, 2025深入探讨MAGI-1:下一代自回归视频生成模型本期节目,我们深入探讨了Sand AI的最新研究成果MAGI-1,一个大规模自回归视频生成模型。我们讨论了它的核心原理、创新架构、训练策略、强大的功能(如实时流生成、块级可控性、物理模拟)以及其背后的先进基础设施和评估结果。...more17minPlay
April 22, 2025深入探讨MagiAttention:为超长上下文和异构掩码训练实现线性可扩展性本期AI Radio FM - 技术频道,我们将深入探讨MagiAttention,这是一种创新的分布式注意力机制,旨在解决训练具有超长上下文(如视频生成模型)和复杂异构注意力掩码的大规模模型时面临的挑战。我们将讨论其核心组件,包括Flex-Flash-Attention内核、计算负载均衡策略、零冗余通信原语以及多阶段重叠技术,并分析其如何在实验中实现近乎线性的可扩展性。...more11minPlay
April 19, 2025AI Radio FM: 深入探讨 BitNet b1.58 2B4T - 首个开源原生1比特大语言模型在本期 AI Radio FM - 技术频道中,我们深入探讨了 BitNet b1.58 2B4T 的技术报告。这是一款开创性的 20 亿参数、原生 1 比特大语言模型,经过 4 万亿 token 训练。我们讨论了它的架构创新、独特的训练方法、与全精度及其他量化模型的性能比较,以及它在大幅降低内存占用、能耗和延迟方面的显著优势。加入我们,了解这款模型如何挑战全精度权重对于高性能 LLM 的必要性,并为资源受限环境中的强大 AI 部署开辟新途径。...more9minPlay
April 12, 2025Muon 优化器:扩展大语言模型训练的新前沿本期 AI Radio FM - Technology Channel 深入探讨了基于矩阵正交化的 Muon 优化器如何通过关键技术扩展到大规模语言模型训练,并介绍了使用 Muon 训练的 Moonlight 模型及其卓越性能。...more14minPlay
April 10, 2025Kimi-VL: 高效开源混合专家视觉语言模型本播客将深入探讨 Kimi-VL,一款高效的开源混合专家(MoE)视觉语言模型(VLM)。它在多模态推理、长文本理解和强大的代理能力方面表现出色,同时仅激活语言解码器中的 28 亿参数。我们将讨论其架构、预训练阶段、性能以及未来的发展方向。...more8minPlay
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 399 episodes available.