Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 397 episodes available.
May 21, 2025SmolVLM 深度解析:小模型,大作为!重新定义高效多模态AI本期AI Radio FM科技频道,我们深入探讨SmolVLM这一系列开创性的小型多模态模型。了解它们如何在极低的资源消耗下实现卓越性能,挑战大型模型的局限,并推动AI在边缘设备上的应用。从架构设计到指令调优,再到惊人的实验结果,一起揭秘SmolVLM的创新之处!...more11minPlay
May 20, 2025AI Radio FM - Technology Channel: MobileCLIP - 快速高效的图文模型与多模态强化训练本期播客将深入探讨 MobileCLIP,这是一系列专为移动设备优化的新型高效图文模型。我们将讨论其创新的多模态强化训练方法,如何通过合成字幕和强大的 CLIP 模型集成来提升小型模型的准确性和训练效率,以及它在零样本分类、图像文本检索和组合理解方面的卓越表现。...more15minPlay
May 20, 2025FastViT 探秘:速度与精度并存的混合视觉Transformer本期节目深入探讨苹果公司最新推出的FastViT模型。我们将揭示其核心创新点,如RepMixer、训练时过参数化和大型卷积核的应用,如何帮助FastViT在移动设备和GPU上实现领先的延迟-精度平衡,并在图像分类、目标检测、分割及3D手部姿态估计等多种任务中展现卓越性能与鲁棒性。...more14minPlay
May 19, 2025视觉指令调优:LLaVA的探索与实践本期AI广播FM科技频道,我们深入探讨开创性的“视觉指令调优”技术,特别是LLaVA模型。我们将讨论它如何通过GPT辅助生成多模态指令数据,其创新的模型架构、训练方法,以及在多模态聊天和科学问答等任务上的惊人表现。...more13minPlay
May 19, 2025FastVLM:视觉语言模型的高效视觉编码革命本期节目,我们深入探讨 FastVLM,这是一种创新的视觉语言模型,它通过新颖的 FastViTHD 混合视觉编码器,在处理高分辨率图像时实现了前所未有的速度和效率,同时保持了卓越的性能。我们将讨论其架构设计、与现有模型的对比优势,以及它如何平衡分辨率、延迟和准确性,为视觉语言模型领域带来重大突破。...more11minPlay
May 17, 2025深入剖析MiniMax-Speech:引领TTS新时代的语音合成技术本期节目,我们将深入探讨MiniMax-Speech,一款基于自回归Transformer的文本转语音模型。我们将揭示其可学习说话人编码器和创新的Flow-VAE架构如何实现高质量的零样本语音克隆,支持32种语言,并在多项评测中取得SOTA成绩。同时,我们还会讨论其在情感控制、文本生成音色和专业语音克隆等方面的强大扩展能力。...more11minPlay
May 17, 2025AI Radio FM - 科技频道:快速文本到音频生成的对抗性后训练技术 ARC 深度解析本期 AI Radio FM 科技频道,我们深入探讨了创新的 ARC (对抗性相对性对比) 后训练技术,该技术旨在大幅提升文本到音频模型的生成速度,同时保持高质量和多样性输出。我们将讨论其核心机制、实验结果以及在边缘设备和创意应用中的潜力。...more10minPlay
May 16, 2025深入探讨DeepSeek-V3:扩展挑战与AI硬件架构的反思本期播客深入剖析了DeepSeek-V3模型,探讨了其在扩展性方面面临的挑战,以及对未来人工智能硬件架构的深刻反思。我们讨论了硬件感知模型协同设计的关键创新,如多头潜在注意力(MLA)、专家混合(MoE)架构、FP8混合精度训练和多平面网络拓扑,以及这些技术如何应对内存容量、计算效率和互连带宽的限制。...more29minPlay
May 15, 2025FastVLM:视觉语言模型的高效视觉编码本期节目深入探讨 FastVLM,一种旨在优化视觉语言模型(VLM)中图像编码效率的新模型。我们将讨论 FastVLM 如何通过其核心组件 FastViTHD 实现高分辨率图像的高效处理,显著降低延迟,并与现有技术进行性能比较。...more22minPlay
May 14, 2025深入解析Qwen3:通义千问的最新力作!本期节目,我们将深入探讨通义千问团队最新发布的Qwen3系列大语言模型。从创新的“思考模式”与“非思考模式”统一框架,到惊人的多语言能力和各项基准测试中的SOTA表现,我们将全面解读Qwen3的技术亮点和未来展望。...more17minPlay
FAQs about AI Podcast:How many episodes does AI Podcast have?The podcast currently has 397 episodes available.