本期节目,我们将深入探讨英伟达最新发布的Audio Flamingo 3模型。这是一款完全开源的、业界领先的大型音频语言模型,它在语音、声音和音乐的推理与理解方面取得了重大突破。我们将讨论其创新的统一音频编码器AF-Whisper、四大全新策划的训练数据集(AudioSkills-XL, LongAudio-XL, AF-Think, AF-Chat),以及其独特的五阶段课程式训练策略。此外,我们还将分析AF3如何在超过20个基准测试中超越现有模型,并探讨其在多轮多音频对话、按需思考和长音频处理方面的新功能。