AI Podcast

MinMo:多模态大型语言模型,实现无缝语音交互


Listen Later

本播客深入探讨了阿里巴巴 Tongyi Lab 的 MinMo 模型,这是一种旨在实现无缝语音交互的多模态大型语言模型。我们讨论了其架构、训练过程以及在各种语音任务中的性能,包括语音识别、翻译、情感识别和全双工对话。
...more
View all episodesView all episodes
Download on the App Store

AI PodcastBy weedge