AI Podcast

深入剖析MiniMax-Speech:引领TTS新时代的语音合成技术


Listen Later

本期节目,我们将深入探讨MiniMax-Speech,一款基于自回归Transformer的文本转语音模型。我们将揭示其可学习说话人编码器和创新的Flow-VAE架构如何实现高质量的零样本语音克隆,支持32种语言,并在多项评测中取得SOTA成绩。同时,我们还会讨论其在情感控制、文本生成音色和专业语音克隆等方面的强大扩展能力。
...more
View all episodesView all episodes
Download on the App Store

AI PodcastBy weedge