May 07, 2025

EP-27 新出的一款端對端AI語音模型：Voila，全雙工能同時聽和說，低延遲，預置百萬種語音也支援ASR、TTS以及多語言語音翻譯

4 minutes

新出的一款端對端AI語音模型：Voila，全雙工能同時聽說，低延遲，預置百萬種語音也支援ASR、TTS以及多語言語音翻譯

端對端架構，支援全雙工的低延遲中斷，延遲195毫秒，超人類平均回應時間

能夠即時自主對話，持續性間歇、推理以及主動回應，透過文字指令可以定義說話者的身份以及語氣等特徵

模型：https://huggingface.co/collections/maitrix-org/voila-67e0d96962c19f221fc73fa5

留言告訴我你對這一集的想法： https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments

...more

View all episodes

By 梅森

May 07, 2025

EP-27 新出的一款端對端AI語音模型：Voila，全雙工能同時聽和說，低延遲，預置百萬種語音也支援ASR、TTS以及多語言語音翻譯

4 minutes

...more

Share EP-27 新出的一款端對端AI語音模型：Voila，全雙工能同時聽和說，低延遲，預置百萬種語音也支援ASR、TTS以及多語言語音翻譯

Sign up to save your podcasts

EP-27 新出的一款端對端AI語音模型：Voila，全雙工能同時聽和說，低延遲，預置百萬種語音也支援ASR、TTS以及多語言語音翻譯

EP-27 新出的一款端對端AI語音模型：Voila，全雙工能同時聽和說，低延遲，預置百萬種語音也支援ASR、TTS以及多語言語音翻譯