AI報報報

EP-27 新出的一款端對端AI語音模型:Voila,全雙工能同時聽和說,低延遲,預置百萬種語音 也支援ASR、TTS以及多語言語音翻譯


Listen Later

新出的一款端對端AI語音模型:Voila,全雙工能同時聽說,低延遲,預置百萬種語音也支援ASR、TTS以及多語言語音翻譯

端對端架構,支援全雙工的低延遲中斷,延遲195毫秒,超人類平均回應時間

能夠即時自主對話,持續性間歇、推理以及主動回應,透過文字指令可以定義說話者的身份以及語氣等特徵

模型:https://huggingface.co/collections/maitrix-org/voila-67e0d96962c19f221fc73fa5

留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments



Powered by Firstory Hosting
...more
View all episodesView all episodes
Download on the App Store

AI報報報By 梅森