AI報報報

EP-16 實用的一個跨空間語音翻譯專案:Spatial-Speech-Translation 可透過雙耳穿戴裝置在多說話和乾擾條件下進行語音翻譯,並且能保留聲音原來的方向感


Listen Later

Spatial Speech Translation: Translating Across Space With Binaural Hearables

的官方GitHub程式碼庫。程式碼庫提供了用於實現空間語音翻譯功能的資源與程式碼,特別強調在多講者與干擾環境下進行語音翻譯。

專案目標是開發一個能即時在Apple晶片上運行的語音翻譯模型,並透過雙耳渲染保留聲音的空間線索。此外,程式碼庫也包含了Fr-En語言翻譯的推論與訓練程式碼,以及針對其他語言(如德語和西班牙語)的資料集與檢查點的開源計畫。其中提供了環境設置和模型訓練與推論的詳細步驟。

github:https://github.com/chentuochao/Spatial-Speech-Translation

留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments



Powered by Firstory Hosting
...more
View all episodesView all episodes
Download on the App Store

AI報報報By 梅森