Leading NLP Ninja

ep49 (ICASSP): Looking Enhances Listening: Recovering Missing Speech Using Images


Listen Later

ICASSP 2020より,ビジュアル情報を利用し,マスクされた音声信号を復元できるマルチモーダルASRを解説しました.

今回紹介した記事はこちらのissueで解説しています. https://github.com/jojonki/arXivNotes/issues/384

サポーターも募集中です. https://www.patreon.com/jojonki

...more
View all episodesView all episodes
Download on the App Store

Leading NLP NinjaBy jojonki