MENU

Tech Blog 技術者ブログ

2018.05.16

未分類

【論文紹介】Looking to listen at the cocktail party a speaker-independent audio-visual model for speech separation

山本光穂

山本光穂

社内で論文「Looking to listen at the cocktail party a speaker-independent audio-visual model for speech separation」の紹介をしました。資料を掲載します。

論文ではは音声と画像を利用して複数人の音声+ノイズから目的とする音声を抜き出す手法について提案されています。

(googleの発表資料)
https://ai.googleblog.com/2018/04/looking-to-listen-audio-visual-speech.html

Archive

テクノロジー・オブ・ザ・イヤー優秀賞を受賞しました

テクノロジー・オブ・ザ・イヤー優秀賞を受賞しました

2024年のクリスマスパーティが開催されました

2024年のクリスマスパーティが開催されました

マルチコンディション学習で多言語対応の合成音声評価が可能になるメカニズムを解明［GCCE 2022］

マルチコンディション学習で多言語対応の合成音声評価が可能になるメカニズムを解明［GCCE 2022］

イベントカメラの出力をもとに少ない計算量で高速に動きを認識 [CVPR2023]

イベントカメラの出力をもとに少ない計算量で高速に動きを認識 [CVPR2023]

Category

イベント未分類プログラミングプレス・リリース研究紹介インタビュー雑談輪講

ホーム

研究を知る技術者ブログ【論文紹介】Looking to listen at the cocktail party a speaker-independent audio-visual model for speech separation