【論文紹介】Looking to listen at the cocktail party a speaker-independent audio-visual model for speech separation
社内で論文「Looking to listen at the cocktail party a speaker-independent audio-visual model for speech separation」の紹介をしました。資料を掲載します。
論文ではは音声と画像を利用して複数人の音声+ノイズから目的とする音声を抜き出す手法について提案されています。
(googleの発表資料)
https://ai.googleblog.com/2018/04/looking-to-listen-audio-visual-speech.html
関連ブログ
CollabTech Seminar in MIRU2019
来たる7月,デンソーアイティーラボラトリは,MIRU2019において企業企画イベントCollabTech Seminarを行います. 講師として,広島市立大学 日浦教授,中部大学 藤吉教授をお招きし,弊社社員とデンソー社員を交え,3次元計測…
開発ー強化ー合宿
どうも,吉田悠一です. デンソーの研修施設,AQUAWINGSを利用し,開発合宿に行ってきました. 場所 場所は,浜名湖の湖畔で,絶景の場所にあります. ファシリテーションは最高で,非常に広いスペースでガラス張りで気持ちいい空間でコードを書…
BMVC2016出張報告
9月19日〜22日にイギリスのYorkで開催されたコンピュータビジョンの学会BMVC2016に,我々の研究(”Fast Eigen Matching”)の発表と調査のため参加してきました. BMVCへの参加は初めてでしたが,コンパクトにまと…
Demitasse〜DNN高速化ライブラリを公開しました
どうも吉田悠一です. 弊社の近藤がNIPS2016のWorkshopで発表したDemitasseをオープンソースで公開します. “Satoshi Kondo, “Demitasse: SPMD Programing Implementati…
「変分ベイズ学習」の学習
機会学習プロフェッショナルシリーズの変分ベイズ学習を読んでいるときに、 もっとも引っかかった変分ベイズの停留条件の導出の式展開を真面目にやってみました。 汎関数微分や試験関数の厳密性は勘弁してください・・・・。 間違っているところがあれば、…
MIRU2016で会いましょう
MIRU2016では,弊社の安倍,近藤,佐藤,吉田の四人が発表します. 安倍・・・”整数基底分解によるDeep Neural Networkの時間・空間計算量削減” 近藤・・・”組み込み向けDNNライブラリの実装と演算性能評価” デモアプリ…
激薄レンズレスカメラ FLAT CAM:Replacing Lenses with Masks and Computationの解説
先日社内の発表会で,2015年にRice Universityが発表した激薄カメラの紹介をしました. いわゆる光学レンズを持たずに,ランダムに穴が空いたマスクを直接センサーの前に配置したハードウェア構成により薄型化を実現しています. ガジェ…
NIPS2015 参加報告
宇土です。 報告タイミングがだいぶ遅くなってしまいましたが、昨年(2015)12月に、機械学習分野のトップカンファレンスである NIPS2015 に参加し、聴講してきました。 NIPS は、ポスターセッションが非常に重視されているカンファレ…
MSC2015(CCA2015)での発表
The 2015 IEEE Multi-Conference on Systems and Control (MSC) にて発表しました(2015/9/23). Takano, G.; Obayashi, M.; Uto, K., “Pat…



