MENU

Interview ラボの人々

最先端のCV実装に
立ちはだかる無数の壁
自分で選んだ研究が突破口に

研究開発グループ
プリンシパルリサーチャ

2007年入社

吉田 悠一

研究開発グループ
シニアリサーチャ

2011年入社

関川 雄介

人間の効率的な視覚認識に挑むCV

関川

コンピュータービジョン(CV)の研究の領域は広いのですが、私は主に自動運転やADASに利用できる視覚情報のニューラルネットを使った処理について研究しています。もう少し具体的には、安全で快適な運転アシストや自動運転の実現にむけて、カメラに代表されるビジョン信号を処理して外界を認識するという研究をしています。

ビジョン信号はデータ量が大きいので、「効率的な処理」が重要になります。イベントカメラというセンサーが、生物の目と同じように動きを検出しているところに面白さを感じて、CV分野の本流からは少し離れますが、この変化の信号をうまく処理できたら圧倒的な効率アップを実現できるのでは?という思いで、この信号処理に特化したニューラルネットワークの研究を始めました。その他にも、効率的な認識という流れで、ニューラルネットワークの圧縮も研究しています。枝刈りと呼ばれる圧縮技術をビット単位で精緻に行うことで精度劣化を抑えたBit-Pruningや、NVIDIA社などが提供する汎用GPUに搭載されるスパース演算器を本来の用途とは異なる方法で活用して演算量の削減を実現した有構造特徴MAPスパース化などの圧縮技術を開発しました。これらの技術は機械学習分野のトップカンファレンスである「ICLR」などでの発表を通じて社外へのアピールも行っています。

吉田

私はロボットビジョンをテーマに研究しています。主な応用分野は生産現場で、特に検査工程の自動化に取り組んでいます。現在、人の目で行われている検査作業を、さまざまな種類のカメラを使って自動化することが目的です。例えば、iPhoneに内蔵されているようなRGBカメラのほか、周波数ごとの光を細かく分けて捉える分光カメラ、物体の状態を偏光によって可視化するカメラ、複数のカメラを並べて同時に異なる方向から撮影するマルチカメラなどがあります。こうした多様なカメラを活用することで、高精度かつ効率的な検査を実現しようとしています。

もう1つは、ロボットをコントロールするためのビジョンです。生産現場で、例えばネジ締め作業をロボットで自動化する場合、従来のロボットは予めプログラムされた位置にネジが置かれていることを前提に動作します。このシステムを機能させるためには、現場の人々による緻密な調整が不可欠であり、多大な時間を要します。しかし、CVをロボットの目とすることができれば、今までは目をつぶってネジの位置とネジ穴の位置がここにあると信じて動作していたロボットが、ネジとネジ穴の位置を自分で認識して自分で取り付けられるようになります。この技術は、組み立て作業だけでなく、今、世界的に取り組みが徐々に始まっているクルマのリサイクルのための分解にも役立ちます。例えば、自動車を解体する場合、それぞれコンディションが少しずつ違うので、どこに何があるかを見て作業を判断する必要があります。エコノミーの実現にもつながる技術となります。

言語モデルとの組み合わせは精度とスピードと省電力が課題

関川

最近はCVを含むマルチモーダルな生成AIが着目されています。AD/ADAS分野ですと、たとえば実際には収集が難しい危険シーンをテキストから生成し、それを学習データとして活用したり、自動運転中に言語で運転を指示するような応用が期待されています。このような分野は研究者・計算機ともに大規模なリソースが必要な分野であり、デンソー本社や大学などとのさらなる連携が重要になってくると考えています。

吉田

すでに、LLMとの組み合わせで、色々できるようになってきていますが、まだまだ現場では使えないことが多いですね。例えば、画像を見せて「ここに何か異常なものが映ってないですか?」と聞いたら検知してくれるような技術も出てきてはいますが、実際の生産現場では検知速度が部品がラインを流れる速度に追いつけない。先端のすごい技術を、何に使うか、どうやって現実に落としていくかが重要となります。そこで問題なのは「精度とスピードとコストのバランス」なので、どうやってそれらを改善し、向上させて、問題を解いていくかというのが、私たちが取り組む次のステップの研究なのかなと思っています。

関川

生成AIは扱えるモダリティやできることが増えたりとどんどん賢くなってきています。ところが、人間なら小さいエネルギーで処理できることに何万キロワットというエネルギーを使います。工場や車などのエッジ端末には、このままでは実装できません。だからこそ、消費電力の低減は非常に重要なトピックとなります。高性能なAIをいかにコンパクトにしてエッジで動くようにするかというのは面白いテーマですし、デンソーの事業に貢献できる分野でもあります。このような困難な課題を先端研究で解決することがITLABの存在意義だと考えます。

アカデミアでの活躍と研究成果の社会実装の両方がモチベーションになる

関川

ITLABで研究することのモチベーションは人それぞれだと思います。私の場合はトップカンファレンスで論文が採択されたら嬉しいし、自分が開発した技術が製品に使われて世の中に出ていけば嬉しい。もちろん、日々の実験で今までよりも良い結果が出たら嬉しい、というところもモチベーションです。

吉田

私は自分の研究成果を誰かに使ってもらうこと以外には興味がないです。私にとってITLABの良いところの一つは、一番実装に近い出口としてデンソーがあることで、これまでにもいくつか自分の技術がデンソーや子会社のサービスに実装されています。自動車の技術の実装は製造ラインを変えないといけないので、ロールアウトまでにちょっと時間がかかりますが、新事業や、私のように生産系の技術だと導入の機会はそれなりにあります。

関川

良くも悪くも、テーマ設定の自由度が非常に高いのがITLABの特徴です。新卒の研究者でも、デンソーのビジネスに貢献できるようなストーリーが描ければ自分で自由にテーマ設定できます。これは裏を返せば、「与えられたテーマで研究するのが好き」という人にはちょっと厳しいということでもあります。「これをやりたい」という強い思いがある人、ビジョンやコンセプトから研究していきたいという人がITLABには向いているのかなと思います。

吉田

これからは、よりロボット寄りのテーマに力を入れて研究していきたいと考えています。これまでは、ITLABがソフトウェア、デンソーがハードウェアというように、それぞれの役割が分かれていましたが、その境界を越えたところに重要な課題があるように感じています。

ITLABはソフトウェアの研究者が集まる場なので、「ロボット」というハードウェアに関わるテーマがどこまで研究として成立するかは難しい面もありますが、それでもなお、私はその領域に踏み込んで追求していきたいと思っています。

関川

先ほど、自由にテーマ設定できるのがITLABのいいところと言いましたが、一人で決めるテーマはどうしても小さくなりがちで、規模の大きい研究がなかなかできないという側面もあります。デンソー、協力会社、東京科学大学の学生などとチームアップして、「効率的なAIの実現」という、たぶん私一人ではできないと思う大きなテーマに挑戦していきたいと思っています。

採用情報