「自動運転」で手放し運転できる日は来るか カギを握るのは「コンピューターの目」

ブックマーク

記事をマイページに保存
できます。
無料会員登録はこちら
はこちら

印刷ページの表示はログインが必要です。

無料会員登録はこちら

はこちら

縮小

ただし近年の大いなる進歩は主に、画像認識の分野に留まっていた。次なるフロンティアが一般視覚知識の分野であることで専門家の意見は一致している。つまり、理解の対象がモノだけでなく動きや行動にも広がるのだ。

コンピュータ知能は人間の頭の働きをまねたものが多い。だからコンピュータ科学の分野でよく比喩が使われるのも当然だろう。たとえばコンピュータビジョンの未来を語る際によく使われる比喩が「子ども」と「脳」だ。

子どものような学びへの期待

子どもの成長の過程を模したモデルとは、子どものように(つまりある程度は大人の指導を受けながら、でも大半は自力で)物事を学んでいくアルゴリズムの開発を意味する。従来のように人間が分類した大量の訓練用データに頼るのではない。「まだ初期段階だが、徐々に次の段階に進んでいる」とマリクは言う。

またコンピュータの世界における「脳」とは、実際に目指すべきロードマップと言うよりは主にインスピレーションとしての比喩だ。人工知能の専門家は、飛行機は鳥のように飛ぶけれど羽ばたいたりはしないという言い方をよくするが、コンピュータの動作も生物学的システムとは異なっている。

だがマサチューセッツ工科大学(MIT)マクガバン脳研究所のトマソ・ポッジオ教授は、脳の視覚野を元にしたコンピュータ知能のモデルを開発している。視覚野がどのような仕組みで機能し、経験から学んでいくかを模倣しようとしているのだ。

もしうまくいけば、これはコンピュータビジョンや機械学習全般にとっての技術革新となるとポッジオは言う。「そのためには、単なるアイディアの源としてではなく、照らし出す強い光としての神経科学が必要になる」

コンピュータビジョンにおける大きな進歩を支えてきたのはインターネット上にある無数の写真で、画像を識別するためのソフトウエア・アルゴリズムを訓練するのに使われてきた。だがそのデータを収集し、分類するのは大変な作業だ。

中でも野心的なのが、スタンフォード大学とプリンストン大学の合同プロジェクト「イメージネット」だ。イメージネットでは10億枚近い画像をネットからダウンロード。それを整理、分類、分析した結果、1400万枚を超える画像が2万2000のカテゴリーに分けられた。ちなみにネコの写真だけで6万2000枚を超えるという。

世はコンピューター時代だというのに、イメージネットは驚くほど人手を要するプロジェクトだった。アマゾンのクラウドソーシングサイト「メカニカル・ターク」を介して4万9000人近くを分類作業に動員していた時期もある。

イメージネットのような膨大な画像データベースは脳神経系の働きに着想を得た「ニューラルネットワーク」の訓練に使われてきた。ニューラルネットワークの概念が生まれたのは30年以上前だが、強力なツールとなったのは近年のことだ。

次ページ2021年は業界にとって節目の年
関連記事
トピックボードAD
ビジネスの人気記事