人工知能「第3の波」、囲碁でも人間に勝った! 自ら学習し、課題の解決を可能にした新技術
その研究成果はアップルのパーソナルエージェント「Siri」における音声認識やグーグル、Microsoft Bingの画像検索などで使われ始めている。音声認識や画像認識の成功と比べると、自然言語処理に対するディープラーニングの利用は限定的である。しかし、機械翻訳や対話システムなどへの技術適用が開始され始めており、今後の利用拡大が期待されている。
ディープラーニングは脳の神経回路の構造を模倣しており、複数の層のニューラルネットから構成されている。前段の層において抽出した低レベルの特徴から、後段の層の高レベルに抽象化された特徴までを自動的に抽出できる点が従来の手法との大きな違いである。
人間の場合、何かを識別する際には、特に意識せずとも自然に適当な特徴を見出している。たとえば、人間が赤いリンゴと青リンゴを識別する場合、色の情報を利用すればよいことは容易にわかる。
しかし、従来の機械学習の手法では、識別に利用すべき特徴を人工知能が自ら抽出できなかったため、事前に色情報を特徴として識別するように人間が指示していた。そのため、顔のような複雑なものを認識するためには、目や口などの低レベルの特徴とその配置の関連といった高レベルの特徴を人間があらかじめ抽出する必要があった。加えて、コンピュータに対し、適切に特徴を教えることが困難なことも多く、機械学習やニューラルネットの適用範囲を狭める大きな要因となっていた。
それに対して、ディープラーニングは特徴を自動的に抽出する機能を有しており、人間が特徴抽出に関与しなくても学習することが可能となっている。このように、データから特徴を学習する仕組みは「表現学習」と呼ばれている。ディープラーニングによって実現した「表現学習」によって、機械学習の従来の限界を超えられるのではないかと期待が高まっている。
人と同じように考え、学習する「汎用人工知能」
1950年代に人工知能という研究分野が生まれた当時は、人と同じように考え、学習する、いわゆる「汎用人工知能/Artificial General Intelligence(AGI)」の実現が目標とされていた。しかし、汎用人工知能の実現に対する2度にわたる失望期を経て、個別課題の解決を目標とした「狭い人工知能(Narrow AI)」の実現が研究の主流となっていた。
しかし、近年ディープラーニングによって実現された「表現学習」により、再び「汎用人工知能」実現に対する研究活動が活発になってきている。「狭い人工知能」がチェスや音声認識、自動運転など個別の課題に対応するように設計されているのに対して、「汎用人工知能」は、ひとつのシステムが自己学習し、人と同じようにさまざまな分野の課題を解決することができる。
無料会員登録はこちら
ログインはこちら