AIが大量の画像データを読み込んで重要なパターンを自動で学習する。深層学習の一種で、「深層畳み込みニューラルネットワーク(CNN)」と呼ばれるこの技術の威力が初めて証明されたのは2012年のことだ。

画像認識の精度を競い合う国際大会で、深層CNNを使った「アレックスネット(AlexNet)」が、2位以下を大きく引き離す圧倒的勝利を収めたのだ。
それ以前の画像認識では、「特徴量設計」という手法が主流だった。エッジや角、色の分布、質感など、何を特徴として捉えるかを人間が決めて数値化し、機械学習のアルゴリズムに入力して分類する。しかし、この手法は人間の知識に依存しており、画像が複雑になると精度が頭打ちになるという壁があった。
一方、深層CNNはAIが自ら学習して特徴を見つけ出すことで、その壁を一気に乗り越えた。まさに画像認識のパラダイムシフトだった。
現在の画像生成AIは別の方式を採用しているが、「大量のデータから特徴を自動学習する」という基盤となる発想と、GPU(画像処理用の計算チップ)を駆使した大規模学習の潮流は、アレックスネットが決定づけた。開発者の1人であるカナダ・トロント大学のジェフリー・ヒントン名誉教授は、24年のノーベル物理学賞を受賞している。




















無料会員登録はこちら
ログインはこちら