巨人グーグルが生み出した「最強AI」の全貌 日本にも上陸、グーグル版Siriの実力とは?
アシスタントの機能は「機械学習」と呼ばれるAI技術が土台になっている。その中でグーグルが力を注ぐのは、人間の脳の構造を手本にして大量のデータを分析する「ディープラーニング(深層学習)」だ。
深層学習ではコンピュータに大量のデータを読み込ませ、機械自身がそこから共通点や特徴を学び取る。たとえば人間の顔の画像データを大量に学習させれば、さまざまな画像から人間の顔を見分けられるようになる。音声データと対応するテキストを学習させれば、音声認識が可能になるといった具合だ。
膨大なデータがグーグルのAIを育てた
アシスタントとのやり取りを会話調にするためには音声認識や自然言語処理、グーグルレンズには画像認識の技術が使われている。いずれも深層学習によって精度が飛躍的に向上した。グーグルのAIアルゴリズムによる音声の誤認識率は昨年7月の8.5%から直近では4.9%に低下。画像に関しても昨年、認識率で人間を超える水準になった。
グーグルが深層学習をここまで進化させられたのは、展開するサービスや扱うデータの規模がケタ違いであることが大きい。検索にアンドロイド、ユーチューブ、グーグルマップ、Gメールといったアプリは月間利用者数がそれぞれ10億人超。グーグルフォトでは毎日12億枚の写真がアップされる。日々、膨大な文字や音声、画像データを学習させられる環境にあるのだ。
グーグルのAIの恩恵を受けるのは消費者だけではない。「われわれはAIを民主化していく」と、クラウド部門でAIのチーフサイエンティストを務めるフェイフェイ・リー氏がI/Oで語ったように、グーグルは社外の開発者に機械学習技術を開放している。
先述のグーグルアシスタントは誰でも機器に組み込めるよう、仕様が公開されている。I/Oで展示されたジュースミキサーは、飲みたい味を伝えるとセットしたジュースの分量を調節し作ってくれた。
また、クラウドサービス「グーグルクラウドプラットフォーム」ではオープンな機械学習のAPI(アプリケーション・プログラミング・インターフェース)を提供している。これを使えば画像や映像、音声の認識、自然言語処理、翻訳といった機能を、自らのアプリケーションに組み込める。
無料会員登録はこちら
ログインはこちら