巨人グーグルが生み出した「最強AI」の全貌

日本にも上陸、グーグル版Siriの実力とは?

アシスタントの機能は「機械学習」と呼ばれるAI技術が土台になっている。その中でグーグルが力を注ぐのは、人間の脳の構造を手本にして大量のデータを分析する「ディープラーニング(深層学習)」だ。

深層学習ではコンピュータに大量のデータを読み込ませ、機械自身がそこから共通点や特徴を学び取る。たとえば人間の顔の画像データを大量に学習させれば、さまざまな画像から人間の顔を見分けられるようになる。音声データと対応するテキストを学習させれば、音声認識が可能になるといった具合だ。

膨大なデータがグーグルのAIを育てた

アシスタントとのやり取りを会話調にするためには音声認識や自然言語処理、グーグルレンズには画像認識の技術が使われている。いずれも深層学習によって精度が飛躍的に向上した。グーグルのAIアルゴリズムによる音声の誤認識率は昨年7月の8.5%から直近では4.9%に低下。画像に関しても昨年、認識率で人間を超える水準になった。

グーグルが深層学習をここまで進化させられたのは、展開するサービスや扱うデータの規模がケタ違いであることが大きい。検索にアンドロイド、ユーチューブ、グーグルマップ、Gメールといったアプリは月間利用者数がそれぞれ10億人超。グーグルフォトでは毎日12億枚の写真がアップされる。日々、膨大な文字や音声、画像データを学習させられる環境にあるのだ。

グーグルのAIの恩恵を受けるのは消費者だけではない。「われわれはAIを民主化していく」と、クラウド部門でAIのチーフサイエンティストを務めるフェイフェイ・リー氏がI/Oで語ったように、グーグルは社外の開発者に機械学習技術を開放している。

先述のグーグルアシスタントは誰でも機器に組み込めるよう、仕様が公開されている。I/Oで展示されたジュースミキサーは、飲みたい味を伝えるとセットしたジュースの分量を調節し作ってくれた。

また、クラウドサービス「グーグルクラウドプラットフォーム」ではオープンな機械学習のAPI(アプリケーション・プログラミング・インターフェース)を提供している。これを使えば画像や映像、音声の認識、自然言語処理、翻訳といった機能を、自らのアプリケーションに組み込める。

次ページ皆がAIを簡単に使えるようにする
ビジネスの人気記事
トピックボードAD
関連記事
  • ブックス・レビュー
  • 就職四季報プラスワン
  • 家族の法廷から
  • 競馬好きエコノミストの市場深読み劇場
トレンドライブラリーAD
  • コメント
  • facebook
0/400

コメント投稿に関する規則(ガイドライン)を遵守し、内容に責任をもってご投稿ください。

アクセスランキング
  • 1時間
  • 24時間
  • 週間
  • 月間
  • シェア
トレンドウォッチAD
日本ブランドを売り込め!<br>中国向けEC販路の最前線

中国で2015年以降に広がったライブコマース。「ソーシャルバイヤー」が商品説明をライブ動画で配信しネットで注文を受ける、ECの新手法だ。東京からの配信開始で、日本企業も熱い視線を注いでいる。越境ECの新しい販路をリポートする。