「グーグル翻訳」が急激によくなっている理由 人工知能による予測能力が劇的に改善中
2016年11月のある日、コンピューター科学者であり東京大学大学院教授の暦本純一は、このヘミングウェイの珠玉の短篇小説の日本語訳(キリマンジャロは雪に覆われた1万9710フィートの山で、アフリカで最も高い山と言われている)をグーグルで英語に翻訳し直した。その結果、次のような英文が出来上がった。
ところが翌日、グーグル翻訳は次のように変化していた。
ふたつの訳文には大きな違いが存在する。自動翻訳特有のぎこちない文章は、筋の通った文章へと一夜にして変化した。最初の訳文からは辞書を片手に翻訳者が苦戦しているイメージが思い浮かぶが、後のほうでは、翻訳者がどちらの言語にも精通しているような印象を受ける。
英語から日本語への翻訳では、英語にマッチする日本語の単語やフレーズを予測する。ここでは、選んだ日本語を並べる順序についての情報が欠落している。したがって、外国語から得られるデータに基づいて正しい言葉を選んだら、正しい順序に並べるための予測が必要で、その作業を経て理解可能な文章が出来上がる。作業が順調ならば、翻訳された文章だと気づかれないこともある。
企業は競うかのように、この魔法のテクノロジーの商業利用に乗り出した。例えば中国では、アイフライテック(科大訊飛)がディープラーニングを用いた自然言語処理サービスを開発し、利用者はすでに5億人を突破している。
このサービスは、中国語の音声メッセージをさまざまな言語のテキストメッセージに変換し、2言語間でのコミュニケーションを可能にするものだ。具体的には、家主が入居者と異なる言語でコミュニケーションを交わすため、病院の患者がロボットに行き先を尋ねるため、 医師が患者の病気の詳細について指示するため、ドライバーが車両とコミュニケーションを交わすために、この自然言語処理サービスが利用されている。AIが頻繁に使われるほど多くのデータが集まり、多くの事柄を学ぶほど性能は向上する。ユーザーがたくさんいれば、AIはどんどん改善していく。
予測コストが大きく下がっている
重要なのは、機械学習(ディープラーニングはそのサブフィールドのひとつ)において予測の質を調整するコストが大きく低下したことだ。計算能力に従来と同じコストをかけるだけで、以前よりも質の高い翻訳が提供される。従来と同じ質の予測を生み出すコストが、大きく下がったのだ。
現代のAIは、SFに登場する知的機械にはまだ遠くおよばない。予測するだけでは、『2001年宇宙の旅』のHALや『ターミネーター』のスカイネット、『スター・ウォーズ』のC-3POのような存在は実現しない。
では、現代のAIが予測するだけなら、なぜこれほど大騒ぎされるのだろう。それは、予測は極めて基本的な入力情報だからだ。あなたは気づいていないかもしれないが、予測はいたるところで行われている。ビジネスも私生活も予測だらけだ。しかも予測は往々にして、意思決定を支える入力情報として隠されている。予測が改善すれば情報が改善し、ひいては意思決定が改善する。
予測のコストが下がり続ければ、予測が役に立つ活動は増え続け、応用範囲は広がっていく。そのプロセスのなかで、機械翻訳のように以前は想像もできなかった多くの事柄が実現するのだ。
記事をマイページに保存
できます。
無料会員登録はこちら
ログインはこちら
印刷ページの表示はログインが必要です。
無料会員登録はこちら
ログインはこちら
無料会員登録はこちら
ログインはこちら