グーグル「AI秘書」、驚くべき進化の舞台裏 音声合成が可能にした人間そっくりの会話
「自然言語処理や機械学習、テキスト読み上げといった技術への長年の投資が可能にした」。グーグルのスンダー・ピチャイCEOがそう力を込めたとおり、「グーグルデュプレックス」と呼ばれるこの新技術には、これまでのAI研究の成果を結集させたといっても過言ではない。
グーグルは匿名化された通話データを自動音声認識技術で処理し、脳の神経回路を人工的に数式で表したニューラルネットワークを用いて、デュプレックスのモデルを作った。ただ、1つのモデルが万能なわけではない。美容院の予約、レストランの予約、祝日の営業時間確認という場面ごとにモデルを作らなければならなかった。「これだけ自然な会話をAIで実現できたのは、タスクを限っているからだ」(グーグル幹部)。
つなぎ言葉でより”人間”らしく
会話の内容だけでなく、自然な発声も重要だ。音声合成技術を用い、会話の流れや文脈に沿ったイントネーションを実現した。さらに、相手の発言を受けてアシスタントが次の発言を考える処理をしている間には、「Hmm」や「Uh」といった言葉で会話をつなぐことで、”人間らしさ”を出したという。
「米国の小規模事業者の6割は、オンライン予約システムを持っていない。われわれはAIがこの問題の解決に一役買えると考えた」(ピチャイCEO)。ユーザーにとっては、アシスタントに話しかけるだけで予約ができるのだ。さらに、聴覚に障害があったり、その土地の言葉が不自由だったりしても、簡単に予約が可能となる。
美容院予約、レストラン予約、祝日の営業時間の問い合わせ、これらの3機能は、今後数週間以内に米国の一般ユーザー向けに試験運用が始まる。
ただデュプレックスの発表後、人間そっくりに話すAIが自らの正体を明かすべきではないかとの声がネット上などで相次いだ。これを受けグーグル側は5月10日に声明を発表。「(デュプレックスは、自らがAIであることを)開示する機能を組み込んで設計されており、システムの正体が必ず適切にわかるようにする。I/Oで披露したものは初期段階の技術デモであり、製品化の過程でフィードバックを取り入れていきたい」と説明した。
無料会員登録はこちら
ログインはこちら