話題の「ChatGPT」、そのすごさと″限界"のワケ 自然な会話ができるサービスが生まれた経緯

著者フォロー
ブックマーク

記事をマイページに保存
できます。
無料会員登録はこちら
はこちら

印刷ページの表示はログインが必要です。

無料会員登録はこちら

はこちら

縮小

強化学習とは、AIを動作させている中で、さらに学習を進めていく実践的な手法だ。人間の場合でも話を続けている間に、話題になっているテーマへの知識を学習し、それが別の類似する知識と結びつけて考え始めるといったことを行う。同様に多様なエンドユーザーと会話する中で、GPT自身が学習していく仕組みを作ろうと試みているわけだ。

AIには認知能力がないため、自分自身が出した答えが正しいか正しくないか、どの程度、妥当性があるものなのかを認知することはできない。ユーザーが入力した文章でさえ、ただのデータの列であって何かを認識しているわけではない。このため、一般的には人間と対話しながら、自らの出した答えを振り返って反芻して成長することはできなかった。

「会話の中から新たな学習結果を得る」

このため、ChatGPTではGPT-3.5をもとに「会話を成立させ、会話の中から新たな学習結果を得る」ことを目標にしたプログラムがされている(加えて一般に公開しても問題がないよう道義的に問題がある質問には答えない仕組みがプログラムされている)。

「会話の中から学習する」ために、ChatGPTは直前の対話内容について分析して学習したうえで、それに続く質問への回答が行えるようにしており、さらに間違いを指摘された場合に素直に認めるようプログラムされている。

さらに会話の文脈が想定外となった場合、話の前提が正しくないのではないか?とユーザーに異議を唱えたり、ユーザー自身が異議を申し立てるといった振る舞いをするようプログラムされている点も異なる。

こうして多くの人と対話した結果を取り入れていくことで、より確からしい答えに近づくことができるのではないか?という壮大な実験とも言えるだろう。会話の中で人間により好ましい結果につながりやすいよう、選択肢の優先順位を学習していくわけだ。

この仕組みで集めた情報をさらにフィードバックをかけ、ファインチューニングを行っているだろうことは、日々、応対が変化していくことからもわかる。ただしChatGPTには明確な限界と課題も見える。

その限界を見据えたうえで、実用化を目指しているのがマイクロソフトとも言えるだろう。本当に使い物になるのかはもちろん、使いこなす人間にかかっている。

会話が成立することと、その内容が意味あるものであることは必ずしも一致しない。ChatGPTが答える文章は理路整然として素晴らしいと感じられるが、不正確であったり、非論理的で意味をなしていない場合も少なくない。

次ページ強化学習してもGPTの弱点は補えない?
関連記事
トピックボードAD
ビジネスの人気記事