AIも間違えた2026共通テストの問題。生成AIが得意の数学で満点を取れなかった理由を東大院生が解説

著者フォロー
ブックマーク

記事をマイページに保存
できます。
無料会員登録はこちら
はこちら

印刷ページの表示はログインが必要です。

無料会員登録はこちら

はこちら

縮小

まずは最も単純に、共通テストの画像(pdf)をそのまま送信し「この問題を解いてください」とだけ指示してみました。その結果、数学I・Aの試験では89点/100点でした。

これでも十分に高得点で、実際この点数は東大受験生の平均値くらいだと予想されます。

共通テストで満点を取れなかった理由

その中でも私が注目したのが、私自身が問題を解いている時に「この問題は、今回の試験の中で最も難しい!」と感じた問題を、ChatGPTも間違えていたことです。

(外部配信先では画像が閲覧できない場合があります。その際は東洋経済オンライン内でお読みください)

間違った答えを出力するChat GPT
間違った答えを出力するChatGPT(画像:筆者提供)

しかし、ChatGPTの本領はこんなものではないはずです。共通テストよりももっと難しい問題を解けるように作られているAIですから、このレベル程度の問題で間違うはずがありません。

では、なにが良くなかったのか。それは、「問題文を画像で送信する」行為です。

pdfを受け取ったAI側は、まず光学文字認識技術(OCR)を用いて、書かれている文字を機械で理解できるように読み取ります。その後に、読み取った内容・問題をAIの推論力を用いて解く、という手順になっています。

文章、特に日本語を含む非英語言語の文章の認識はChatGPTが苦手とする部分ですから、ここで齟齬が起きてしまっていると考えられます。

では、このネックを人間側で解消してあげれば、ChatGPTの本領が発揮されるでしょう。

日本語の問題文を、いったん機械で理解できる形式(tex形式など)に書き換えるように指示し、この形式が正しいものとなっているか人間が確認した後に、改めて問題を解くように指示してみましょう。

正しい答えを出力するChat GPT(画像:筆者提供)
正しい答えを出力するChatGPT(画像:筆者提供)

このようにすると、正しい解答を出力するようになりました。つまり、生成AIは共通テスト満点を取れるが、画像で入力すると満点にならない、という話なのです。

次ページちまたの「入試問題をAIに解かせてみた」では…
関連記事
トピックボードAD
キャリア・教育の人気記事