東洋経済オンラインとは
キャリア・教育

AIも間違えた2026共通テストの問題。生成AIが得意の数学で満点を取れなかった理由を東大院生が解説

6分で読める
  • 亀田 崚 東京大学大学院理学系研究科学生・日曜劇場『御上先生』教育監修
2/4 PAGES

まずは最も単純に、共通テストの画像(pdf)をそのまま送信し「この問題を解いてください」とだけ指示してみました。その結果、数学I・Aの試験では89点/100点でした。

これでも十分に高得点で、実際この点数は東大受験生の平均値くらいだと予想されます。

共通テストで満点を取れなかった理由

その中でも私が注目したのが、私自身が問題を解いている時に「この問題は、今回の試験の中で最も難しい!」と感じた問題を、ChatGPTも間違えていたことです。

(外部配信先では画像が閲覧できない場合があります。その際は東洋経済オンライン内でお読みください)

間違った答えを出力するChatGPT(画像:筆者提供)

しかし、ChatGPTの本領はこんなものではないはずです。共通テストよりももっと難しい問題を解けるように作られているAIですから、このレベル程度の問題で間違うはずがありません。

では、なにが良くなかったのか。それは、「問題文を画像で送信する」行為です。

pdfを受け取ったAI側は、まず光学文字認識技術(OCR)を用いて、書かれている文字を機械で理解できるように読み取ります。その後に、読み取った内容・問題をAIの推論力を用いて解く、という手順になっています。

文章、特に日本語を含む非英語言語の文章の認識はChatGPTが苦手とする部分ですから、ここで齟齬が起きてしまっていると考えられます。

では、このネックを人間側で解消してあげれば、ChatGPTの本領が発揮されるでしょう。

日本語の問題文を、いったん機械で理解できる形式(tex形式など)に書き換えるように指示し、この形式が正しいものとなっているか人間が確認した後に、改めて問題を解くように指示してみましょう。

正しい答えを出力するChatGPT(画像:筆者提供)

このようにすると、正しい解答を出力するようになりました。つまり、生成AIは共通テスト満点を取れるが、画像で入力すると満点にならない、という話なのです。

次ページが続きます:
【ちまたの「入試問題をAIに解かせてみた」では…】

3/4 PAGES
4/4 PAGES

こちらの記事もおすすめ

あなたにおすすめ

キャリア・教育

人気記事 HOT

※過去1週間以内の記事が対象