AIも間違えた2026共通テストの問題。生成AIが得意の数学で満点を取れなかった理由を東大院生が解説

亀田崚 : 東京大学大学院理学系研究科学生・日曜劇場『御上先生』教育監修

2026/01/21 7:00

著者フォロー

フォローした著者の最新記事が公開されると、メールでお知らせします。
無料会員登録はこちら
はこちら

まずは最も単純に、共通テストの画像（pdf）をそのまま送信し「この問題を解いてください」とだけ指示してみました。その結果、数学I・Aの試験では89点/100点でした。

これでも十分に高得点で、実際この点数は東大受験生の平均値くらいだと予想されます。

共通テストで満点を取れなかった理由

その中でも私が注目したのが、私自身が問題を解いている時に「この問題は、今回の試験の中で最も難しい！」と感じた問題を、ChatGPTも間違えていたことです。

（外部配信先では画像が閲覧できない場合があります。その際は東洋経済オンライン内でお読みください）

間違った答えを出力するChat GPT

間違った答えを出力するChatGPT（画像：筆者提供）

しかし、ChatGPTの本領はこんなものではないはずです。共通テストよりももっと難しい問題を解けるように作られているAIですから、このレベル程度の問題で間違うはずがありません。

では、なにが良くなかったのか。それは、「問題文を画像で送信する」行為です。

pdfを受け取ったAI側は、まず光学文字認識技術（OCR）を用いて、書かれている文字を機械で理解できるように読み取ります。その後に、読み取った内容・問題をAIの推論力を用いて解く、という手順になっています。

文章、特に日本語を含む非英語言語の文章の認識はChatGPTが苦手とする部分ですから、ここで齟齬が起きてしまっていると考えられます。

では、このネックを人間側で解消してあげれば、ChatGPTの本領が発揮されるでしょう。

日本語の問題文を、いったん機械で理解できる形式（tex形式など）に書き換えるように指示し、この形式が正しいものとなっているか人間が確認した後に、改めて問題を解くように指示してみましょう。

正しい答えを出力するChat GPT（画像：筆者提供）

正しい答えを出力するChatGPT（画像：筆者提供）

このようにすると、正しい解答を出力するようになりました。つまり、生成AIは共通テスト満点を取れるが、画像で入力すると満点にならない、という話なのです。

→次ページちまたの「入試問題をAIに解かせてみた」では…

← 1 2 3 4 →

特集一覧

イランショック

「責任ある積極財政」は日本経済を、強く豊かにするのか。

JR東日本運賃値上げの余波

JTの逆襲

特集一覧はこちら

トピックボードAD

有料会員限定記事

編集部厳選､注目の経済ニュース！【3月14日】

最新版!｢就職支援スタッフが多い大学｣上位200

｢AIのフェイク画像はAIで見破れる｣は本当か？

ホルムズ海峡封鎖･イランは機雷をどう敷設する？

戦争長期化予想､原油､ガス､電力の価格はどうなる

イランとの戦争を不可避にした｢2018年の決定｣

キャリア・教育の人気記事

トレンドライブラリーAD

連載一覧

連載一覧はこちら

キャリア・教育
アクセスランキング

1時間
24時間
週間
月間
シェア

※過去1ヶ月以内の記事が対象

» 11～30位はこちら

※過去1ヵ月以内の記事が対象

» 11～30位はこちら

※過去1ヵ月以内の記事が対象

» 11～30位はこちら

※過去1ヵ月以内の記事が対象

» 11～30位はこちら

※週間いいねとシェアの合計(増分)

» 11～30位はこちら

会員記事アクセスランキング

1時間
24時間
週間
月間

※過去1ヵ月以内の会員記事が対象

» 11～20位はこちら

※過去1ヵ月以内の会員記事が対象

» 11～20位はこちら

※過去1ヵ月以内の会員記事が対象

» 11～20位はこちら

※過去1ヵ月以内の会員記事が対象

» 11～20位はこちら

トレンドウォッチAD

週刊東洋経済の最新号

2026年3月14日・21日号

この号を読む定期購読

バックナンバー一覧はこちら

東洋経済の書籍

新刊
ランキング

※3カ月以内に発刊した書籍の中から話題の書籍を紹介しています。