AIも間違えた2026共通テストの問題。生成AIが得意の数学で満点を取れなかった理由を東大院生が解説

亀田崚 : 東京大学大学院理学系研究科学生・日曜劇場『御上先生』教育監修

2026/01/21 7:00

著者フォロー

フォローした著者の最新記事が公開されると、メールでお知らせします。
無料会員登録はこちら
はこちら

2026共通テストで最も難しかった問題をAIも間違えました（写真：ダイ / PIXTA）

2026共通テストで最も難しかった問題をAIも間違えました（写真：ダイ / PIXTA）

高度に発達した生成AIですが、2025年12月にローンチされた最新版に2026年の共通テストを解かせてみたところ、満点を取ることができませんでした。東京大学大学院理学系研究科物理学専攻の筆者がその理由を解説します。

著者フォローをすると、連載の新しい記事が公開されたときにお知らせメールが届きます。

アメリカの数学オリンピック問題の正答率は100％

今や私たちの生活に欠かせない存在となりつつあるAI。

AIの進化はすさまじく、たった1年でも大きくその性能を向上させています（過去記事『｢ChatGPTが東大入試解いてみた｣驚く結果の中身』）。

2025年11月にGoogleがGeminiの新モデルである「Gemini 3 Pro」を、同年12月にはOpenAIがChatGPTの新モデルである「GPT‑5.2」を、ローンチしました。

特にGPT-5.2はコーディングや数学などで高い性能を発揮します。アメリカの数学オリンピック（AIME）の問題を解いた例をみてみましょう。

2025年1月モデルでの正答率は最大で87.3%、11月モデルでは94.0%まで上昇。そして12月モデルのGPT‑5.2 Thinkingでは、2025AIMEの問題を用いてなんと100%の解答ができたと報告されています。

では、これだけ推論力に特化した新しいモデルのChatGPTを日本の教育現場で生かすことはできるのでしょうか。例として、先日行われた共通テストの数学の問題をChatGPT-5.2に解かせてみることにします。

→次ページ点数は東大受験生の平均値くらい

1 2 3 4 →

特集一覧

イランショック

バイオマス発電の現実　持続可能と言えるのか

半導体新次元「フィジカルAI」の勝者は誰か

イスラエル・イラン緊迫する中東

特集一覧はこちら

トピックボードAD

有料会員限定記事

斜陽業界にあえて身を投じた桂米朝の覚悟と手腕

高市首相の肝煎り事業にエプスタイン文書の衝撃

生涯給料が高い企業ランキングTOP300《完全版》

ベトナムで進む木質ペレット生産の危うい状況

｢SaaSの死｣で株価急落も業績拡大のソフト株8選

ものづくり太郎たちが斬る｢フィジカルAI｣最前線

キャリア・教育の人気記事

トレンドライブラリーAD

連載一覧

連載一覧はこちら

キャリア・教育
アクセスランキング

1時間
24時間
週間
月間
シェア

※過去1ヶ月以内の記事が対象

» 11～30位はこちら

※過去1ヵ月以内の記事が対象

» 11～30位はこちら

※過去1ヵ月以内の記事が対象

» 11～30位はこちら

※過去1ヵ月以内の記事が対象

» 11～30位はこちら

※週間いいねとシェアの合計(増分)

» 11～30位はこちら

会員記事アクセスランキング

1時間
24時間
週間
月間

※過去1ヵ月以内の会員記事が対象

» 11～20位はこちら

※過去1ヵ月以内の会員記事が対象

» 11～20位はこちら

※過去1ヵ月以内の会員記事が対象

» 11～20位はこちら

※過去1ヵ月以内の会員記事が対象

» 11～20位はこちら

トレンドウォッチAD

週刊東洋経済の最新号

2026年3月7日号

この号を読む定期購読

バックナンバー一覧はこちら

東洋経済の書籍

新刊
ランキング

※3カ月以内に発刊した書籍の中から話題の書籍を紹介しています。