AIも間違えた2026共通テストの問題。生成AIが得意の数学で満点を取れなかった理由を東大院生が解説
アメリカの数学オリンピック問題の正答率は100%
今や私たちの生活に欠かせない存在となりつつあるAI。
AIの進化はすさまじく、たった1年でも大きくその性能を向上させています(過去記事『「ChatGPTが東大入試解いてみた」驚く結果の中身』)。
2025年11月にGoogleがGeminiの新モデルである「Gemini 3 Pro」を、同年12月にはOpenAIがChatGPTの新モデルである「GPT‑5.2」を、ローンチしました。
特にGPT-5.2はコーディングや数学などで高い性能を発揮します。アメリカの数学オリンピック(AIME)の問題を解いた例をみてみましょう。
2025年1月モデルでの正答率は最大で87.3%、11月モデルでは94.0%まで上昇。そして12月モデルのGPT‑5.2 Thinkingでは、2025AIMEの問題を用いてなんと100%の解答ができたと報告されています。
では、これだけ推論力に特化した新しいモデルのChatGPTを日本の教育現場で生かすことはできるのでしょうか。例として、先日行われた共通テストの数学の問題をChatGPT-5.2に解かせてみることにします。


















無料会員登録はこちら
ログインはこちら