AIも間違えた2026共通テストの問題。生成AIが得意の数学で満点を取れなかった理由を東大院生が解説

亀田崚 : 東京大学大学院理学系研究科学生・日曜劇場『御上先生』教育監修

2026/01/21 7:00

著者フォロー

フォローした著者の最新記事が公開されると、メールでお知らせします。
無料会員登録はこちら
はこちら

実際にTier4の問題を載せてみます。この領域まで到達すると、現役の物理学専攻の大学院生である筆者ですら、問題文で何を言っているのか分からないような問題になっています。高校生が解く共通テストとは比べ物にならない難易度です。

ここからも、AIの推論力は人間をはるかに凌駕する域まで到達していると言えるでしょう。

FrontierMathのTier4レベル問題のサンプル（画像：筆者提供）

FrontierMathのTier4レベル問題のサンプル（画像：筆者提供）

無批判に受け入れるのは危険

ただし、年々性能が向上しているとはいえ、AIの回答が間違っている可能性があることは否定できません。実際に上記の例では「問題を解く科学的な推論は間違っていないが、そもそもの画像認識で認識の齟齬が生まれていたという状況」だったので、最初に得られたAIの出力内容には誤りが含まれていました。

AIを使う際はこのような状況になることを常に想定し、AIの回答を批判的に検証して、自分の思考と逐一照らし合わせることで、間違っている部分を見つけ出すことが大事です。常に念頭に入れておきたいのは「AIが出力した内容を無批判に受け入れない」ということです。

AIは諸刃の剣。使う側の人間が批判的な思考力を持ち合わせているかどうかで、善にも悪にもなりうるツールです。便利だからこそ、十分に注意して使用すべきツールなのだと言えます。

使用したChat
2026年共通テスト数学I・Aを解き、89点を獲得したやりとり
 画像をTeX形式に変換したやりとり
 画像を変換した後に問題を解いたやりとり

FrontierMath関連の参考資料
FrontierMathのローンチ論文
 EPOCH AIによるFrontierMathの概略
 EPOCH AIによるFrontierMathのAI別ベンチマーク比較

著者フォローすると、亀田崚さんの最新記事をメールでお知らせします。

亀田崚東京大学大学院理学系研究科学生・日曜劇場『御上先生』教育監修

著者フォロー

フォローした著者の最新記事が公開されると、メールでお知らせします。
無料会員登録はこちら
はこちら

著者をフォローすると、最新記事をメールでお知らせします。右上のボタンからフォローください。

かめだりょう / Ryo Kameda

2000年生まれ。東京大学大学院理学系研究科物理学専攻所属。東大カルペ・ディエム所属。公立高校から一浪を経て東京大学理科一類に合格。その経験を活かし、全国の高校生や駿台予備学校お茶の水校3号館の浪人生に対して学習指導を行なっている。また、自身が大学で学んでいる物理や数学の面白さを伝えるため、メディア活動やボードゲームの開発を行なっている。日曜劇場『御上先生』教育監修。

この著者の記事一覧はこちら

← 1 2 3 4

特集一覧

イランショック

「責任ある積極財政」は日本経済を、強く豊かにするのか。

JR東日本運賃値上げの余波

JTの逆襲

特集一覧はこちら

トピックボードAD

有料会員限定記事

編集部厳選､注目の経済ニュース！【3月14日】

最新版!｢就職支援スタッフが多い大学｣上位200

｢AIのフェイク画像はAIで見破れる｣は本当か？

ホルムズ海峡封鎖･イランは機雷をどう敷設する？

戦争長期化予想､原油､ガス､電力の価格はどうなる

イランとの戦争を不可避にした｢2018年の決定｣

キャリア・教育の人気記事

トレンドライブラリーAD

連載一覧

連載一覧はこちら

キャリア・教育
アクセスランキング

1時間
24時間
週間
月間
シェア

※過去1ヶ月以内の記事が対象

» 11～30位はこちら

※過去1ヵ月以内の記事が対象

» 11～30位はこちら

※過去1ヵ月以内の記事が対象

» 11～30位はこちら

※過去1ヵ月以内の記事が対象

» 11～30位はこちら

※週間いいねとシェアの合計(増分)

» 11～30位はこちら

会員記事アクセスランキング

1時間
24時間
週間
月間

※過去1ヵ月以内の会員記事が対象

» 11～20位はこちら

※過去1ヵ月以内の会員記事が対象

» 11～20位はこちら

※過去1ヵ月以内の会員記事が対象

» 11～20位はこちら

※過去1ヵ月以内の会員記事が対象

» 11～20位はこちら

トレンドウォッチAD

週刊東洋経済の最新号

2026年3月14日・21日号

この号を読む定期購読

バックナンバー一覧はこちら

東洋経済の書籍

新刊
ランキング

※3カ月以内に発刊した書籍の中から話題の書籍を紹介しています。