｢ChatGPTが東大入試解いてみた｣驚く結果の中身新しい｢o3｣が登場､人間はどう向き合うか

亀田崚 : 東京大学大学院理学系研究科学生・日曜劇場『御上先生』教育監修

2025/03/13 12:00

著者フォロー

フォローした著者の最新記事が公開されると、メールでお知らせします。
無料会員登録はこちら
はこちら

東京大学 ChatGPT o3

東京大学（写真： Ystudio / PIXTA）

2025年1月末、ChatGPTの開発元であるOpenAIは、新しい推論モデル「o3」およびその軽量版「o3-mini」を公開しました。

これらのモデルでは前世代のモデル「o1」の性能を大幅に向上させ、数学や科学、プログラミングといった、いわゆるSTEM分野の推論に特化していると公式発表されています。

米国数学オリンピックの問題では驚異的な記録

発表に際し、OpenAIは各種ベンチマークテストの結果も公開しました。アメリカの数学オリンピック（AIME）の問題を用いたテストでは、軽量版の「o3-mini」でも最大で正答率87.3%を記録し、従来モデル「o1」を上回る成績を示したといいます。

このテストは高校から大学レベルの数学的推論力を評価するものであり、新モデルの進化を裏付ける結果となりました。

さらに注目すべきは、o3モデルがFrontierMathと呼ばれる、AIのベンチマークを測定するために開発された、数学の難問を集めたデータセットで最大32%のスコアを獲得したことです。

FrontierMathがローンチされた際のベンチマークでは、Open AIの従来モデル「o1」や「4o」が示すスコアは2%未満でした。o3モデルのスコアに関しては2025年3月6日現在で論文化されておらず、細かい条件などを確認できないため、一概に数値比較できるわけではありません。それでもこのスコアは驚異的であることには変わりなく、o3モデルはSTEM分野に特化していると言われる所以であります。

ではここで日本の数学の試験、例えば東京大学の入学試験をChatGPT o3に解かせると、どのくらいの正答率になるのでしょうか。

→次ページはこちら

1 2 3 4 →

特集一覧

決定版ベスト弁護士2025

防衛産業の熱波

どこへ？高市政権

商社大異変

特集一覧はこちら

トピックボードAD

有料会員限定記事

抜かずの宝刀を発動､東邦相互銀処理に預金保険

アメリカは｢助けを必要とする者｣を下に見ている

日本人が知らない｢AIがもたらす医療変革｣の衝撃

決定版！｢ベスト弁護士2025｣いま注目の22人

メタがAI｢超知能ラボ｣で600人も削減する理由

ハイアットCEO｢ラグジュアリー温泉旅館｣の勝算

キャリア・教育の人気記事

トレンドライブラリーAD

連載一覧

連載一覧はこちら

キャリア・教育
アクセスランキング

1時間
24時間
週間
月間
シェア

※過去1ヶ月以内の記事が対象

» 11～30位はこちら

※過去1ヵ月以内の記事が対象

» 11～30位はこちら

※過去1ヵ月以内の記事が対象

» 11～30位はこちら

※過去1ヵ月以内の記事が対象

» 11～30位はこちら

※週間いいねとシェアの合計(増分)

» 11～30位はこちら

会員記事アクセスランキング

1時間
24時間
週間
月間

※過去1ヵ月以内の会員記事が対象

» 11～20位はこちら

※過去1ヵ月以内の会員記事が対象

» 11～20位はこちら

※過去1ヵ月以内の会員記事が対象

» 11～20位はこちら

※過去1ヵ月以内の会員記事が対象

» 11～20位はこちら

トレンドウォッチAD

週刊東洋経済の最新号

2025年11月8日号

この号を読む定期購読

バックナンバー一覧はこちら

東洋経済の書籍

新刊
ランキング

※3カ月以内に発刊した書籍の中から話題の書籍を紹介しています。