AIも間違えた2026共通テストの問題。生成AIが得意の数学で満点を取れなかった理由を東大院生が解説
FrontierMathの作成元であるEPOCH AIが公表するベンチマーク比較。新しいモデルほど、正答率が高い(画像:筆者提供)
今や私たちの生活に欠かせない存在となりつつあるAI。AIの進化はすさまじく、たった1年でも大きくその性…
FrontierMathの作成元であるEPOCH AIが公表するベンチマーク比較。新しいモデルほど、正答率が高い(画像:筆者提供)
※過去1ヶ月以内の記事が対象
※過去1ヵ月以内の記事が対象
※過去1ヵ月以内の記事が対象
※過去1ヵ月以内の記事が対象