OpenAI「コード・レッド(緊急事態)」宣言の深層 最新の《GPT-5.2》が狙う「賢さ」から「稼ぐ力」への競争軸転換
例えば、あなたがこう指示したとしよう。
「先月の売上データを基に、製品ごとの利益率を計算し、異常値をハイライトしたレポートを作成して」
すると、VLOOKUPやピボットテーブル、条件付き書式までが完璧に設定された、完全に編集可能で実用的なExcelファイルそのものが納品される。
GPT-5.1でも同様の機能は存在したが、「レイアウトの粗さや誤りが目立った」と報告されている。5.2では「より洗練されたレイアウトと実用的なアドバイスを備えたアウトプット」へと品質が向上した。
同様の革命は、プレゼンテーション作成の領域でも起きている。Canvaにはスライドごとの具体的なレイアウトや、説得力のあるスピーカーノートまでを提案し、さらにWordファイルとして出力できる。
現時点ではMicrosoft OfficeやGoogle Workspaceと直接競合するものではないが、その作業の上流を、近い将来にAIが侵食することは間違いないだろう。
この進化の真の狙いは、単なる機能追加ではない。「上流を奪う者は、下流のツール選択すら変える」という戦略だ。構想から初稿作成という業務の最上流をAIが担うようになれば、人々が最終的な仕上げに使うツールも変わっていく可能性がある。
エージェントの動作が「途中で壊れない」
ネイティブファイル生成と並んで見逃せないのが、エージェント機能の成熟だ。これは派手さに欠けるが、実用化において最も本質的な進化かもしれない。
複数の作業工程を異なるツールで実現する能力を測るτ²ベンチ(Tau2-bench)のコミュニケーション領域におけるテストで、GPT-5.2 Thinkingは98.7%の正解率を記録した。これは、ウェブ検索や社内データベースなど複数のツールを適切に活用しながら、ユーザーの複雑な問い合わせに段階的に答える能力を評価するものだ。
例えば「フライト遅延による乗り継ぎミスと荷物紛失、ホテル手配、特別座席の要求」といった込み入った顧客サポート問い合わせに対し、GPT-5.2は再予約から補償手続きまで一連の処理を自律的に完了させることに成功した。前モデルでは途中で手順が途切れたり一部対応漏れがあったりしたが、5.2では最終回答まで整合性を保てた。



















無料会員登録はこちら
ログインはこちら