ニュース

OpenAI、最新モデル「GPT-5.2」発表 専門家レベルの推論能力

 OpenAIは、最新のAIモデルシリーズ「GPT-5.2」を発表した。ChatGPTの有料プラン(Plus、Pro、Go、Business、Enterprise)から順次提供され、専門的な知識作業において人間の専門家を上回る水準が期待されている。

3つのモデルで構成、推論と速度を強化

 「GPT-5.2」は、用途に応じてInstant、Thinking、Proの3モデルで構成されている。

 このうち「GPT-5.2 Thinking」は、複雑な推論やコーディング、数学、長文処理に特化したモデルとなる。44の職種にわたる知識作業を評価するOpenAI独自のベンチマーク「GDPval」では、業界の専門家と比較した場合、タスクの70.9%で専門家と同等以上の結果が得られたという。

 作業速度も専門家の11倍、コストは1%未満に抑えられており、人による確認と組み合わせることで、専門業務を支える可能性が示されている。

 さらに、Fortune 500企業向けの財務諸表モデルを作成するなど、投資銀行アナリスト初級レベルのスプレッドシートモデリングタスクを評価する内部ベンチマークでは、平均スコアが59.1%から68.4%へと向上し、「GPT-5.1」より9.3ポイント高い結果になったとされている。

 コーディング性能を測る「SWE-Bench Pro」では、4つの言語を含むより実践的な環境で評価され、「GPT-5.2 Thinking」は55.6%を記録した。

 長文コンテキスト推論能力も強化されており、OpenAIの長文推論評価「MRCRv2」でトップ水準の成績を示した。数十万トークン規模の文書分析でも「GPT-5.1 Thinking」を大きく上回り、256kトークン対応の4-needle MRCRでは、初めてほぼ100%の精度に到達したという。

 そのほか、「GPT-5.2 Thinking」はハルシネーションが減り、誤りを含む回答が38%少なくなったほか、チャート推論やソフトウェアインターフェース理解におけるエラー率も約半分まで抑えられた。

 「GPT-5.2 Instant」は、日常的な文章作成や翻訳、学習支援に向けた軽量モデルで、応答速度と効率を重視したつくり。前世代の「GPT-5.1 Instant」で導入された温かみのある対話トーンも引き継いでいる。

 「GPT-5.2 Pro」は、信頼性を最優先したモデルで、科学や数学、プログラミングなどの領域において誤回答を抑え、より丁寧で正確な応答をめざしたものとなる。

API価格と提供状況

 開発者向けのAPIも同日から提供が始まっている。価格は100万入力トークンあたり1.75ドル、100万出力トークンあたり14ドルとなっている。