guide

GPT-5.2 APIガイド：セットアップ、料金、GPT-5.4との使い分け（2026年版）

Q: どの推論レベルを使うべきですか？

none（デフォルト）から始めてください。評価結果が悪化した場合のみレベルを上げましょう。OpenAIの公式ガイダンスでも、デフォルトで高レベルにするのではなく、このアプローチを推奨しています。推論レベルが高いほど推論トークンが増え、コストが上がります。

Zeiki

CGO

2026年3月24日

17 分

2026年3月、GPT-5.2を使うべきか？

2026年3月現在、OpenAIは新規プロジェクトにGPT-5.4を推奨しています。では、なぜGPT-5.2を使うのか？ 価格です。 GPT-5.2は入力$1.75/M、出力$14/Mで、GPT-5.4の入力$2.50/M、出力$15/Mと比べて入力コストが約30%安くなります。GPT-5.4の105万トークンのコンテキストウィンドウ、コンピュータ操作、ツール検索が不要であれば、GPT-5.2の40万トークンのコンテキストでほとんどのワークロードに十分対応できます。

GPT-5.2が適しているケース：

コスト重視で最新機能は不要な場合。 入力トークンが30%安い（$1.75 vs $2.50/M）。大量処理では大きな差になります。
コンテキストが40万トークン以内に収まる場合。 実際のタスク（コードレビュー、ドキュメント分析、マルチターン対話）のほとんどは100万トークン以上のコンテキストを必要としません。
コンピュータ操作やツール検索が不要な場合。 これらはGPT-5.4専用の機能です。
既存のGPT-5.2統合がある場合。 OpenAIの移行ガイドによると、デフォルト設定のGPT-5.4はドロップイン置換として設計されていますが、現在のセットアップが問題なく動作しているなら急いで移行する必要はありません。

GPT-5.4を選ぶべきケース：

40万トークン以上のコンテキストが必要（GPT-5.4：105万トークン）
コンピュータ操作、ツール検索、MCPサポートが必要
レガシー制約のない新規プロジェクトを開始する場合

GPT-5.2 vs GPT-5.4 vs GPT-5.4-mini：どれを選ぶべきか？

2026年3月に開発者が本当に必要としている比較は、GPT-5.2 vs GPT-4ではなく、この3モデルの比較です。

機能	GPT-5.2	GPT-5.4	GPT-5.4-mini
コンテキストウィンドウ	40万	105万	未定
最大出力	12.8万	12.8万	未定
入力料金	$1.75/M	$2.50/M	$0.75/M
出力料金	$14/M	$15/M	未定
キャッシュ入力	$0.175/M	$0.25/M	未定
コンピュータ操作	非対応	対応	未定
ツール検索	非対応	対応	未定
推論レベル	none〜xhigh	none〜xhigh	未定
知識カットオフ	2025年8月31日	2025年8月31日	未定

すべての料金はOpenAI公式モデルページより。2026年3月23日時点で確認済み。GPT-5.4-miniの料金は一部のみ公開 — 最新情報はOpenAIモデルページをご確認ください。

判断基準：

コスト重視、40万トークン以内のコンテキスト → GPT-5.2
コンピュータ操作、ツール検索、または40万トークン以上のコンテキストが必要 → GPT-5.4
大量処理、シンプルなタスク → GPT-5.4-mini（入力$0.75/Mの価格が性能より重要な場合）

GPT-5.2 APIのセットアップ方法

OpenAIは現在、すべての新規プロジェクトにResponses APIを推奨しています。まずResponses APIを紹介し、次に既存コードベース向けのChat Completionsアプローチを説明します。

ステップ1：APIキーの取得

platform.openai.comにアクセス
サインインまたはアカウントを作成
API Keys → Create new secret key に移動
キーをすぐにコピー — 再表示されません
安全に保管し、バージョン管理にはコミットしないでください

ステップ2：最初のリクエスト（Responses API）

Python：

from openai import OpenAI

client = OpenAI(api_key="your-api-key-here")

response = client.responses.create(
    model="gpt-5.2",
    input="Explain quantum entanglement in simple terms"
)

print(response.output_text)

Node.js：

import OpenAI from 'openai';

const openai = new OpenAI({ apiKey: process.env.OPENAI_API_KEY });

const response = await openai.responses.create({
  model: "gpt-5.2",
  input: "Explain quantum entanglement in simple terms"
});

console.log(response.output_text);

Chat Completionsを使用中の場合

既存のコードベースでChat Completionsを使用している場合、GPT-5.2はそちらでも動作します：

response = client.chat.completions.create(
    model="gpt-5.2",
    messages=[
        {"role": "user", "content": "Explain quantum entanglement in simple terms"}
    ]
)

print(response.choices[0].message.content)

どちらのエンドポイントも利用可能です。OpenAIが新規プロジェクトにResponses APIを推奨するのは、ツール、Web検索、マルチステップのエージェントワークフローのビルトインサポートがあるためです。

ステップ3：推論レベルの設定

GPT-5.2は5つの推論レベルをサポートしています：none（デフォルト）、low、medium、high、xhigh。

response = client.responses.create(
    model="gpt-5.2",
    input="Debug this Python function: [paste code]",
    reasoning={"effort": "high"}
)

どのレベルを使うべきかについては、下記の推論レベルのセクションをご覧ください。

料金内訳とコスト例

2026年3月23日時点の公式料金：

トークン種別	100万トークンあたりの料金
入力	$1.75
出力	$14.00
キャッシュ入力	$0.175

実際のコスト例

コードレビュー（入力1万、出力2千トークン）：

入力：10,000 × $1.75/M = $0.0175
出力：2,000 × $14/M = $0.028
合計：$0.0455

ドキュメント分析（入力10万、出力5千トークン）：

入力：100,000 × $1.75/M = $0.175
出力：5,000 × $14/M = $0.07
合計：$0.245

コードベース全体の分析（入力30万、出力1万トークン）：

入力：300,000 × $1.75/M = $0.525
出力：10,000 × $14/M = $0.14
合計：$0.665

同じコードベースでプロンプトキャッシュを使用した場合：

キャッシュ入力：300,000 × $0.175/M = $0.0525
出力：10,000 × $14/M = $0.14
合計：$0.1925（キャッシュなしと比べて71%の節約）

推論レベル：適切なレベルの選び方

OpenAIのGPT-5.4ガイド（GPT-5.2にも適用）では、noneから始めて、評価結果が悪化した場合のみレベルを上げることを推奨しています。

公式ガイダンス：

デフォルトはnone — 最も高速なレスポンスが得られます
特定のタスクで出力品質が低下した場合、mediumに上げて調整してください
xhighは最も多くの推論トークン（とコスト）を消費します — 測定可能な改善が確認されたタスクにのみ使用してください

推論レベルを上げるべきケース：

エッジケースが重要な複雑なデバッグ
数学、論理、マルチステップの推論タスク
A/Bテストで上位レベルが具体的な指標を改善することを確認済みのタスク

noneで十分なケース：

シンプルなQ&A、分類、情報抽出
データのフォーマットと変換
「ステップバイステップで考えて」とプロンプトに書くだけで同様の結果が得られるタスク

コストへの影響： 推論レベルが高いほど推論トークンが多く生成され、出力料金（$14/M）で課金されます。highやxhighのリクエストはnoneと比べて出力トークンが2〜5倍になることがあります。デフォルトで高レベルに設定する前に、必ず測定してください。

よくある問題とトラブルシューティング

「Model does not exist」または404エラー

考えられる原因：

プロジェクトにモデル使用制限が設定されている可能性があります。OpenAIダッシュボードの Settings → Limits でGPT-5.2が有効になっているか確認してください。
APIキーの権限が制限されている可能性があります。デフォルトでは新しいAPIキーはすべてのモデルにアクセスできますが、チームメンバーがキーを「Restricted」権限に設定した場合、GPT-5.2が除外されている可能性があります。API Keys → キーを編集 → Permissionsで確認してください。

レート制限エラー（429）

GPT-5.2のティア別レート制限：

ティア	RPM	TPM	資格条件
Free	非対応	—	—
Tier 1	500	500,000	$5支払い済み
Tier 2	5,000	1,000,000	$50支払い済み + 7日
Tier 3	5,000	2,000,000	$100支払い済み + 7日
Tier 4	10,000	4,000,000	$250支払い済み + 14日
Tier 5	15,000	40,000,000	$1,000支払い済み + 30日

大規模コンテキストに関する注意： Tier 1の500K TPMでは、40万トークンのリクエストを1回送信できますが、1回の呼び出しで1分間のクォータのほとんどを消費します。大規模コンテキストの本番ワークロードにはTier 2以上を推奨します。

レスポンスが遅い

GPT-5.2はGPT-4シリーズのモデルより遅く、特に推論が有効な場合は顕著です。コミュニティの報告では、low推論レベルで15〜40秒のレスポンス時間が報告されています。

ヒント：

レイテンシが重要なタスクにはreasoning_effort: "none"を使用
レスポンスをストリーミングして体感速度を改善
速度重視のワークロードにはGPT-5.4-miniやGPT-5.4-nanoを検討

コスト最適化戦略

1. プロンプトキャッシュの活用

プロンプトキャッシュは自動的に有効 — 設定不要です。静的なコンテキスト（コードベース、ドキュメント）をシステムメッセージに配置してプロンプトを構成してください。最初のリクエスト以降、同じプレフィックスを持つ後続のリクエストは$1.75/Mではなく$0.175/Mで課金されます（入力コスト90%削減）。

2. タスクに応じた推論レベルの選択

noneから始めてください。評価スコアが改善する場合のみレベルを上げます。推論レベルが高いほど、$14/Mで課金される出力トークンが増えます。

3. Batch APIの活用

時間に敏感でないタスクには、Batch APIを使用して入力・出力トークンを50%割引で利用できます。

4. モデル間のルーティング

すべてのリクエストにGPT-5.2が必要なわけではありません。ルーティングを検討しましょう：

シンプルな情報抽出・分類 → GPT-5.4-nano（入力$0.10/M）
標準的なコーディングタスク → GPT-5.4-mini（入力$0.75/M）
複雑な推論、40万トークン以内のコンテキスト → GPT-5.2（入力$1.75/M）
その他 → GPT-5.4（入力$2.50/M）

5. トークン使用量の監視

response = client.responses.create(
    model="gpt-5.2",
    input="Your prompt"
)

usage = response.usage
input_cost = usage.input_tokens * 1.75 / 1_000_000
output_cost = usage.output_tokens * 14 / 1_000_000
print(f"Cost: ${input_cost + output_cost:.4f}")

本番運用のベストプラクティス

1. 指数バックオフ付きリトライの実装

import time
from openai import RateLimitError

def call_with_retry(prompt, max_retries=5):
    for attempt in range(max_retries):
        try:
            return client.responses.create(
                model="gpt-5.2",
                input=prompt
            )
        except RateLimitError:
            if attempt == max_retries - 1:
                raise
            time.sleep(2 ** attempt)

2. 長いレスポンスのストリーミング

stream = client.responses.create(
    model="gpt-5.2",
    input="Write a detailed analysis...",
    stream=True
)

for event in stream:
    if hasattr(event, 'delta') and event.delta:
        print(event.delta, end="")

3. 適切なタイムアウトの設定

GPT-5.2のxhigh推論は40秒以上かかることがあります。タイムアウトを適切に設定してください：

client = OpenAI(
    api_key=os.environ.get("OPENAI_API_KEY"),
    timeout=90.0  # generous timeout for high-effort reasoning
)

4. APIキーをハードコードしない

import os
from openai import OpenAI
client = OpenAI(api_key=os.environ.get("OPENAI_API_KEY"))

よくある質問

GPT-5.2 APIの料金はいくらですか？

入力100万トークンあたり$1.75、出力100万トークンあたり$14。キャッシュ入力：$0.175/M。一般的なコードレビューリクエスト（入力1万、出力2千トークン）は約$0.045です。

GPT-5.2とGPT-5.4のどちらを使うべきですか？

GPT-5.2は入力トークンが30%安く、40万トークン以内のコンテキストであればほとんどのタスクに十分です。40万トークン以上のコンテキスト、コンピュータ操作、ツール検索が必要な場合はGPT-5.4を選んでください。OpenAIは新規プロジェクトにGPT-5.4を推奨していますが、GPT-5.2は引き続き利用可能でコスパの良い選択肢です。

GPT-5.2のコンテキストウィンドウはどのくらいですか？

40万トークン — 約30万語に相当します。より大きなコンテキストが必要な場合、GPT-5.4は105万トークンに対応しています。

Responses APIとChat Completionsのどちらを使うべきですか？

OpenAIはすべての新規プロジェクトにResponses APIを推奨しています。Chat Completionsも引き続き動作し、既存のコードベースには問題ありませんが、Responses APIにはビルトインのツールサポートがあり、OpenAIが新機能を集中的に開発しているAPIです。

どの推論レベルを使うべきですか？

none（デフォルト）から始めてください。評価結果が悪化した場合のみレベルを上げましょう。OpenAIの公式ガイダンスでも、デフォルトで高レベルにするのではなく、このアプローチを推奨しています。推論レベルが高いほど推論トークンが増え、コストが上がります。

404や「model does not exist」エラーが出るのはなぜですか？

2つの点を確認してください：(1) LimitsタブのプロジェクトのModel Usage設定、(2) APIキーの権限レベル。キーが「All」ではなく「Restricted」に設定されている場合、特定のモデルが除外されている可能性があります。

GPT-5.2のレート制限はどのくらいですか？

Tier 1：500 RPM、500K TPM。Tier 5：15K RPM、40M TPM。利用額が増えるとティアは自動的にアップグレードされます。ティアの資格条件についてはOpenAIのレート制限ページをご覧ください。

GPT-5.2はClaude Opus 4.6やGemini 3.1 Proとどう比較されますか？

GPT-5.2は価格とコンテキストウィンドウで競争力があります。ベンダー間の詳細な比較については、GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 Proをご覧ください。

GPT-5.2を統合APIゲートウェイ経由で使えますか？

はい。EvoLinkなどのサービスを使えば、GPT-5.2、GPT-5.4、Claude、Geminiを単一のOpenAI互換エンドポイントからアクセスでき、最安のプロバイダーを自動選択するスマートルーティングが利用できます。

GPT-5.2でプロンプトキャッシュは自動ですか？

はい。OpenAIはプロンプトキャッシュをデフォルトで有効にしており、設定不要です。プロンプト内の繰り返しプレフィックスはキャッシュされ、$1.75/Mではなく$0.175/Mで課金されます（入力コスト90%削減）。

GPT-5.2をお得に試してみませんか？ EvoLinkなら1つのAPIキーでGPT-5.2（およびGPT-5.4、Claude、Gemini）にアクセスできます → evolink.ai/gpt-5-2

すべてのデータは2026年3月23日時点で確認済み。料金と仕様はOpenAI公式モデルページ、GPT-5.4モデルページ、レート制限ドキュメント、最新モデルガイドを出典としています。

すべての記事

#GPT-5.2 #GPT-5.4 #OpenAI API #API Pricing #LLM Comparison