
GPT-5.5 API 料金ガイド 2026:コスト・キャッシュ入力・ロングコンテキスト料金

GPT-5.5 API 料金ガイド 2026:コスト・キャッシュ入力・ロングコンテキスト料金
GPT-5.5 API 料金表
| 課金項目 | EvoLink 価格 | 備考 |
|---|---|---|
| 標準入力 | $4.00 / 100万トークン | プロンプト、システム指示、会話履歴、その他の入力テキスト |
| 出力 | $24.00 / 100万トークン | 表示される回答トークン、推論トークンが含まれる場合あり |
| キャッシュ入力 | $0.40 / 100万トークン | 再利用されるプロンプト/コンテキスト部分は割引料金で課金 |
| ロングコンテキスト入力 | $8.00 / 100万トークン | 入力が 272K トークンを超えた場合に適用 |
| ロングコンテキスト出力 | $36.00 / 100万トークン | 同一ロングコンテキストセッションで適用 |
| コンテキストウィンドウ | 100万トークン | 大きなプロンプトがしきい値を超える場合はロングコンテキスト料金に注意 |
| 最大出力 | 128K トークン | 出力バジェットであり、保証されるレスポンス長ではない |
GPT-5.5 の課金の仕組み
GPT-5.5 の課金には、入力・出力・キャッシュ入力の 3 つのトークンカテゴリがあります。
キャッシュ入力の例
アプリケーションが 50K トークンの固定指示+ドキュメントブロックを毎回送信するケースを考えます。
| リクエスト種別 | 計算式 | コスト |
|---|---|---|
| 初回(キャッシュなし) | 50K × $4.00 / 100万 | $0.20 |
| 以降(キャッシュあり) | 50K × $0.40 / 100万 | $0.02 |
この差が、安定したプロンプト設計が重要な理由です。再利用可能な指示はリクエスト間で完全に同一に保ち、長くて安定したコンテキストは一貫して再利用できる位置に配置しましょう。
272K トークン超のロングコンテキスト料金
GPT-5.5 は大きなコンテキストウィンドウを持っていますが、ロングコンテキストのプロンプトには別途コスト計画が必要です。EvoLink では、入力が 272K トークンを超えた場合、ロングコンテキスト料金は以下のとおりです。
| GPT-5.5 階層 | 入力 | 出力 |
|---|---|---|
| 標準料金 | $4.00 / 100万 | $24.00 / 100万 |
| ロングコンテキスト料金 | $8.00 / 100万 | $36.00 / 100万 |
ロングコンテキスト料金はセッション全体に適用され、272K を超えたトークンだけではありません。300K の入力トークンを送信した場合、300K 全体がロングコンテキスト入力料金で課金されます。
ロングコンテキストのコスト例
300K 入力 / 20K 出力のリクエスト:
| 項目 | 計算式 | コスト |
|---|---|---|
| 入力 | 300K × $8.00 / 100万 | $2.40 |
| 出力 | 20K × $36.00 / 100万 | $0.72 |
| 合計 | $2.40 + $0.72 | $3.12 |
同じリクエストがロングコンテキストしきい値以下であれば、標準料金で $1.68 相当です。常にコンテキストを細かく分割すべきということではなく、1 回の完全コンテキストリクエストに追加コストを払う価値があるかどうかを判断する材料です。
GPT-5.5 API コスト例
以下はコスト計画の参考例です。実際の請求額はプロンプト長、出力長、キャッシュヒット率、リトライ回数、推論トークンの有無によって異なります。
| シナリオ | 入力 | 出力 | 適用料金 | 見積もりコスト |
|---|---|---|---|---|
| カスタマーサポート回答 | 2K | 500 | 標準 | $0.020 |
| コードレビュー | 20K | 5K | 標準 | $0.200 |
| リポジトリ分析 | 300K | 20K | ロングコンテキスト | $3.120 |
コスト計算:
- 2K 入力 + 500 出力 =
(2,000 × $4 / 100万) + (500 × $24 / 100万)= $0.020 - 20K 入力 + 5K 出力 =
(20,000 × $4 / 100万) + (5,000 × $24 / 100万)= $0.200 - 300K 入力 + 20K 出力 =
(300,000 × $8 / 100万) + (20,000 × $36 / 100万)= $3.120
GPT-5.5 と GPT-5.4 の料金比較
GPT-5.5 はプレミアム路線、GPT-5.4 はコストパフォーマンス重視のフラッグシップ路線です。ここでは簡潔に比較します。詳細な比較は GPT-5.5 vs GPT-5.4 の専用記事をご覧ください。
| モデル | 入力 | 出力 | キャッシュ入力 | コンテキスト |
|---|---|---|---|---|
| GPT-5.5 | $4.00 / 100万 | $24.00 / 100万 | $0.40 / 100万 | 100万 |
| GPT-5.4 | $2.00 / 100万 | $12.00 / 100万 | $0.20 / 100万 | 105万 |
ロングコンテキストでコストを抑えたい場合は GPT-5.4 を選択。推理負荷が高いタスク、品質重視のタスク、リトライコストが高いタスクでは GPT-5.5 を試す価値があります。
GPT-5.5 を使うべきケースは?
GPT-5.5 はすべてのリクエストのデフォルトではありません。タスクの価値がプレミアム料金に見合う場面で使うべきモデルです。
向いているケース
- 誤答のコストが大きい複雑な推論タスク
- リポジトリ全体のコード分析、アーキテクチャレビュー、マルチファイルデバッグ
- 多数のドキュメントを横断する調査・総合
- 計画の精度がリトライを減らすエージェントワークフロー
- 人手による修正を最小化したい高価値な出力
向いていないケース
- 単純な分類
- 大量のテキスト要約
- 軽量な情報抽出
- 低マージンのコンテンツ生成
- 安価なモデルで十分なプロトタイピング
実用的なルールはシンプルです。推論力の向上が失敗・リトライ・人手レビューを減らせるなら GPT-5.5。ルーティンワークなら安価な GPT ルートを使いましょう。
GPT-5.5 API コストを削減する方法
1. 安定したプロンプトをキャッシュする
システムプロンプト、ポリシー、ツール説明、ドキュメントブロックをリクエスト間で固定しましょう。キャッシュ入力は $0.40 / 100万トークン、標準入力は $4.00 / 100万トークンです。
2. シンプルなタスクは別のモデルへルーティング
すべてのリクエストを GPT-5.5 に送る必要はありません。単純なタスクには低コストの GPT ルートを使い、GPT-5.5 はエスカレーションや高価値推論に限定しましょう。
def select_model(task_complexity: str) -> str:
if task_complexity == "simple":
return "gpt-5.1"
if task_complexity == "standard":
return "gpt-5.2"
if task_complexity == "long_context":
return "gpt-5.4"
return "gpt-5.5"3. 不必要なロングコンテキストリクエストを避ける
プロンプトが 272K トークン付近の場合、検索・要約・チャンキングで回答品質を損なわずにリクエストサイズを縮小できないか確認しましょう。
4. タスク成功あたりのコストを追跡する
トークン単価は一つの指標に過ぎません。リトライ回数、バリデーション失敗率、人手レビュー時間、レイテンシ、最終成功率を追跡しましょう。高いモデルでも失敗の繰り返しを回避できるなら総コストが下がることがあります。ただし、自分のワークフローで実測する必要があります。
5. GPT-5.5 をエスカレーションルートとして使う
よくあるパターンは、まず GPT-5.2 や GPT-5.4 で処理し、バリデーション失敗・信頼度低下・ユーザーからの深堀りリクエスト時にのみ GPT-5.5 にエスカレーションする方法です。
よくある質問
GPT-5.5 API の料金はいくらですか?
EvoLink では、GPT-5.5 は入力 $4.00 / 100万トークン、出力 $24.00 / 100万トークン、キャッシュ入力 $0.40 / 100万トークンです。272K トークン超のロングコンテキスト料金は入力 $8.00、出力 $36.00 / 100万トークンです。
GPT-5.5 のキャッシュ入力料金は?
EvoLink での GPT-5.5 キャッシュ入力料金は $0.40 / 100万トークンです。安定した指示、ドキュメント、ツール定義、会話テンプレートを繰り返し送信する場合に有効です。
入力が 272K トークンを超えるとどうなりますか?
入力が 272K トークンを超えると、EvoLink では GPT-5.5 のロングコンテキスト料金が適用されます。入力 $8.00 / 100万トークン、出力 $36.00 / 100万トークンで、セッション全体に適用されます。
GPT-5.5 は GPT-5.4 より高いですか?
はい。EvoLink での GPT-5.5 は $4.00 / $24.00(100万入力/出力トークン)、GPT-5.4 は $2.00 / $12.00 です。
GPT-5.5 はコーディングに使う価値がありますか?
マルチファイルデバッグ、リポジトリ分析、アーキテクチャレビュー、エージェンティックなコーディングワークフローなど、複雑なコーディングタスクには GPT-5.5 を試す価値があります。単純なコード補完や小規模な編集には、低コストの GPT ルートのほうが効率的です。
OpenAI 互換 API で GPT-5.5 を使えますか?
はい。EvoLink は OpenAI 互換のインテグレーションパスを提供しており、ほとんどのチームはベース URL、API キー、モデル値を変更するだけで移行できます。
from openai import OpenAI
client = OpenAI(
api_key="your-evolink-api-key",
base_url="https://api.evolink.ai/v1"
)
response = client.chat.completions.create(
model="gpt-5.5",
messages=[
{"role": "user", "content": "このコードベースの主なリスクを要約してください。"}
]
)GPT-5.5 と他の GPT モデルはどこで比較できますか?
まずは料金を把握し、自分のタスクでテストを
GPT-5.5 はプレミアムルートです。問うべきは「トークンあたりいくらか」だけでなく、「タスク成功あたりいくらか」です。
小規模なテストセットから始め、リトライ回数とレビュー時間を計測し、GPT-5.5 を GPT-5.4 や GPT-5.2 と比較した上で、結果に本当に差が出るワークフローに GPT-5.5 を投入しましょう。


