HappyHorse 1.0 リリース今すぐ試す
GPT-5.5 API 料金ガイド 2026:コスト・キャッシュ入力・ロングコンテキスト料金
guide

GPT-5.5 API 料金ガイド 2026:コスト・キャッシュ入力・ロングコンテキスト料金

EvoLink Team
EvoLink Team
Product Team
2026年4月26日
13 分

GPT-5.5 API 料金ガイド 2026:コスト・キャッシュ入力・ロングコンテキスト料金

EvoLink での GPT-5.5 API 料金は、入力 $4.00/100万トークン出力 $24.00/100万トークンキャッシュ入力 $0.40/100万トークンです。入力が 272K トークンを超えるセッションでは、ロングコンテキスト料金が適用され、入力 $8.00出力 $36.00/100万トークンになります。
本記事は GPT-5.5 の料金のみを扱います。GPT ファミリー全体の比較は GPT-5 API 料金比較 をご覧ください。
料金に関する注記: 本記事の GPT-5.5 の数値は 2026 年 4 月 26 日時点の EvoLink 掲載価格です。OpenAI の公式料金を引用する場合は、別途 OpenAI の公式ページをご確認ください。

GPT-5.5 API 料金表

課金項目EvoLink 価格備考
標準入力$4.00 / 100万トークンプロンプト、システム指示、会話履歴、その他の入力テキスト
出力$24.00 / 100万トークン表示される回答トークン、推論トークンが含まれる場合あり
キャッシュ入力$0.40 / 100万トークン再利用されるプロンプト/コンテキスト部分は割引料金で課金
ロングコンテキスト入力$8.00 / 100万トークン入力が 272K トークンを超えた場合に適用
ロングコンテキスト出力$36.00 / 100万トークン同一ロングコンテキストセッションで適用
コンテキストウィンドウ100万トークン大きなプロンプトがしきい値を超える場合はロングコンテキスト料金に注意
最大出力128K トークン出力バジェットであり、保証されるレスポンス長ではない
最も重要な課金ルールは 272K しきい値です。GPT-5.5 は 100 万トークンのコンテキストウィンドウに対応しますが、プロンプトが大きすぎるとセッション全体がロングコンテキスト料金に切り替わります。

GPT-5.5 の課金の仕組み

GPT-5.5 の課金には、入力・出力・キャッシュ入力の 3 つのトークンカテゴリがあります。

入力トークンは、モデルに送信するすべてのトークンです。ユーザープロンプト、システムメッセージ、過去の会話、取得したドキュメント、コードスニペット、ツール指示が含まれます。
出力トークンは、モデルが生成するトークンです。推論モデルの場合、API レスポンスやモデル設定に応じて、表示テキストに加えて推論トークンが含まれることがあります。
キャッシュ入力トークンは、繰り返される入力セグメントで、割引料金で課金されます。同一のシステムプロンプト、ポリシーブロック、ツール説明、ドキュメントパック、会話テンプレートを繰り返し送信する場面でキャッシュが効果を発揮します。

キャッシュ入力の例

アプリケーションが 50K トークンの固定指示+ドキュメントブロックを毎回送信するケースを考えます。

リクエスト種別計算式コスト
初回(キャッシュなし)50K × $4.00 / 100万$0.20
以降(キャッシュあり)50K × $0.40 / 100万$0.02

この差が、安定したプロンプト設計が重要な理由です。再利用可能な指示はリクエスト間で完全に同一に保ち、長くて安定したコンテキストは一貫して再利用できる位置に配置しましょう。

272K トークン超のロングコンテキスト料金

GPT-5.5 は大きなコンテキストウィンドウを持っていますが、ロングコンテキストのプロンプトには別途コスト計画が必要です。EvoLink では、入力が 272K トークンを超えた場合、ロングコンテキスト料金は以下のとおりです。

GPT-5.5 階層入力出力
標準料金$4.00 / 100万$24.00 / 100万
ロングコンテキスト料金$8.00 / 100万$36.00 / 100万

ロングコンテキスト料金はセッション全体に適用され、272K を超えたトークンだけではありません。300K の入力トークンを送信した場合、300K 全体がロングコンテキスト入力料金で課金されます。

ロングコンテキストのコスト例

300K 入力 / 20K 出力のリクエスト:

項目計算式コスト
入力300K × $8.00 / 100万$2.40
出力20K × $36.00 / 100万$0.72
合計$2.40 + $0.72$3.12

同じリクエストがロングコンテキストしきい値以下であれば、標準料金で $1.68 相当です。常にコンテキストを細かく分割すべきということではなく、1 回の完全コンテキストリクエストに追加コストを払う価値があるかどうかを判断する材料です。

GPT-5.5 API コスト例

以下はコスト計画の参考例です。実際の請求額はプロンプト長、出力長、キャッシュヒット率、リトライ回数、推論トークンの有無によって異なります。

シナリオ入力出力適用料金見積もりコスト
カスタマーサポート回答2K500標準$0.020
コードレビュー20K5K標準$0.200
リポジトリ分析300K20Kロングコンテキスト$3.120

コスト計算:

  • 2K 入力 + 500 出力 = (2,000 × $4 / 100万) + (500 × $24 / 100万) = $0.020
  • 20K 入力 + 5K 出力 = (20,000 × $4 / 100万) + (5,000 × $24 / 100万) = $0.200
  • 300K 入力 + 20K 出力 = (300,000 × $8 / 100万) + (20,000 × $36 / 100万) = $3.120

GPT-5.5 と GPT-5.4 の料金比較

GPT-5.5 はプレミアム路線、GPT-5.4 はコストパフォーマンス重視のフラッグシップ路線です。ここでは簡潔に比較します。詳細な比較は GPT-5.5 vs GPT-5.4 の専用記事をご覧ください。

モデル入力出力キャッシュ入力コンテキスト
GPT-5.5$4.00 / 100万$24.00 / 100万$0.40 / 100万100万
GPT-5.4$2.00 / 100万$12.00 / 100万$0.20 / 100万105万

ロングコンテキストでコストを抑えたい場合は GPT-5.4 を選択。推理負荷が高いタスク、品質重視のタスク、リトライコストが高いタスクでは GPT-5.5 を試す価値があります。

GPT-5.5 を使うべきケースは?

GPT-5.5 はすべてのリクエストのデフォルトではありません。タスクの価値がプレミアム料金に見合う場面で使うべきモデルです。

向いているケース

  • 誤答のコストが大きい複雑な推論タスク
  • リポジトリ全体のコード分析、アーキテクチャレビュー、マルチファイルデバッグ
  • 多数のドキュメントを横断する調査・総合
  • 計画の精度がリトライを減らすエージェントワークフロー
  • 人手による修正を最小化したい高価値な出力

向いていないケース

  • 単純な分類
  • 大量のテキスト要約
  • 軽量な情報抽出
  • 低マージンのコンテンツ生成
  • 安価なモデルで十分なプロトタイピング

実用的なルールはシンプルです。推論力の向上が失敗・リトライ・人手レビューを減らせるなら GPT-5.5。ルーティンワークなら安価な GPT ルートを使いましょう。

GPT-5.5 API コストを削減する方法

1. 安定したプロンプトをキャッシュする

システムプロンプト、ポリシー、ツール説明、ドキュメントブロックをリクエスト間で固定しましょう。キャッシュ入力は $0.40 / 100万トークン、標準入力は $4.00 / 100万トークンです。

2. シンプルなタスクは別のモデルへルーティング

すべてのリクエストを GPT-5.5 に送る必要はありません。単純なタスクには低コストの GPT ルートを使い、GPT-5.5 はエスカレーションや高価値推論に限定しましょう。

def select_model(task_complexity: str) -> str:
    if task_complexity == "simple":
        return "gpt-5.1"
    if task_complexity == "standard":
        return "gpt-5.2"
    if task_complexity == "long_context":
        return "gpt-5.4"
    return "gpt-5.5"

3. 不必要なロングコンテキストリクエストを避ける

プロンプトが 272K トークン付近の場合、検索・要約・チャンキングで回答品質を損なわずにリクエストサイズを縮小できないか確認しましょう。

4. タスク成功あたりのコストを追跡する

トークン単価は一つの指標に過ぎません。リトライ回数、バリデーション失敗率、人手レビュー時間、レイテンシ、最終成功率を追跡しましょう。高いモデルでも失敗の繰り返しを回避できるなら総コストが下がることがあります。ただし、自分のワークフローで実測する必要があります。

5. GPT-5.5 をエスカレーションルートとして使う

よくあるパターンは、まず GPT-5.2 や GPT-5.4 で処理し、バリデーション失敗・信頼度低下・ユーザーからの深堀りリクエスト時にのみ GPT-5.5 にエスカレーションする方法です。

よくある質問

GPT-5.5 API の料金はいくらですか?

EvoLink では、GPT-5.5 は入力 $4.00 / 100万トークン、出力 $24.00 / 100万トークン、キャッシュ入力 $0.40 / 100万トークンです。272K トークン超のロングコンテキスト料金は入力 $8.00、出力 $36.00 / 100万トークンです。

GPT-5.5 のキャッシュ入力料金は?

EvoLink での GPT-5.5 キャッシュ入力料金は $0.40 / 100万トークンです。安定した指示、ドキュメント、ツール定義、会話テンプレートを繰り返し送信する場合に有効です。

入力が 272K トークンを超えるとどうなりますか?

入力が 272K トークンを超えると、EvoLink では GPT-5.5 のロングコンテキスト料金が適用されます。入力 $8.00 / 100万トークン、出力 $36.00 / 100万トークンで、セッション全体に適用されます。

GPT-5.5 は GPT-5.4 より高いですか?

はい。EvoLink での GPT-5.5 は $4.00 / $24.00(100万入力/出力トークン)、GPT-5.4 は $2.00 / $12.00 です。

GPT-5.5 はコーディングに使う価値がありますか?

マルチファイルデバッグ、リポジトリ分析、アーキテクチャレビュー、エージェンティックなコーディングワークフローなど、複雑なコーディングタスクには GPT-5.5 を試す価値があります。単純なコード補完や小規模な編集には、低コストの GPT ルートのほうが効率的です。

OpenAI 互換 API で GPT-5.5 を使えますか?

はい。EvoLink は OpenAI 互換のインテグレーションパスを提供しており、ほとんどのチームはベース URL、API キー、モデル値を変更するだけで移行できます。

from openai import OpenAI

client = OpenAI(
    api_key="your-evolink-api-key",
    base_url="https://api.evolink.ai/v1"
)

response = client.chat.completions.create(
    model="gpt-5.5",
    messages=[
        {"role": "user", "content": "このコードベースの主なリスクを要約してください。"}
    ]
)

GPT-5.5 と他の GPT モデルはどこで比較できますか?

GPT モデルファミリーページ でラインナップ全体を確認するか、GPT-5 API 料金比較 で GPT-5.5、GPT-5.4、GPT-5.2、GPT-5.1 の料金を一覧できます。

まずは料金を把握し、自分のタスクでテストを

GPT-5.5 はプレミアムルートです。問うべきは「トークンあたりいくらか」だけでなく、「タスク成功あたりいくらか」です。

小規模なテストセットから始め、リトライ回数とレビュー時間を計測し、GPT-5.5 を GPT-5.4 や GPT-5.2 と比較した上で、結果に本当に差が出るワークフローに GPT-5.5 を投入しましょう。

AIコストを89%削減する準備はできましたか?

今すぐEvoLinkを始めて、インテリジェントなAPIルーティングの力を体験してください。