GPT-5.1シリーズ (API)
EvoLink の統合 API ゲートウェイを介して GPT-5.1 モデル ファミリにアクセスします。 GPT-5.1 は、400k コンテキスト、128k 最大出力トークン、および 2024 年 9 月 30 日のナレッジ カットオフをサポートします。アカウントとエンドポイントでサポートされている場合は、ストリーミング、関数呼び出し、構造化出力、プロンプト キャッシュを有効にします。
PRICING
| PLAN | CONTEXT WINDOW | MAX OUTPUT | INPUT | OUTPUT | CACHE READ |
|---|---|---|---|---|---|
| GPT-5.1 | 400.0K | 128.0K | $1.00-20% $1.25Official Price | $8.00-20% $10.00Official Price | $0.104-17% $0.125Official Price |
| GPT-5.1 (Beta) | 400.0K | 128.0K | $0.325-74% $1.25Official Price | $2.60-74% $10.00Official Price | $0.033-74% $0.125Official Price |
Pricing Note: Price unit: USD / 1M tokens
Cache Hit: Price applies to cached prompt tokens.
Two ways to run GPT-5.1 — pick the tier that matches your workload.
- · GPT-5.1: the default tier for production reliability and predictable availability.
- · GPT-5.1 (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.
GPT-5.1 API で構築 — 本番環境に対応したインテリジェンス
信頼性の高いチャット パフォーマンス、ツールを使用したワークフロー、およびスケーラブルな長いコンテキストの処理には、GPT-5.1 API を使用してください。応答またはチャット完了を介して統合し、ストリーミングおよび構造化された出力を有効にし、リリースの安定性を確保するためにスナップショットを固定します。

GPT-5.1 API は何を実現できますか?
大規模なコンテキスト分析
GPT-5.1 の 400k コンテキスト ウィンドウと最大 128k の出力トークンを使用して、より大きな入力と長い会話履歴を処理します。これは、過剰な手動チャンク化を行わずに、リポジトリのレビュー、長いドキュメントの分析、または複数ステップの調査を実行する場合に役立ちます。

高度な推論
計画、コーディング支援、意思決定支援など、複数のステップでの思考が必要な問題の場合は、構成可能な推論作業を使用します。 GPT-5.1 は、なし、低、中、高の労力をサポートしているため、速度、コスト、深さのバランスをとることができます。

プロンプトキャッシング
プロンプト キャッシュは、1,024 トークン以上のプロンプトに対して自動的に有効になります。安定したプレフィックス (システム プロンプト、ポリシー、数ショットの例) を再利用し、メモリ内または 24 時間の保持を選択して、繰り返しの処理を減らし、スループットを向上させます。

開発者が GPT-5.1 API を選ぶ理由
GPT-5.1 はスナップショットとエイリアスを備えたモデル ファミリであり、安定した運用動作と明確なアップグレード パスを提供します。
モデルファミリーの設計
一貫性のある API 表面を維持しながら、利用可能な場合は gpt-5.1-chat-latest や gpt-5.1-codex などのチャット指向またはコーディング指向のエイリアスを使用します。
実用的なロングコンテキストのワークフロー
最大 128,000 の出力トークンを備えた 400,000 のコンテキスト ウィンドウにより、タスクの一貫性が維持され、複雑なチャンク パイプラインの必要性が軽減されます。
実稼働統合のための API 機能
ストリーミング、関数呼び出し、構造化出力、およびプロンプト キャッシュが GPT-5.1 でサポートされているため、このモデルは実際の運用システムに適合します。
GPT-5.1 API を統合する方法
EvoLink の統合ゲートウェイを介して 3 つのステップで GPT-5.1 の使用を開始します。
ステップ 1 — API キーを取得する
アカウントを作成し、API キーを生成し、環境変数を構成します。特定の GPT-5.1 バリアントへのアクセスは、使用層と組織の検証によって異なります。
ステップ 2 — クライアントを構成する
好みの SDK または直接 HTTP 呼び出しを使用します。ベース URL をゲートウェイ エンドポイントに設定し、応答またはチャット完了を選択します。対象とするモデルのエイリアスを渡します (例: gpt-5.1 または gpt-5.1-chat-latest)。
ステップ 3 — 構築を開始する
最初に小さなテストリクエストを送信し、次にストリーミング、関数呼び出し、構造化出力、またはキャッシュを追加します。動作を検証するために、prompt_tokens_details.cached_tokens などの応答の使用状況フィールドを監視します。
コア API 機能
GPT-5.1 API の技術仕様
長いコンテキスト (利用可能な場合)
GPT-5.1 には、2024 年 9 月 30 日をナレッジ カットオフとして、400k のコンテキスト ウィンドウと最大 128k の出力トークンがリストされています。
プロンプト キャッシュ (サポートされている場合)
プレフィックスが正確に一致する 1,024 トークン以上のプロンプトの自動キャッシュ。 prompt_cache_retention in_memory または 24h を使用します。
推論指向のバリアント
構成可能な推論労力 (なし、低、中、高) により、リクエストごとの速度、コスト、深さをトレードオフできます。
関数/ツール呼び出し
JSON スキーマ ツールを定義し、応答やチャット完了などのエンドポイントを越えてシステムへの構造化呼び出しをルーティングします。
構造化された出力 (利用可能な場合)
スキーマ準拠の JSON 応答は GPT-5.1 でサポートされています。構造化出力形式に対するエンドポイントのサポートを確認します。
ストリーミング
レスポンスやリアルタイムなどのサポートされているエンドポイントを介して、レスポンシブ UI の部分トークンをストリーミングします。
GPT-5.1 API - よくある質問
Everything you need to know about the product and billing.