Seedance 2.0 API — Coming SoonGet early access

GPT-5.1シリーズ (API)

EvoLink の統合 API ゲートウェイを介して GPT-5.1 モデル ファミリにアクセスします。 GPT-5.1 は、400k コンテキスト、128k 最大出力トークン、および 2024 年 9 月 30 日のナレッジ カットオフをサポートします。アカウントとエンドポイントでサポートされている場合は、ストリーミング、関数呼び出し、構造化出力、プロンプト キャッシュを有効にします。

Run With API
Using coding CLIs? Run GPT-5.1 via EvoCode — One API for Code Agents & CLIs. (View Docs)
$

PRICING

PLANCONTEXT WINDOWMAX OUTPUTINPUTOUTPUTCACHE READ
GPT-5.1400.0K128.0K
$1.00-20%
$1.25Official Price
$8.00-20%
$10.00Official Price
$0.104-17%
$0.125Official Price
GPT-5.1 (Beta)400.0K128.0K
$0.325-74%
$1.25Official Price
$2.60-74%
$10.00Official Price
$0.033-74%
$0.125Official Price

Pricing Note: Price unit: USD / 1M tokens

Cache Hit: Price applies to cached prompt tokens.

Two ways to run GPT-5.1 — pick the tier that matches your workload.

  • · GPT-5.1: the default tier for production reliability and predictable availability.
  • · GPT-5.1 (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.

GPT-5.1 API で構築 — 本番環境に対応したインテリジェンス

信頼性の高いチャット パフォーマンス、ツールを使用したワークフロー、およびスケーラブルな長いコンテキストの処理には、GPT-5.1 API を使用してください。応答またはチャット完了を介して統合し、ストリーミングおよび構造化された出力を有効にし、リリースの安定性を確保するためにスナップショットを固定します。

GPT-5.1 API の視覚化

GPT-5.1 API は何を実現できますか?

大規模なコンテキスト分析

GPT-5.1 の 400k コンテキスト ウィンドウと最大 128k の出力トークンを使用して、より大きな入力と長い会話履歴を処理します。これは、過剰な手動チャンク化を行わずに、リポジトリのレビュー、長いドキュメントの分析、または複数ステップの調査を実行する場合に役立ちます。

大規模なコンテキストの処理

高度な推論

計画、コーディング支援、意思決定支援など、複数のステップでの思考が必要な問題の場合は、構成可能な推論作業を使用します。 GPT-5.1 は、なし、低、中、高の労力をサポートしているため、速度、コスト、深さのバランスをとることができます。

高度な推論

プロンプトキャッシング

プロンプト キャッシュは、1,024 トークン以上のプロンプトに対して自動的に有効になります。安定したプレフィックス (システム プロンプト、ポリシー、数ショットの例) を再利用し、メモリ内または 24 時間の保持を選択して、繰り返しの処理を減らし、スループットを向上させます。

コストの最適化

開発者が GPT-5.1 API を選ぶ理由

GPT-5.1 はスナップショットとエイリアスを備えたモデル ファミリであり、安定した運用動作と明確なアップグレード パスを提供します。

モデルファミリーの設計

一貫性のある API 表面を維持しながら、利用可能な場合は gpt-5.1-chat-latest や gpt-5.1-codex などのチャット指向またはコーディング指向のエイリアスを使用します。

実用的なロングコンテキストのワークフロー

最大 128,000 の出力トークンを備えた 400,000 のコンテキスト ウィンドウにより、タスクの一貫性が維持され、複雑なチャンク パイプラインの必要性が軽減されます。

実稼働統合のための API 機能

ストリーミング、関数呼び出し、構造化出力、およびプロンプト キャッシュが GPT-5.1 でサポートされているため、このモデルは実際の運用システムに適合します。

GPT-5.1 API を統合する方法

EvoLink の統合ゲートウェイを介して 3 つのステップで GPT-5.1 の使用を開始します。

1

ステップ 1 — API キーを取得する

アカウントを作成し、API キーを生成し、環境変数を構成します。特定の GPT-5.1 バリアントへのアクセスは、使用層と組織の検証によって異なります。

2

ステップ 2 — クライアントを構成する

好みの SDK または直接 HTTP 呼び出しを使用します。ベース URL をゲートウェイ エンドポイントに設定し、応答またはチャット完了を選択します。対象とするモデルのエイリアスを渡します (例: gpt-5.1 または gpt-5.1-chat-latest)。

3

ステップ 3 — 構築を開始する

最初に小さなテストリクエストを送信し、次にストリーミング、関数呼び出し、構造化出力、またはキャッシュを追加します。動作を検証するために、prompt_tokens_details.cached_tokens などの応答の使用状況フィールドを監視します。

コア API 機能

GPT-5.1 API の技術仕様

容量

長いコンテキスト (利用可能な場合)

GPT-5.1 には、2024 年 9 月 30 日をナレッジ カットオフとして、400k のコンテキスト ウィンドウと最大 128k の出力トークンがリストされています。

効率

プロンプト キャッシュ (サポートされている場合)

プレフィックスが正確に一致する 1,024 トークン以上のプロンプトの自動キャッシュ。 prompt_cache_retention in_memory または 24h を使用します。

知能

推論指向のバリアント

構成可能な推論労力 (なし、低、中、高) により、リクエストごとの速度、コスト、深さをトレードオフできます。

統合

関数/ツール呼び出し

JSON スキーマ ツールを定義し、応答やチャット完了などのエンドポイントを越えてシステムへの構造化呼び出しをルーティングします。

信頼性

構造化された出力 (利用可能な場合)

スキーマ準拠の JSON 応答は GPT-5.1 でサポートされています。構造化出力形式に対するエンドポイントのサポートを確認します。

パフォーマンス

ストリーミング

レスポンスやリアルタイムなどのサポートされているエンドポイントを介して、レスポンシブ UI の部分トークンをストリーミングします。

GPT-5.1 API - よくある質問

Everything you need to know about the product and billing.

OpenAI のモデル ドキュメントには、GPT-5.1 の 400,000 トークンのコンテキスト ウィンドウと最大 128,000 の最大出力トークンがリストされており、ナレッジ カットオフは 2024 年 9 月 30 日です。ダッシュボードとモデル ドキュメントをアカウントの信頼できる情報源として使用します。
プロンプト キャッシュは、1,024 トークン以上のプロンプトに対して自動的に行われ、プレフィックスが完全に一致する場合にのみ機能します。 prompt_cache_retention を in_memory または 24h に設定します。キャッシュされたトークンは、usage.prompt_tokens_details.cached_tokens に表示され、キャッシュの範囲は組織に限定されます。
GPT-5.1 は、なし (デフォルト)、低、中、および高のreasoning.effort値をサポートします。レイテンシの影響を受けやすいタスクには低い労力を使用し、より深い複数ステップの推論には高い労力を使用します。
はい。 GPT-5.1 は、ストリーミング、関数呼び出し、構造化出力をサポートしています。アカウントとエンドポイントの可用性に応じて、応答、チャット完了、リアルタイム、アシスタント、バッチなどのエンドポイントで利用できます。
キャッシュ ヒットにはプレフィックスの正確な一致が必要です。静的な命令と例を先頭に置き、動的なユーザー データを最後に移動し、ツール定義を同一に保ちます。また、prompt_cache_key を使用してルーティングに影響を与え、共有プレフィックスのキャッシュ ヒット率を向上させることもできます。
構造化出力は JSON スキーマの準拠を強制し、GPT-5.1 では構造化出力がサポートされているものとしてリストされています。可用性はエンドポイントに依存する可能性があるため、アカウントのモデル ドキュメントでサポートを確認してください。
スナップショット モデル ID を使用して特定のバージョンを固定し、厳密な一貫性が必要な場合は最新のエイリアスに依存しないようにします。 GPT-5.1 モデルのページには、gpt-5.1-2025-11-13 などのスナップショット ID がリストされます。
OpenAI には、入力、キャッシュされた入力、および出力の 100 万トークンあたりの GPT-5.1 料金がリストされています (例: $1.25 / $0.125 / $10.00)。 EvoLink による実際の価格は、ルーティング、プラン、割引によって異なる場合があるため、常に価格表とダッシュボードの使用状況/請求データを信頼できる情報源として使用してください。