
GPT Image 1.5 API 運用ガイド:価格、レイテンシ分析、およびスケーリング・アーキテクチャ

gpt-image-1.5) として API 経由で公開しました。このリリースでは、指示への高い追従性、より精密な編集、改善された密集テキストの描画、そして従来のモデルと比較して最大 4 倍 高速化された画像生成速度が強調されています。エグゼクティブ・サマリー:本番環境において GPT Image 1.5 が変えること
GPT Image 1.5 は、リリース時点で OpenAI の最も有能な汎用テキスト・画像生成モデルとして位置付けられており、特に以下の点に重点が置かれています。
- 指示の追従性:「細部に至るまで」の変更がより信頼できるものになりました。
- 編集と保持:キーワードとなる要素(例えば、編集を繰り返しても本人の特徴やブランドのビジュアルなど)を一貫した状態に保ちながら、編集を適用する能力が向上しました。
- テキスト描画:画像内に密集したテキストを描画する能力が向上しました。
- 速度:画像生成速度が最大 4 倍 高速化されました(OpenAI 発表)。
一方で、負荷時のレイテンシの変動、安全フィルターによる拒否、高画質・高解像度生成に伴うコストの急増といった、アーキテクチャ上の課題が魔法のように解決されるわけではありません。これらは、設計段階で考慮すべき問題です。
競争環境:GPT Image 1.5 vs Nano Banana Pro vs FLUX
| カテゴリー | GPT Image 1.5 (OpenAI) | Nano Banana Pro (Google DeepMind) | FLUX シリーズ (Black Forest Labs) |
|---|---|---|---|
| 位置付け | 汎用的な画像生成 + 強力な編集機能・指示追従 | Gemini 3 ベース。「スタジオ品質の精度・制御」と鮮明なテキストに特化 | テキスト・画像生成 + 編集バリアント (Kontext / Fill など)。API 利用とセルフホスト両方の選択肢あり |
| 画像内のテキスト | 改善された密集テキストの描画 | ポスターや図表向けの「鮮明なテキスト生成」 | モデルやワークフローによる。編集に特化した強力なラインナップ |
| 編集と保持 | 編集を繰り返しても重要な詳細を保持する精密な編集を強調 | 編集における精度と制御を強調 | 強力な編集カタログ(Kontext / Fill など) |
本番環境のパフォーマンス:レイテンシの傾向と信頼性
画像モデルにおける一般的なレイテンシ増大の要因は以下の通りです。
- 解像度とアスペクト比(出力が大きいほど時間がかかる)
- プロンプトの複雑さと繰り返しの編集操作
- トラフィックスパイク / キューの待機
- 安全フィルターによる拒否や一時的なエラー後の再試行ループ
- タイムアウト設定 + 冪等性キー (Idempotency Key)(または独自のリクエスト ID)を使用する
- 長時間の生成処理のために 非同期ジョブキュー を導入する
- 段階的なフォールバック(低画質、小サイズ、または代替モデルへの切り替え)を実装する



安全フィルター:拒否を「通常の例外」としてあらかじめ設計する
OpenAI の画像 API は安全ポリシーを強制します。プロンプトや編集内容が拒否される可能性があります。本番環境では、「拒否」を通常の処理結果の 1 つとして扱うべきです。
- ユーザーに対して具体的で分かりやすい UI フィードバックを表示する
- 拒否されたカテゴリーをログに記録する(可能な場合)
- 安全なプロンプトの修正案をユーザーに提示する
- 再試行の嵐(リトライによる過負荷)を避けるため、再試行回数を制限する
価格体系:公式 GPT Image 1.5 のコスト(画像単位 + トークン単位)
OpenAI は、以下の両方の料金体系を公開しています。
- 画像単位の価格:品質とサイズに基づく
- 画像トークンの価格:トークンベースの計算における画像入力・出力
画像単位の価格(公式)
| 品質 | 1024×1024 | 1024×1536 | 1536×1024 |
|---|---|---|---|
| 低 (Low) | $0.009 | $0.013 | $0.013 |
| 中 (Medium) | $0.034 | $0.05 | $0.05 |
| 高 (High) | $0.133 | $0.2 | $0.2 |
画像トークンの価格(公式)
gpt-image-1.5:画像トークン 入力 $8 / 出力 $32(100 万トークンあたり)gpt-image-1:画像トークン 入力 $10 / 出力 $40(100 万トークンあたり)
開発者体験:設計時に考慮すべきこと
モデル自体が強力であっても、信頼性の高いプロダクトをリリースするためには以下のエンジニアリングが必要です。
- レート制限と背圧制御 (Rate Limits & Backpressure):429 エラーを想定し、リクエストをキューイングする設計
- 仕様の差異 (Schema Drift):プロバイダー間のパラメータ、エラーコード、レスポンス形式の違いの吸収
- オブザーバビリティ (Observability):リクエストごとのコスト、レイテンシ、失敗の理由、フォールバック率の可視化
EvoLink による統一 API パターン
統合ゲートウェイのアプローチは、以下の手段で運用負荷を軽減できます。
- リクエスト/レスポンス形式の標準化:ベンダー間の差異を吸収
- ルーティング・ルールの追加:例えば、テキストの多いポスターには GPT Image 1.5 を選択し、写実的なシーンには許容範囲内で別のモデルを選択するなどの制御
- フォールバック戦略:特定のプロバイダーが拒否やエラーを返した際に、自動的に別のモデルへ切り替え
- 集約された利用分析:コストとパフォーマンスを一つの画面で追跡
クイックスタート:EvoLink 経由での GPT Image 1.5
EvoLink は GPT Image 1.5 向けの統一エンドポイントを提供します。テキストからの生成、画像からの生成、画像編集モードをすべて非同期処理でサポートします。
POST https://api.evolink.ai/v1/images/generations| パラメータ | 型 | 必須 | 説明 |
|---|---|---|---|
| model | string | 有 | gpt-image-1.5-lite を使用 |
| prompt | string | 有 | 画像の説明。最大 2000 トークン |
| size | enum | 無 | 1:1, 3:4, 4:3, 1024x1024, 1024x1536, 1536x1024 |
| quality | enum | 無 | low, medium, high, auto (デフォルト) |
| image_urls | array | 無 | 編集用の参照画像(1〜16枚)。各最大 50MB |
| n | integer | 無 | 画像の枚数(現在は 1 枚のみ対応) |
実行例:テキストからの画像生成
curl --request POST \
--url https://api.evolink.ai/v1/images/generations \
--header 'Authorization: Bearer YOUR_API_KEY' \
--header 'Content-Type: application/json' \
--data '{
"model": "gpt-image-1.5-lite",
"prompt": "A professional product photo of a sleek smartwatch on a marble surface, soft studio lighting, 4K quality",
"size": "1024x1024",
"quality": "high"
}'実行例:画像編集
curl --request POST \
--url https://api.evolink.ai/v1/images/generations \
--header 'Authorization: Bearer YOUR_API_KEY' \
--header 'Content-Type: application/json' \
--data '{
"model": "gpt-image-1.5-lite",
"prompt": "Change the background to a sunset beach scene, keep the product unchanged",
"image_urls": ["https://your-cdn.example.com/product-photo.jpg"],
"size": "1024x1024",
"quality": "high"
}'レスポンス形式
API は非同期タスクを返します。返された ID を使用してタスクの状態をポーリングしてください。
{
"created": 1757156493,
"id": "task-unified-1757156493-imcg5zqt",
"model": "gpt-image-1.5-lite",
"status": "pending",
"progress": 0,
"task_info": {
"can_cancel": true,
"estimated_time": 100
},
"usage": {
"credits_reserved": 2.5
}
}注: 生成された画像は 24 時間後 に期限切れとなります。速やかにダウンロードして保存してください。


結論
gpt-image-1.5) は、2025 年における本番レベルの画像ワークフローに向けた大きな一歩です。OpenAI は、指示への追従性の改善、重要な詳細を保持する精密な編集、改善されたテキスト描画、そして最大 4 倍の高速化を明確に打ち出しています。スケーラブルで信頼性の高いサービスを提供するためには、画像をインフラの問題として捉えてください。レイテンシの分布を測定し、公式の価格体系に基づいて予算を組み、安全フィルターによる拒否を適切に処理し、そしてユーザー体験とユニットエコノミクスを保護するルーティングやフォールバックのパターンを設計しましょう。


