DeepSeek V4 Flash API

DeepSeek V4 Flash は V4 シリーズの高速汎用ティアです。1M コンテキスト、任意の thinking モード、Claude Sonnet より一桁安いコスト — EvoLink 上で OpenAI または Anthropic エンドポイントから呼び出せます。

モデルタイプ:

価格:

$0.147(~ 10 credits) 100万入力トークンあたり; $0.294(~ 20 credits) 100万出力トークンあたり

$0.029(~ 2 credits) 100万キャッシュ読み取りトークンあたり

本番ワークロード向けの安定したマネージドアクセスです。ダッシュボード請求、API キー管理、予測しやすい統合動作が必要な場合に適しています。

すべてのバージョンで同じ API エンドポイントを使用し、異なるのは model パラメータのみです。

DeepSeek V4 Flash — 1M コンテキストの高速コーディング

Flash は DeepSeek V4 のデフォルト高速ティア:コーディング調整済みの品質を Claude Sonnet や GPT-5.4 の数分の一のコストで提供。1M コンテキスト、任意の thinking モード、OpenAI と Anthropic の両エンドポイント対応 — 既存のスタックで使っている SDK でそのまま呼び出せます。

PRICING

PLAN	CONTEXT WINDOW	MAX OUTPUT	INPUT	OUTPUT	CACHE READ
DeepSeek V4 Flash	1,000,000	384,000	$0.148 (10 Credits)	$0.295 (20 Credits)	$0.030 (2 Credits)

Pricing Note: Prices show both USD and Credits. Units default to / 1M tokens unless noted separately.

Cache Hit: Price applies to cached prompt tokens.

DeepSeek V4 Flash API とは?

本番環境対応の DeepSeek V4 シリーズ高速ティア、OpenAI / Anthropic 互換。

ティア

V4 ファミリーの高速ティア

Flash は DeepSeek V4 の高速汎用ティアで、コーディングと長コンテキストタスクに最適化されています。Pro に近い品質を、はるかに低いレイテンシとコストで欲しいときに使います。

コンテキスト

1M トークンコンテキスト

Flash は 1M トークンのコンテキストウィンドウを提供 — リポジトリ全体、長いドキュメント、マルチターンのエージェント trace を 1 回の呼び出しで取り込めます。

キャッシュ

キャッシュ対応料金

DeepSeek V4 はプロンプトのプレフィックスを自動的にキャッシュします。キャッシュヒット時は入力コストが基本料金の 20% に下がります — システムプロンプトやツールスキーマを繰り返すエージェントループに最適。

DeepSeek V4 Flash で何が作れますか?

高スループットのコード補完

Flash の低レイテンシと積極的な料金は、IDE のオートコンプリート、インライン提案、CI 時のコードレビューに最適。予算を圧迫せずに数百万リクエストへスケールできます。

長コンテキストのコード解析

1M トークンのコンテキストで、Flash は中小規模のリポジトリ全体を 1 回の呼び出しで取り込めます。Pro の推論深度が不要なアーキテクチャレビュー、依存関係監査、マイグレーション計画に最適。

コスト効率の高いバッチ処理

Flash の低い基本レートに自動プレフィックスキャッシュ(キャッシュヒット時 80% オフ)が加わり、大規模なテスト生成・要約・ドキュメント作成が同等の Claude/GPT ワークロードより 10-15 倍安くなります。

EvoLink で DeepSeek V4 Flash を呼び出す理由

デュアルエンドポイント(OpenAI + Anthropic)、初日から利用可能、自動フォールバック、統合請求 — 1 つの API キーで Flash / Pro / Claude / GPT をカバー。

OpenAI と Anthropic エンドポイント

Flash は /v1/chat/completions(OpenAI)と /v1/messages(Anthropic)の両方で提供されます。既存スタックの SDK をそのまま使えます — マイグレーション不要。

自動フォールバック

Flash がレート制限に達したら、EvoLink は設定に応じて Pro、Claude、または GPT にフォールバック。手動切替なしでパイプラインが動き続けます。

ベンダー横断 A/B テスト

1 つの API キーで Flash、Pro、Claude、GPT が使えます。全ティアで同じコーディングタスクを実行し、実コードベースで品質・レイテンシ・コストを比較できます。

DeepSeek V4 Flash の統合方法

モデル ID を 1 つ変えるだけ — 新しい SDK 不要、新しいエンドポイント不要、新しい請求不要。

ステップ 1 — API キーの取得

evolink.ai/signup で登録してください。EvoLink キーは Flash、Pro、Claude、GPT、その他 170 以上のモデルで動作します。すでにアカウントをお持ちの方はステップ 2 へ。

ステップ 2 — API を呼び出す

base URL を https://evolink.ai/v1 に設定し、model: "deepseek-v4-flash" を渡します。OpenAI SDK に完全互換 — openai.chat.completions.create(...) を使ったことがあれば base URL を差し替えるだけ。Anthropic スタイルが好みなら /v1/messages に model: "deepseek-v4-flash" と x-api-key ヘッダーで呼び出し — 全く同じモデルです。

ステップ 3 — 必要に応じて thinking を有効化

Flash は速度のため thinking モードをデフォルトでオフにしています。より強い推論が必要なときは、リクエストごとに thinking: {"type": "enabled"} を追加すれば有効化されます — 同じモデル、コード変更不要。

DeepSeek V4 Flash & Pro vs Claude Opus 4.7 vs GPT-5.4

低コストの標準ルート、上位ルート、クローズド系フラッグシップ基準を比較するための実用的な API 比較です。

役割	DeepSeek V4 Flash	DeepSeek V4 Pro	Claude Opus 4.7 / GPT-5.4
最適な位置づけ	低コストの標準ルート	上位のプレミアムルート	クローズド系フラッグシップ基準
入力価格	$0.14 / 1M	$0.44 / 1M	$5.00 / $2.50 per 1M
出力価格	$0.28 / 1M	$0.88 / 1M	$25.00 / $15.00 per 1M
コンテキスト	1M	1M	200K / 1,050K
最大出力	384K	384K	32K / 128K
向いている用途	高スループットなコーディングとルーティング	より複雑なコーディングと推論	最高品質とエンタープライズの保険

完全比較を見る：DeepSeek V4 vs Claude vs GPT →

FAQ

Everything you need to know about the product and billing.

Flash は DeepSeek V4 シリーズのデフォルト高速ティアです。高スループットなコーディング、要約、エージェントワークロードを任意の thinking モードと 1M コンテキストで対応します。

レイテンシ重視や大量トラフィックのワークロード(オートコンプリート、バッチ解析、チャットボット)には Flash。深い推論、複雑なデバッグ、アーキテクチャ計画には Pro。両方とも同じ EvoLink API キーの下にあります。

はい。速度のためデフォルトでオフ。リクエストごとに thinking: {"type": "enabled"} で有効化できます。Pro はデフォルトでオン。

はい。EvoLink は Flash を /v1/chat/completions(OpenAI)と /v1/messages(Anthropic)の両方で公開しています。同じモデル ID、同じ API キー — スタックに合う SDK を選べばよいです。

DeepSeek はプロンプトのプレフィックスを自動でキャッシュします。キャッシュヒット時は該当部分が通常入力レートの 20% で課金されます。設定不要 — 同じシステムプロンプトやツールスキーマを呼び出し間で再利用するだけ。

1M トークン(約 1,048,576)。最大出力 384K トークン。

Flash は Sonnet 4.7 に近いコーディング品質を、トークンあたりコスト約 1/10 で目指しています。ベンチマーク重視のワークロードでは、1 つの EvoLink キーで両方を実行して独自評価を行うことをお勧めします。

あります。EvoLink は複数の DeepSeek チャネルで自動スケールし、上流が制限された場合は代替モデルへフォールバックします。ティアごとの分/日のリミットはダッシュボードで確認できます。

はい。同じキー、同じ請求。リクエストのモデル ID を変えるだけ。

DeepSeek は過去の主要モデルすべてをオープンソース化しています。セルフホストしたい場合は DeepSeek の公式リポジトリで V4 のウェイトを確認してください。それ以外は EvoLink がマネージド access を提供します。