Seedance 2.0 API — Coming SoonGet early access

Gemini 3 フラッシュ プレビュー API

OpenAI SDK 互換性とネイティブ Gemini API サポートを備えた EvoLink を介して、Google の Gemini 3 Flash プレビュー (gemini-3-flash-preview) にアクセスします。 1,048,576 トークンのコンテキスト ウィンドウを使用してテキスト、画像、ビデオ、オーディオ、PDF 入力を送信し、実稼働ワークロード用のキャッシュとバッチ オプションを追加します。

Run With API
Using coding CLIs? Run Gemini 3 Flash via EvoCode — One API for Code Agents & CLIs. (View Docs)
$

PRICING

PLANCONTEXT WINDOWMAX OUTPUTINPUTOUTPUTCACHE READ
Gemini 3 Flash1.05M65.5K
200.0K$0.400-20%
$0.500Official Price
>200.0K$0.400-20%
$0.500Official Price
200.0K$2.40-20%
$3.00Official Price
>200.0K$2.40-20%
$3.00Official Price
200.0K$0.040-19%
$0.050Official Price
>200.0K$0.040-19%
$0.050Official Price
Gemini 3 Flash (Beta)1.05M65.5K
200.0K$0.130-74%
$0.500Official Price
>200.0K$0.130-74%
$0.500Official Price
200.0K$0.780-74%
$3.00Official Price
>200.0K$0.780-74%
$3.00Official Price
200.0K$0.013-74%
$0.050Official Price
>200.0K$0.013-74%
$0.050Official Price

Pricing Note: Price unit: USD / 1M tokens

Cache Hit: Price applies to cached prompt tokens.

Two ways to run Gemini 3 Flash — pick the tier that matches your workload.

  • · Gemini 3 Flash: the default tier for production reliability and predictable availability.
  • · Gemini 3 Flash (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.

Gemini 3 EvoLink での API のフラッシュ プレビュー

速度とスケールを重視して構築された Gemini 3 Flash Preview は、テキスト、画像、ビデオ、オーディオ、PDF を理解し、大量のコンテキスト (最大 100 万のトークン) を処理します。リアルタイムのアシスタント、文書の理解、メディア分析に明確で信頼できる回答を提供します。

Gemini 3 フラッシュ プレビュー API

Gemini 3 Flash プレビューで構築できるもの

マルチモーダル入力、信頼性の高いテキスト出力

1 つのリクエストにはテキスト、画像、ビデオ、オーディオ、または PDF を含めることができ、テキスト出力を返すことができます。これにより、個別のパイプラインを使用せずに、会議の要約、メディアのレビュー、構造化された洞察の抽出が簡単になります。

マルチモーダル入力

長いセッションの 1M トークン コンテキスト

1 つのリクエストで最大 1,048,576 個の入力トークンと 65,536 個の出力トークンを処理します。これにより、長いドキュメント、コードベース、または複数回にわたるチャットを 1 つの一貫したコンテキストに保持できます。

長い文脈

ツール、グラウンディング、推論

関数呼び出し、コード実行、ファイル検索、検索グラウンディング、URL コンテキストを使用して、思考と構造化された出力を使用します。バッチ API とキャッシュは、スケールとコストの制御のためにサポートされています。

ツーリング

Gemini 3 フラッシュ プレビューに EvoLink を使用する理由

公式の Gemini 機能と価格を備えた OpenAI SDK 形式または Google ネイティブ API 形式で gemini-3-flash-preview を実行します。

1 つの統合、2 つのフォーマット

アプリのロジックを変更せずに、Gemini 3 Flash プレビューを OpenAI SDK またはネイティブ Gemini 形式で呼び出します。

バッチ + キャッシュによる節約

バッチ処理とコンテキスト キャッシュを使用して、大量のワークロードを安全に拡張しながら繰り返しコストを削減します。

本番環境で使用する準備ができています

マルチモーダル入力、長いコンテキスト、およびツールのサポートは、実際の制作アシスタント、分析、自動化ワークフローをカバーします。

Gemini 3 フラッシュ プレビューを呼び出す方法

OpenAI SDK または Google ネイティブ API 形式を選択して、リクエストを送信します。

1

ステップ 1 - API 形式を選択する

OpenAI SDK 形式: POST /v1/chat/completions (モデル「gemini-3-flash-preview」)。ネイティブ API 形式: POST /v1beta/models/gemini-3-flash-preview:{method} メソッド (generateContent または streamGenerateContent を使用)。

2

ステップ 2 - 認証と入力を追加する

権限を含めます: ベアラー <token>。テキストまたはマルチモーダル パーツ (画像、ビデオ、オーディオ、PDF) を含むメッセージ/コンテンツを送信します。

3

ステップ 3 - ストリームまたはスケール

リアルタイム UX のストリーミングを有効にするか、X-Async-Mode を使用してタスク ID を返します。バッチとキャッシュを組み合わせて、コスト効率の高い大量実行を実現します。

技術仕様

gemini-3-flash-preview の公式モデルの機能

コンテクスト

1,048,576 入力トークン

最大 1,048,576 個の入力トークンと 65,536 個の出力トークン。

マルチモーダル

マルチモーダル入力

テキスト、画像、ビデオ、オーディオ、および PDF 入力とテキスト出力。

推論

思考 + 構造化されたアウトプット

思考と構造化された出力がサポートされており、信頼性の高い機械可読な結果が得られます。

ツール

関数呼び出し + ツール

関数呼び出し、コード実行、ファイル検索がサポートされています。

規模

キャッシュ + バッチ

コンテキスト キャッシュとバッチ API は、繰り返しまたは大規模なワークロードに対してサポートされています。

接地

検索グラウンディング + URL コンテキスト

検索グラウンディングと URL コンテキストがサポートされています (Google マップ グラウンディングはサポートされていません)。

Gemini 3 フラッシュ プレビュー API FAQ

Everything you need to know about the product and billing.

Gemini 3 Flash は、スピード、スケール、強力な推論を目的として構築されたバランスの取れたモデルです。日常的なタスク、エージェントコーディング、マルチモーダルな長いコンテキストの理解向けに設計されており、実稼働ワークロードの実質的なデフォルトとなっています。
正式なプレビューモデル名は「gemini-3-flash-preview」です。リクエストではこの正確な識別子を使用してください。
Gemini 3 Flash プレビューは、テキスト、画像、ビデオ、オーディオ、PDF の入力をサポートし、テキスト出力を返します。これにより、単一のワークフローで混合メディアの要約、抽出、質問応答が可能になります。
最大 1,048,576 個の入力トークンと 65,536 個の出力トークンをサポートし、長いドキュメント、コードベース、または複数ターンのセッションに大きなコンテキスト ウィンドウを提供します。
関数呼び出し、構造化出力、コード実行、ファイル検索、思考、コンテキスト キャッシュ、およびバッチ API をサポートします。検索グラウンディングと URL コンテキストがサポートされているほか、マルチモーダル関数応答やイメージを使用したコード実行もサポートされています。
画像生成、音声生成、および Live API はサポートされていません。このモデルでは、Google マップによる接地もサポートされていません。
最新の更新は 2025 年 12 月として記載されており、ナレッジ カットオフは 2025 年 1 月です。
EvoLink は、generateContent または streamGenerateContent を使用して、OpenAI SDK 形式 (POST /v1/chat/completions) および Google ネイティブ API 形式 (POST /v1beta/models/gemini-3-flash-preview:{method}) をサポートします。リクエストヘッダーに Authorization: Bearer <token> を追加します。