Gemini 3 フラッシュ プレビュー API
OpenAI SDK 互換性とネイティブ Gemini API サポートを備えた EvoLink を介して、Google の Gemini 3 Flash プレビュー (gemini-3-flash-preview) にアクセスします。 1,048,576 トークンのコンテキスト ウィンドウを使用してテキスト、画像、ビデオ、オーディオ、PDF 入力を送信し、実稼働ワークロード用のキャッシュとバッチ オプションを追加します。
PRICING
| PLAN | CONTEXT WINDOW | MAX OUTPUT | INPUT | OUTPUT | CACHE READ |
|---|---|---|---|---|---|
| Gemini 3 Flash | 1.05M | 65.5K | ≤200.0K$0.400-20% $0.500Official Price >200.0K$0.400-20% $0.500Official Price | ≤200.0K$2.40-20% $3.00Official Price >200.0K$2.40-20% $3.00Official Price | ≤200.0K$0.040-19% $0.050Official Price >200.0K$0.040-19% $0.050Official Price |
| Gemini 3 Flash (Beta) | 1.05M | 65.5K | ≤200.0K$0.130-74% $0.500Official Price >200.0K$0.130-74% $0.500Official Price | ≤200.0K$0.780-74% $3.00Official Price >200.0K$0.780-74% $3.00Official Price | ≤200.0K$0.013-74% $0.050Official Price >200.0K$0.013-74% $0.050Official Price |
Pricing Note: Price unit: USD / 1M tokens
Cache Hit: Price applies to cached prompt tokens.
Two ways to run Gemini 3 Flash — pick the tier that matches your workload.
- · Gemini 3 Flash: the default tier for production reliability and predictable availability.
- · Gemini 3 Flash (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.
Gemini 3 EvoLink での API のフラッシュ プレビュー
速度とスケールを重視して構築された Gemini 3 Flash Preview は、テキスト、画像、ビデオ、オーディオ、PDF を理解し、大量のコンテキスト (最大 100 万のトークン) を処理します。リアルタイムのアシスタント、文書の理解、メディア分析に明確で信頼できる回答を提供します。

Gemini 3 Flash プレビューで構築できるもの
マルチモーダル入力、信頼性の高いテキスト出力
1 つのリクエストにはテキスト、画像、ビデオ、オーディオ、または PDF を含めることができ、テキスト出力を返すことができます。これにより、個別のパイプラインを使用せずに、会議の要約、メディアのレビュー、構造化された洞察の抽出が簡単になります。

長いセッションの 1M トークン コンテキスト
1 つのリクエストで最大 1,048,576 個の入力トークンと 65,536 個の出力トークンを処理します。これにより、長いドキュメント、コードベース、または複数回にわたるチャットを 1 つの一貫したコンテキストに保持できます。

ツール、グラウンディング、推論
関数呼び出し、コード実行、ファイル検索、検索グラウンディング、URL コンテキストを使用して、思考と構造化された出力を使用します。バッチ API とキャッシュは、スケールとコストの制御のためにサポートされています。

Gemini 3 フラッシュ プレビューに EvoLink を使用する理由
公式の Gemini 機能と価格を備えた OpenAI SDK 形式または Google ネイティブ API 形式で gemini-3-flash-preview を実行します。
1 つの統合、2 つのフォーマット
アプリのロジックを変更せずに、Gemini 3 Flash プレビューを OpenAI SDK またはネイティブ Gemini 形式で呼び出します。
バッチ + キャッシュによる節約
バッチ処理とコンテキスト キャッシュを使用して、大量のワークロードを安全に拡張しながら繰り返しコストを削減します。
本番環境で使用する準備ができています
マルチモーダル入力、長いコンテキスト、およびツールのサポートは、実際の制作アシスタント、分析、自動化ワークフローをカバーします。
Gemini 3 フラッシュ プレビューを呼び出す方法
OpenAI SDK または Google ネイティブ API 形式を選択して、リクエストを送信します。
ステップ 1 - API 形式を選択する
OpenAI SDK 形式: POST /v1/chat/completions (モデル「gemini-3-flash-preview」)。ネイティブ API 形式: POST /v1beta/models/gemini-3-flash-preview:{method} メソッド (generateContent または streamGenerateContent を使用)。
ステップ 2 - 認証と入力を追加する
権限を含めます: ベアラー <token>。テキストまたはマルチモーダル パーツ (画像、ビデオ、オーディオ、PDF) を含むメッセージ/コンテンツを送信します。
ステップ 3 - ストリームまたはスケール
リアルタイム UX のストリーミングを有効にするか、X-Async-Mode を使用してタスク ID を返します。バッチとキャッシュを組み合わせて、コスト効率の高い大量実行を実現します。
技術仕様
gemini-3-flash-preview の公式モデルの機能
1,048,576 入力トークン
最大 1,048,576 個の入力トークンと 65,536 個の出力トークン。
マルチモーダル入力
テキスト、画像、ビデオ、オーディオ、および PDF 入力とテキスト出力。
思考 + 構造化されたアウトプット
思考と構造化された出力がサポートされており、信頼性の高い機械可読な結果が得られます。
関数呼び出し + ツール
関数呼び出し、コード実行、ファイル検索がサポートされています。
キャッシュ + バッチ
コンテキスト キャッシュとバッチ API は、繰り返しまたは大規模なワークロードに対してサポートされています。
検索グラウンディング + URL コンテキスト
検索グラウンディングと URL コンテキストがサポートされています (Google マップ グラウンディングはサポートされていません)。
Gemini 3 フラッシュ プレビュー API FAQ
Everything you need to know about the product and billing.