Gemini 3.5 Flash API
$1.399(~ 95.1 credits) per 1M input tokens; $8.387(~ 570.3 credits) per 1M output tokens
$0.141(~ 9.6 credits) per 1M cache read tokens; $1.399(~ 95.1 credits) per 1M audio tokens
Google Search grounding charged separately per query.
99.9% の稼働率を保証する最も安定した構成で、本番環境に推奨されます。
すべてのバージョンで同じ API エンドポイントを使用し、異なるのは model パラメータのみです。
Agent ワークフローとコーディング向けの本番対応 Flash モデル
Gemini 3.5 Flash は一般公開済みで、大規模本番利用に安定して対応します。Agent ワークフロー、コーディング Agent、サブ Agent デプロイ、長期的タスク向けに構築され、Flash コストで Frontier レベルの知能を提供。1M コンテキスト、内蔵推論、フルツールサポートに対応。
ページキーワード
Gemini 3.5 Flash API
リクエストモデル ID
gemini-3.5-flash

Gemini 3.5 Flash API が向いている用途
コーディング Agent とマルチステップ開発ループ
Gemini 3.5 Flash はコーディングタスク — コード生成、デバッグ、リファクタリング、テスト作成 — を Flash 速度でこなします。各イテレーションでトークンを消費し、レイテンシが重要なコーディング Agent ループのデフォルトモデルに最適です。

Agent ワークフローとサブ Agent デプロイ
並列 Agent 実行ループ向け:Function Calling、構造化出力、コード実行、Search Grounding。マルチ Agent システムでサブ Agent としてデプロイし、呼び出しあたりの速度とコストがワークフロー全体の経済性を決定します。

長期的タスクとドキュメント処理
1M 入力コンテキストと 65K 出力トークンで、Gemini 3.5 Flash は多くのステップにまたがる長期的タスク — 法務文書レビュー、コードベース分析、研究統合、PDF ワークフロー — をコンテキスト切り捨てなしで処理します。

Flash コストでの本番推論
一般公開済みで大規模本番利用に安定。コンテキストキャッシュ、Batch API、統一マルチモーダル価格により、Pro コストなしで推論品質を求めるチームのデフォルト高スループットモデルです。

Gemini 3.5 Flash API に EvoLink を使う理由
すでに OpenAI 風の基盤で運用しているチームにとって、EvoLink は Gemini 3.5 Flash を本番に載せやすくします。ゲートウェイを 1 本化でき、移行コストも抑えやすく、安価なモデルと上位モデルのルーティングも整理しやすくなります。
OpenAI 風ワークフローのまま Gemini を追加できる
OpenAI SDK、共通認証、既存のリクエスト層を前提にしているチームでも、コア統合を書き直さずに Gemini 3.5 Flash を追加できます。
Flash をマルチモデル構成の低コスト層として使える
翻訳、抽出、分類のような安く回したいトラフィックをまず Flash に流し、難しいケースや高価値リクエストだけを強いモデルに送る設計を、同じゲートウェイで実現できます。
ベンダー専用統合より移行コストが低い
API キー 1 つ、OpenAI 互換と Gemini ネイティブの両フォーマット、さらにキャッシュと Batch のサポートにより、既存のモデルカタログと並行して Gemini を運用しやすくなります。
Gemini 3.5 Flash API の使い方
このページは接続の概要として使い、リクエスト形式の選択と preview model ID の確認までに留め、詳しいリクエスト例はドキュメント側に任せます。
ステップ 1 - リクエスト形式を選ぶ
Gemini 3.5 Flash は OpenAI 互換リクエストでも Gemini ネイティブ API でも呼び出せるため、既存スタックに合わせて統合しやすく、接続経路を全面的に書き直す必要がありません。
ステップ 2 - 現在の request model ID を使う
本番トラフィックでは正確な request model ID である "gemini-3.5-flash" を使ってください。これによりページ主語は Gemini 3.5 Flash API のまま保ちつつ、実際の呼び出し先とも一致します。
ステップ 3 - 向いている処理をここに集める
翻訳キュー、抽出ジョブ、タグ付けなど高スループット処理は Flash に寄せ、例外ケースや難しいリクエストだけをより強いモデルへ回します。正確な request body、パラメータ、endpoint 例はドキュメントで確認してください。
Gemini 3.5 Flash API の機能と制限
本番導入を検討する際に重要な主要機能と制限
1,048,576 入力トークン
最大 1,048,576 入力トークンと 65,535 出力トークンに対応します。
マルチモーダル入力
テキスト、画像、動画、音声、PDF を入力でき、出力はテキストです。
Thinking + 構造化出力
Thinking と構造化出力に対応し、機械可読で安定した結果を返せます。
Function Calling + ツール
Function Calling、コード実行、Search Grounding に対応します。
キャッシュ + Batch
コンテキストキャッシュと Batch API は、繰り返し処理や大規模ワークロードに向いています。
低コスト運用
現在の EvoLink の pay-as-you-go 料金は、ページ上部のライブ価格表で確認してください。
Gemini 3.5 Flash と他の Gemini モデルの比較
Gemini ファミリーの位置付け、コンテキスト、推論スタイル、ツールを比較し、ワークロードに適したルートを選択
| Model | Best for | Context window | Reasoning style | Tooling & streaming |
|---|---|---|---|---|
| Gemini 3.5 Flash | Agent ワークフロー、コーディング Agent、長期的タスク | 1M 入力 / 65K 出力 | Flash 速度での内蔵推論 | Function Calling、コード実行、構造化出力、キャッシュ、Batch |
| Gemini 3 Flash Preview | 汎用高速ワークロード、前世代 Flash ベースライン | 1M 入力 / 65K 出力 | 標準 Flash 推論 | Function Calling、構造化出力、キャッシュ |
| Gemini 3.1 Pro | 最難推論、複雑な分析、Frontier タスク | 1M 入力 / 65K 出力 | Thinking トークンを使った最深推論 | フルツールスイート、コード実行、Search Grounding |
| Gemini 3.1 Flash Lite | 高スループットバッチ、低コスト抽出、シンプルなタスク | 1M 入力 / 65K 出力 | 軽量、深い推論なし | Function Calling、構造化出力、キャッシュ、Batch |
Gemini 3.5 Flash API に関する FAQ
Everything you need to know about the product and billing.
EvoLink の Gemini API モデル
Gemini 3.5 Flash は Gemini ファミリーで最もコストの低いルートです。より強力なマルチモーダル機能には Gemini 3 Flash Preview、最先端の推論には Gemini 3.1 Pro をご利用ください。すべてのモデルは同じ API 形式を共有しています。