Gemini 3.5 Flash API

Gemini 3.5 Flash は Google の本番対応 Flash モデルで、Agent ワークフロー、コーディング Agent、長期的タスク向けに設計されています。Frontier レベルの知能を Flash 速度とコストで提供します。EvoLink 経由で OpenAI 互換または Gemini ネイティブリクエストから利用でき、モデル ID は gemini-3.5-flash です。

モデルタイプ:

価格:

$1.350(~ 91.8 credits) 100万入力トークンあたり; $8.100(~ 550.8 credits) 100万出力トークンあたり

$0.135(~ 9.2 credits) 100万キャッシュ読み取りトークンあたり; $1.350(~ 91.8 credits) 100万音声トークンあたり

Google 検索グラウンディングはクエリごとに別途課金されます。

99.9% の稼働率を保証する最も安定した構成で、本番環境に推奨されます。

すべてのバージョンで同じ API エンドポイントを使用し、異なるのは model パラメータのみです。

PRICING

PLAN	CONTEXT WINDOW	MAX OUTPUT	INPUT	OUTPUT	CACHE READ	AUDIO INPUT
Gemini 3.5 Flash	1,048,576	65,535	$1.350-10% (91.8 Credits)	$8.100-10% (550.8 Credits)	$0.136-10% (9.2 Credits)	$1.350-10% (91.8 Credits)
Web Search Tool Server-side web search capability						$0.014/search (0.89 Credits)

Pricing Note: Prices show both USD and Credits. Units default to / 1M tokens unless noted separately.

Cache Hit: Price applies to cached prompt tokens.

Audio Input: Audio tokens charged at a separate rate.

Agent ワークフローとコーディング向けの本番対応 Flash モデル

Name: EvoLink AI Model API Platform
Brand: EvoLink
Availability: InStock

Gemini 3.5 Flash は一般公開済みで、大規模本番利用に安定して対応します。Agent ワークフロー、コーディング Agent、サブ Agent デプロイ、長期的タスク向けに構築され、Flash コストで Frontier レベルの知能を提供。1M コンテキスト、内蔵推論、フルツールサポートに対応。

ページキーワード

Gemini 3.5 Flash API

リクエストモデル ID

gemini-3.5-flash

Gemini 3.5 Flash API が向いている用途

コーディング Agent とマルチステップ開発ループ

Gemini 3.5 Flash はコーディングタスク — コード生成、デバッグ、リファクタリング、テスト作成 — を Flash 速度でこなします。各イテレーションでトークンを消費し、レイテンシが重要なコーディング Agent ループのデフォルトモデルに最適です。

コーディング

Agent ワークフローとサブ Agent デプロイ

並列 Agent 実行ループ向け：Function Calling、構造化出力、コード実行、Search Grounding。マルチ Agent システムでサブ Agent としてデプロイし、呼び出しあたりの速度とコストがワークフロー全体の経済性を決定します。

Agent

長期的タスクとドキュメント処理

1M 入力コンテキストと 65K 出力トークンで、Gemini 3.5 Flash は多くのステップにまたがる長期的タスク — 法務文書レビュー、コードベース分析、研究統合、PDF ワークフロー — をコンテキスト切り捨てなしで処理します。

長期的

Flash コストでの本番推論

一般公開済みで大規模本番利用に安定。コンテキストキャッシュ、Batch API、統一マルチモーダル価格により、Pro コストなしで推論品質を求めるチームのデフォルト高スループットモデルです。

本番

Gemini 3.5 Flash API に EvoLink を使う理由

すでに OpenAI 風の基盤で運用しているチームにとって、EvoLink は Gemini 3.5 Flash を本番に載せやすくします。ゲートウェイを 1 本化でき、移行コストも抑えやすく、安価なモデルと上位モデルのルーティングも整理しやすくなります。

OpenAI 風ワークフローのまま Gemini を追加できる

OpenAI SDK、共通認証、既存のリクエスト層を前提にしているチームでも、コア統合を書き直さずに Gemini 3.5 Flash を追加できます。

Flash をマルチモデル構成の低コスト層として使える

翻訳、抽出、分類のような安く回したいトラフィックをまず Flash に流し、難しいケースや高価値リクエストだけを強いモデルに送る設計を、同じゲートウェイで実現できます。

ベンダー専用統合より移行コストが低い

API キー 1 つ、OpenAI 互換と Gemini ネイティブの両フォーマット、さらにキャッシュと Batch のサポートにより、既存のモデルカタログと並行して Gemini を運用しやすくなります。

Gemini 3.5 Flash API の使い方

このページは接続の概要として使い、リクエスト形式の選択と preview model ID の確認までに留め、詳しいリクエスト例はドキュメント側に任せます。

ステップ 1 - リクエスト形式を選ぶ

Gemini 3.5 Flash は OpenAI 互換リクエストでも Gemini ネイティブ API でも呼び出せるため、既存スタックに合わせて統合しやすく、接続経路を全面的に書き直す必要がありません。

ステップ 2 - 現在の request model ID を使う

本番トラフィックでは正確な request model ID である "gemini-3.5-flash" を使ってください。これによりページ主語は Gemini 3.5 Flash API のまま保ちつつ、実際の呼び出し先とも一致します。

ステップ 3 - 向いている処理をここに集める

翻訳キュー、抽出ジョブ、タグ付けなど高スループット処理は Flash に寄せ、例外ケースや難しいリクエストだけをより強いモデルへ回します。正確な request body、パラメータ、endpoint 例はドキュメントで確認してください。

Gemini 3.5 Flash API の機能と制限

本番導入を検討する際に重要な主要機能と制限

コンテキスト

1,048,576 入力トークン

最大 1,048,576 入力トークンと 65,535 出力トークンに対応します。

マルチモーダル

マルチモーダル入力

テキスト、画像、動画、音声、PDF を入力でき、出力はテキストです。

推論

Thinking + 構造化出力

Thinking と構造化出力に対応し、機械可読で安定した結果を返せます。

ツール

Function Calling + ツール

Function Calling、コード実行、Search Grounding に対応します。

スケール

キャッシュ + Batch

コンテキストキャッシュと Batch API は、繰り返し処理や大規模ワークロードに向いています。

料金

低コスト運用

現在の EvoLink の pay-as-you-go 料金は、ページ上部のライブ価格表で確認してください。

Gemini 3.5 Flash と他の Gemini モデルの比較

Gemini ファミリーの位置付け、コンテキスト、推論スタイル、ツールを比較し、ワークロードに適したルートを選択

Model	Best for	Context window	Reasoning style	Tooling & streaming
Gemini 3.5 Flash	Agent ワークフロー、コーディング Agent、長期的タスク	1M 入力 / 65K 出力	Flash 速度での内蔵推論	Function Calling、コード実行、構造化出力、キャッシュ、Batch
Gemini 3 Flash Preview	汎用高速ワークロード、前世代 Flash ベースライン	1M 入力 / 65K 出力	標準 Flash 推論	Function Calling、構造化出力、キャッシュ
Gemini 3.1 Pro	最難推論、複雑な分析、Frontier タスク	1M 入力 / 65K 出力	Thinking トークンを使った最深推論	フルツールスイート、コード実行、Search Grounding
Gemini 3.1 Flash Lite	高スループットバッチ、低コスト抽出、シンプルなタスク	1M 入力 / 65K 出力	軽量、深い推論なし	Function Calling、構造化出力、キャッシュ、Batch

Gemini 3.5 Flash API に関する FAQ

Everything you need to know about the product and billing.

はい。Google は Gemini 3.5 Flash を一般公開済みかつ大規模本番利用に安定としてリストしています。プレビューや実験的モデルではなく、本番トラフィックを安心してルーティングできます。

はい。Gemini 3.5 Flash は高スループット処理向けの低コストな Flash ルートとして位置付けられており、より大きな Gemini Flash モデルに期待する強い汎用品質よりも、価格と処理量を優先したい場面に向いています。

はい。EvoLink は POST /v1/chat/completions による OpenAI 互換リクエストに対応しており、さらに POST /v1beta/models/gemini-3.5-flash:{method} による Gemini ネイティブリクエストにも対応しています。

Gemini 3.5 Flash は最大 1,048,576 入力トークン、65,535 出力トークンに対応しており、長文書、大きなバッチ、多段処理パイプラインに向いています。

はい。Gemini 3.5 Flash はテキスト、画像、動画、音声、PDF を入力でき、出力はテキストです。抽出、要約、マルチモーダル文書処理に役立ちます。

API リクエストでは正確な preview model ID である "gemini-3.5-flash" を使ってください。このページは Gemini 3.5 Flash API を対象にしていますが、request model ID は引き続き preview 識別子です。

翻訳、抽出、分類、タグ付けなど、再試行しやすく低コストで大規模に回したい処理には Flash が向いています。出力品質や課題の難しさが 1 リクエストあたりのコストより重要になるなら、より大きな Gemini Flash ルートへ上げるのが自然です。

Gemini 3.5 Flash は、翻訳、分類、抽出、タグ付け、文書処理、軽量エージェントワークフローなど、コストに敏感でスループット重視の用途に向いています。

画像生成、音声生成、Live API には対応していません。そのため、リアルタイム用途やメディア生成よりも、低コストなテキスト処理フローに適しています。

EvoLink の Gemini API モデル

Gemini 3.5 Flash は Gemini ファミリーで最もコストの低いルートです。より強力なマルチモーダル機能には Gemini 3 Flash Preview、最先端の推論には Gemini 3.1 Pro をご利用ください。すべてのモデルは同じ API 形式を共有しています。

Gemini ファミリーを見る Gemini 3 Flash Preview Gemini 3.1 Pro Gemini 2.5 Flash