HappyHorse 1.0 リリース今すぐ試す

Gemini 3.5 Flash API

Gemini 3.5 Flash は Google の本番対応 Flash モデルで、Agent ワークフロー、コーディング Agent、長期的タスク向けに設計されています。Frontier レベルの知能を Flash 速度とコストで提供します。EvoLink 経由で OpenAI 互換または Gemini ネイティブリクエストから利用でき、モデル ID は gemini-3.5-flash です。
モデルタイプ:
価格: 

$1.399(~ 95.1 credits) per 1M input tokens; $8.387(~ 570.3 credits) per 1M output tokens

$0.141(~ 9.6 credits) per 1M cache read tokens; $1.399(~ 95.1 credits) per 1M audio tokens

Google Search grounding charged separately per query.

99.9% の稼働率を保証する最も安定した構成で、本番環境に推奨されます。

すべてのバージョンで同じ API エンドポイントを使用し、異なるのは model パラメータのみです。

Agent ワークフローとコーディング向けの本番対応 Flash モデル

Gemini 3.5 Flash は一般公開済みで、大規模本番利用に安定して対応します。Agent ワークフロー、コーディング Agent、サブ Agent デプロイ、長期的タスク向けに構築され、Flash コストで Frontier レベルの知能を提供。1M コンテキスト、内蔵推論、フルツールサポートに対応。

ページキーワード

Gemini 3.5 Flash API

リクエストモデル ID

gemini-3.5-flash

Gemini 3.5 Flash API

Gemini 3.5 Flash API が向いている用途

コーディング Agent とマルチステップ開発ループ

Gemini 3.5 Flash はコーディングタスク — コード生成、デバッグ、リファクタリング、テスト作成 — を Flash 速度でこなします。各イテレーションでトークンを消費し、レイテンシが重要なコーディング Agent ループのデフォルトモデルに最適です。

コーディング Agent

Agent ワークフローとサブ Agent デプロイ

並列 Agent 実行ループ向け:Function Calling、構造化出力、コード実行、Search Grounding。マルチ Agent システムでサブ Agent としてデプロイし、呼び出しあたりの速度とコストがワークフロー全体の経済性を決定します。

Agent ワークフロー

長期的タスクとドキュメント処理

1M 入力コンテキストと 65K 出力トークンで、Gemini 3.5 Flash は多くのステップにまたがる長期的タスク — 法務文書レビュー、コードベース分析、研究統合、PDF ワークフロー — をコンテキスト切り捨てなしで処理します。

長期的タスク

Flash コストでの本番推論

一般公開済みで大規模本番利用に安定。コンテキストキャッシュ、Batch API、統一マルチモーダル価格により、Pro コストなしで推論品質を求めるチームのデフォルト高スループットモデルです。

本番推論

Gemini 3.5 Flash API に EvoLink を使う理由

すでに OpenAI 風の基盤で運用しているチームにとって、EvoLink は Gemini 3.5 Flash を本番に載せやすくします。ゲートウェイを 1 本化でき、移行コストも抑えやすく、安価なモデルと上位モデルのルーティングも整理しやすくなります。

OpenAI 風ワークフローのまま Gemini を追加できる

OpenAI SDK、共通認証、既存のリクエスト層を前提にしているチームでも、コア統合を書き直さずに Gemini 3.5 Flash を追加できます。

Flash をマルチモデル構成の低コスト層として使える

翻訳、抽出、分類のような安く回したいトラフィックをまず Flash に流し、難しいケースや高価値リクエストだけを強いモデルに送る設計を、同じゲートウェイで実現できます。

ベンダー専用統合より移行コストが低い

API キー 1 つ、OpenAI 互換と Gemini ネイティブの両フォーマット、さらにキャッシュと Batch のサポートにより、既存のモデルカタログと並行して Gemini を運用しやすくなります。

Gemini 3.5 Flash API の使い方

このページは接続の概要として使い、リクエスト形式の選択と preview model ID の確認までに留め、詳しいリクエスト例はドキュメント側に任せます。

1

ステップ 1 - リクエスト形式を選ぶ

Gemini 3.5 Flash は OpenAI 互換リクエストでも Gemini ネイティブ API でも呼び出せるため、既存スタックに合わせて統合しやすく、接続経路を全面的に書き直す必要がありません。

2

ステップ 2 - 現在の request model ID を使う

本番トラフィックでは正確な request model ID である "gemini-3.5-flash" を使ってください。これによりページ主語は Gemini 3.5 Flash API のまま保ちつつ、実際の呼び出し先とも一致します。

3

ステップ 3 - 向いている処理をここに集める

翻訳キュー、抽出ジョブ、タグ付けなど高スループット処理は Flash に寄せ、例外ケースや難しいリクエストだけをより強いモデルへ回します。正確な request body、パラメータ、endpoint 例はドキュメントで確認してください。

Gemini 3.5 Flash API の機能と制限

本番導入を検討する際に重要な主要機能と制限

コンテキスト

1,048,576 入力トークン

最大 1,048,576 入力トークンと 65,535 出力トークンに対応します。

マルチモーダル

マルチモーダル入力

テキスト、画像、動画、音声、PDF を入力でき、出力はテキストです。

推論

Thinking + 構造化出力

Thinking と構造化出力に対応し、機械可読で安定した結果を返せます。

ツール

Function Calling + ツール

Function Calling、コード実行、Search Grounding に対応します。

スケール

キャッシュ + Batch

コンテキストキャッシュと Batch API は、繰り返し処理や大規模ワークロードに向いています。

料金

低コスト運用

現在の EvoLink の pay-as-you-go 料金は、ページ上部のライブ価格表で確認してください。

Gemini 3.5 Flash と他の Gemini モデルの比較

Gemini ファミリーの位置付け、コンテキスト、推論スタイル、ツールを比較し、ワークロードに適したルートを選択

ModelBest forContext windowReasoning styleTooling & streaming
Gemini 3.5 FlashAgent ワークフロー、コーディング Agent、長期的タスク1M 入力 / 65K 出力Flash 速度での内蔵推論Function Calling、コード実行、構造化出力、キャッシュ、Batch
Gemini 3 Flash Preview汎用高速ワークロード、前世代 Flash ベースライン1M 入力 / 65K 出力標準 Flash 推論Function Calling、構造化出力、キャッシュ
Gemini 3.1 Pro最難推論、複雑な分析、Frontier タスク1M 入力 / 65K 出力Thinking トークンを使った最深推論フルツールスイート、コード実行、Search Grounding
Gemini 3.1 Flash Lite高スループットバッチ、低コスト抽出、シンプルなタスク1M 入力 / 65K 出力軽量、深い推論なしFunction Calling、構造化出力、キャッシュ、Batch

Gemini 3.5 Flash API に関する FAQ

Everything you need to know about the product and billing.

はい。Google は Gemini 3.5 Flash を一般公開済みかつ大規模本番利用に安定としてリストしています。プレビューや実験的モデルではなく、本番トラフィックを安心してルーティングできます。
はい。Gemini 3.5 Flash は高スループット処理向けの低コストな Flash ルートとして位置付けられており、より大きな Gemini Flash モデルに期待する強い汎用品質よりも、価格と処理量を優先したい場面に向いています。
はい。EvoLink は POST /v1/chat/completions による OpenAI 互換リクエストに対応しており、さらに POST /v1beta/models/gemini-3.5-flash:{method} による Gemini ネイティブリクエストにも対応しています。
Gemini 3.5 Flash は最大 1,048,576 入力トークン、65,535 出力トークンに対応しており、長文書、大きなバッチ、多段処理パイプラインに向いています。
はい。Gemini 3.5 Flash はテキスト、画像、動画、音声、PDF を入力でき、出力はテキストです。抽出、要約、マルチモーダル文書処理に役立ちます。
API リクエストでは正確な preview model ID である "gemini-3.5-flash" を使ってください。このページは Gemini 3.5 Flash API を対象にしていますが、request model ID は引き続き preview 識別子です。
翻訳、抽出、分類、タグ付けなど、再試行しやすく低コストで大規模に回したい処理には Flash が向いています。出力品質や課題の難しさが 1 リクエストあたりのコストより重要になるなら、より大きな Gemini Flash ルートへ上げるのが自然です。
Gemini 3.5 Flash は、翻訳、分類、抽出、タグ付け、文書処理、軽量エージェントワークフローなど、コストに敏感でスループット重視の用途に向いています。
画像生成、音声生成、Live API には対応していません。そのため、リアルタイム用途やメディア生成よりも、低コストなテキスト処理フローに適しています。

EvoLink の Gemini API モデル

Gemini 3.5 Flash は Gemini ファミリーで最もコストの低いルートです。より強力なマルチモーダル機能には Gemini 3 Flash Preview、最先端の推論には Gemini 3.1 Pro をご利用ください。すべてのモデルは同じ API 形式を共有しています。