Gemini 3.1 Flash Lite API

Gemini 3.1 Flash Lite は、翻訳・抽出・分類・文書処理に向く低コストかつ高スループットな Gemini モデルです。EvoLink 経由で OpenAI 互換リクエストまたは Gemini ネイティブ API から利用でき、現在の request model ID は gemini-3.1-flash-lite-preview です。

Using coding CLIs? Run Gemini 3.1 Flash Lite via EvoCode
- One API for Code Agents & CLIs. (View Docs)

モデルタイプ:

✓Gemini 3.1 Flash Lite Preview

価格:

$0.234(~ 15.9 credits) per 1M input tokens; $1.399(~ 95.1 credits) per 1M output tokens

$0.028(~ 1.9 credits) per 1M cache read tokens; $0.466(~ 31.7 credits) per 1M audio tokens

Google Search grounding charged separately per query.

99.9% の稼働率を保証する最も安定した構成で、本番環境に推奨されます。

すべてのバージョンで同じ API エンドポイントを使用し、異なるのは model パラメータのみです。

PRICING

PLAN	CONTEXT WINDOW	MAX OUTPUT	INPUT	OUTPUT	CACHE READ	AUDIO INPUT
Gemini 3.1 Flash Lite	1,050,000	65,536	$0.234-6% (15.9 Credits)	$1.399-7% (95.1 Credits)	$0.028-7% (1.9 Credits)	$0.466-7% (31.7 Credits)
Web Search Tool Server-side web search capability						$0.013/search (0.89 Credits)

Pricing Note: Prices show both USD and Credits. Units default to / 1M tokens unless noted separately.

Cache Hit: Price applies to cached prompt tokens.

Audio Input: Audio tokens charged at a separate rate.

翻訳・抽出・文書ワークフロー向けの低コスト Gemini モデル

Gemini 3.1 Flash Lite は、コスト・レイテンシ・リトライしやすさがプレミアムモデル品質より重要な高スループット処理に向いています。1M コンテキスト、マルチモーダル入力、ツール対応を備えており、より広い Gemini スタックの低コスト処理レイヤーとして使いやすいモデルです。

ページキーワード

Gemini 3.1 Flash Lite API

リクエストモデル ID

gemini-3.1-flash-lite-preview

Gemini 3.1 Flash Lite API が向いている用途

低コストで大量処理

Flash Lite は、より大きな AI スタックの中で安価な処理レイヤーとして使いやすいモデルです。翻訳の再処理、タグ付けキュー、抽出ジョブ、一次分類を先に回し、例外ケースだけ強いモデルへエスカレーションできます。

ユースケース

1M コンテキストのマルチモーダル入力

テキスト、画像、動画、音声、PDF を 1 回のリクエストで送信でき、最大 1,050,000 入力トークンに対応します。長い文書や大きなバッチ、複数段階のコンテキストも分割せずに扱えます。

トークン上限

エージェントの下位タスクとツール利用

Function Calling、構造化出力、Thinking、コード実行、Search Grounding、キャッシュに対応します。低コストのエージェント下位タスク、retrieval の整形、マルチモデルパイプライン内の構造化前処理に向いています。

対応機能

Gemini 3.1 Flash Lite API に EvoLink を使う理由

すでに OpenAI 風の基盤で運用しているチームにとって、EvoLink は Gemini 3.1 Flash Lite を本番に載せやすくします。ゲートウェイを 1 本化でき、移行コストも抑えやすく、安価なモデルと上位モデルのルーティングも整理しやすくなります。

OpenAI 風ワークフローのまま Gemini を追加できる

OpenAI SDK、共通認証、既存のリクエスト層を前提にしているチームでも、コア統合を書き直さずに Gemini 3.1 Flash Lite を追加できます。

Flash Lite をマルチモデル構成の低コスト層として使える

翻訳、抽出、分類のような安く回したいトラフィックをまず Flash Lite に流し、難しいケースや高価値リクエストだけを強いモデルに送る設計を、同じゲートウェイで実現できます。

ベンダー専用統合より移行コストが低い

API キー 1 つ、OpenAI 互換と Gemini ネイティブの両フォーマット、さらにキャッシュと Batch のサポートにより、既存のモデルカタログと並行して Gemini を運用しやすくなります。

Gemini 3.1 Flash Lite API の使い方

このページは接続の概要として使い、リクエスト形式の選択と preview model ID の確認までに留め、詳しいリクエスト例はドキュメント側に任せます。

ステップ 1 - リクエスト形式を選ぶ

Gemini 3.1 Flash Lite は OpenAI 互換リクエストでも Gemini ネイティブ API でも呼び出せるため、既存スタックに合わせて統合しやすく、接続経路を全面的に書き直す必要がありません。

ステップ 2 - 現在の request model ID を使う

本番トラフィックでは正確な request model ID である "gemini-3.1-flash-lite-preview" を使ってください。これによりページ主語は Gemini 3.1 Flash Lite API のまま保ちつつ、実際の呼び出し先とも一致します。

ステップ 3 - 向いている処理をここに集める

翻訳キュー、抽出ジョブ、タグ付けなど高スループット処理は Flash Lite に寄せ、例外ケースや難しいリクエストだけをより強いモデルへ回します。正確な request body、パラメータ、endpoint 例はドキュメントで確認してください。

デベロッパー Playground を開く

Gemini 3.1 Flash Lite API の機能と制限

本番導入を検討する際に重要な主要機能と制限

コンテキスト

1,050,000 入力トークン

最大 1,050,000 入力トークンと 65,536 出力トークンに対応します。

マルチモーダル

マルチモーダル入力

テキスト、画像、動画、音声、PDF を入力でき、出力はテキストです。

推論

Thinking + 構造化出力

Thinking と構造化出力に対応し、機械可読で安定した結果を返せます。

ツール

Function Calling + ツール

Function Calling、コード実行、Search Grounding に対応します。

スケール

キャッシュ + Batch

コンテキストキャッシュと Batch API は、繰り返し処理や大規模ワークロードに向いています。

料金

低コスト運用

現在の EvoLink の pay-as-you-go 料金は、ページ上部のライブ価格表で確認してください。

Gemini 3.1 Flash Lite API に関する FAQ

Everything you need to know about the product and billing.

はい。Gemini 3.1 Flash Lite は高スループット処理向けの低コストな Flash ルートとして位置付けられており、より大きな Gemini Flash モデルに期待する強い汎用品質よりも、価格と処理量を優先したい場面に向いています。

はい。EvoLink は POST /v1/chat/completions による OpenAI 互換リクエストに対応しており、さらに POST /v1beta/models/gemini-3.1-flash-lite-preview:{method} による Gemini ネイティブリクエストにも対応しています。

Gemini 3.1 Flash Lite は最大 1,050,000 入力トークン、65,536 出力トークンに対応しており、長文書、大きなバッチ、多段処理パイプラインに向いています。

はい。Gemini 3.1 Flash Lite はテキスト、画像、動画、音声、PDF を入力でき、出力はテキストです。抽出、要約、マルチモーダル文書処理に役立ちます。

API リクエストでは正確な preview model ID である "gemini-3.1-flash-lite-preview" を使ってください。このページは Gemini 3.1 Flash Lite API を対象にしていますが、request model ID は引き続き preview 識別子です。

翻訳、抽出、分類、タグ付けなど、再試行しやすく低コストで大規模に回したい処理には Flash Lite が向いています。出力品質や課題の難しさが 1 リクエストあたりのコストより重要になるなら、より大きな Gemini Flash ルートへ上げるのが自然です。

Gemini 3.1 Flash Lite は、翻訳、分類、抽出、タグ付け、文書処理、軽量エージェントワークフローなど、コストに敏感でスループット重視の用途に向いています。

画像生成、音声生成、Live API には対応していません。Google Maps Grounding も利用できません。そのため、リアルタイム用途やメディア生成よりも、低コストなテキスト処理フローに適しています。

EvoLink の Gemini API モデル

Gemini 3.1 Flash Lite は Gemini ファミリーで最もコストの低いルートです。より強力なマルチモーダル機能には Gemini 3 Flash Preview、最先端の推論には Gemini 3.1 Pro をご利用ください。すべてのモデルは同じ API 形式を共有しています。

Gemini ファミリーを見る Gemini 3 Flash Preview Gemini 3.1 Pro Gemini 2.5 Flash