Gemini 3.1 Flash Lite API

Gemini 3.1 Flash Lite は、翻訳・抽出・分類・文書処理に向く低コストかつ高スループットな Gemini モデルです。EvoLink 経由で OpenAI 互換リクエストまたは Gemini ネイティブ API から利用でき、現在の request model ID は gemini-3.1-flash-lite-preview です。
価格: 

$0.200(~ 14.4 credits) per 1M input tokens; $1.200(~ 86.4 credits) per 1M output tokens

$0.019(~ 1.4 credits) per 1M cache read tokens; $0.400(~ 28.8 credits) per 1M audio tokens

Google Search grounding charged separately per query.

99.9% の稼働率を保証する最も安定した構成で、本番環境に推奨されます。

すべてのバージョンで同じ API エンドポイントを使用し、異なるのは model パラメータのみです。

翻訳・抽出・文書ワークフロー向けの低コスト Gemini モデル

Gemini 3.1 Flash Lite は、コスト・レイテンシ・リトライしやすさがプレミアムモデル品質より重要な高スループット処理に向いています。1M コンテキスト、マルチモーダル入力、ツール対応を備えており、より広い Gemini スタックの低コスト処理レイヤーとして使いやすいモデルです。

ページキーワード

Gemini 3.1 Flash Lite API

リクエストモデル ID

gemini-3.1-flash-lite-preview

Gemini 3.1 Flash Lite API

Gemini 3.1 Flash Lite API が向いている用途

低コストで大量処理

Flash Lite は、より大きな AI スタックの中で安価な処理レイヤーとして使いやすいモデルです。翻訳の再処理、タグ付けキュー、抽出ジョブ、一次分類を先に回し、例外ケースだけ強いモデルへエスカレーションできます。

低コスト処理

1M コンテキストのマルチモーダル入力

テキスト、画像、動画、音声、PDF を 1 回のリクエストで送信でき、最大 1,050,000 入力トークンに対応します。長い文書や大きなバッチ、複数段階のコンテキストも分割せずに扱えます。

ロングコンテキスト

エージェントの下位タスクとツール利用

Function Calling、構造化出力、Thinking、コード実行、Search Grounding、キャッシュに対応します。低コストのエージェント下位タスク、retrieval の整形、マルチモデルパイプライン内の構造化前処理に向いています。

エージェントタスク

Gemini 3.1 Flash Lite API に EvoLink を使う理由

すでに OpenAI 風の基盤で運用しているチームにとって、EvoLink は Gemini 3.1 Flash Lite を本番に載せやすくします。ゲートウェイを 1 本化でき、移行コストも抑えやすく、安価なモデルと上位モデルのルーティングも整理しやすくなります。

OpenAI 風ワークフローのまま Gemini を追加できる

OpenAI SDK、共通認証、既存のリクエスト層を前提にしているチームでも、コア統合を書き直さずに Gemini 3.1 Flash Lite を追加できます。

Flash Lite をマルチモデル構成の低コスト層として使える

翻訳、抽出、分類のような安く回したいトラフィックをまず Flash Lite に流し、難しいケースや高価値リクエストだけを強いモデルに送る設計を、同じゲートウェイで実現できます。

ベンダー専用統合より移行コストが低い

API キー 1 つ、OpenAI 互換と Gemini ネイティブの両フォーマット、さらにキャッシュと Batch のサポートにより、既存のモデルカタログと並行して Gemini を運用しやすくなります。

Gemini 3.1 Flash Lite API の使い方

このページは接続の概要として使い、リクエスト形式の選択と preview model ID の確認までに留め、詳しいリクエスト例はドキュメント側に任せます。

1

ステップ 1 - リクエスト形式を選ぶ

Gemini 3.1 Flash Lite は OpenAI 互換リクエストでも Gemini ネイティブ API でも呼び出せるため、既存スタックに合わせて統合しやすく、接続経路を全面的に書き直す必要がありません。

2

ステップ 2 - 現在の request model ID を使う

本番トラフィックでは正確な request model ID である "gemini-3.1-flash-lite-preview" を使ってください。これによりページ主語は Gemini 3.1 Flash Lite API のまま保ちつつ、実際の呼び出し先とも一致します。

3

ステップ 3 - 向いている処理をここに集める

翻訳キュー、抽出ジョブ、タグ付けなど高スループット処理は Flash Lite に寄せ、例外ケースや難しいリクエストだけをより強いモデルへ回します。正確な request body、パラメータ、endpoint 例はドキュメントで確認してください。

Gemini 3.1 Flash Lite API の機能と制限

本番導入を検討する際に重要な主要機能と制限

コンテキスト

1,050,000 入力トークン

最大 1,050,000 入力トークンと 65,536 出力トークンに対応します。

マルチモーダル

マルチモーダル入力

テキスト、画像、動画、音声、PDF を入力でき、出力はテキストです。

推論

Thinking + 構造化出力

Thinking と構造化出力に対応し、機械可読で安定した結果を返せます。

ツール

Function Calling + ツール

Function Calling、コード実行、Search Grounding に対応します。

スケール

キャッシュ + Batch

コンテキストキャッシュと Batch API は、繰り返し処理や大規模ワークロードに向いています。

料金

低コスト運用

現在の EvoLink の pay-as-you-go 料金は、ページ上部のライブ価格表で確認してください。

Gemini 3.1 Flash Lite API に関する FAQ

Everything you need to know about the product and billing.

はい。Gemini 3.1 Flash Lite は高スループット処理向けの低コストな Flash ルートとして位置付けられており、より大きな Gemini Flash モデルに期待する強い汎用品質よりも、価格と処理量を優先したい場面に向いています。
はい。EvoLink は POST /v1/chat/completions による OpenAI 互換リクエストに対応しており、さらに POST /v1beta/models/gemini-3.1-flash-lite-preview:{method} による Gemini ネイティブリクエストにも対応しています。
Gemini 3.1 Flash Lite は最大 1,050,000 入力トークン、65,536 出力トークンに対応しており、長文書、大きなバッチ、多段処理パイプラインに向いています。
はい。Gemini 3.1 Flash Lite はテキスト、画像、動画、音声、PDF を入力でき、出力はテキストです。抽出、要約、マルチモーダル文書処理に役立ちます。
API リクエストでは正確な preview model ID である "gemini-3.1-flash-lite-preview" を使ってください。このページは Gemini 3.1 Flash Lite API を対象にしていますが、request model ID は引き続き preview 識別子です。
翻訳、抽出、分類、タグ付けなど、再試行しやすく低コストで大規模に回したい処理には Flash Lite が向いています。出力品質や課題の難しさが 1 リクエストあたりのコストより重要になるなら、より大きな Gemini Flash ルートへ上げるのが自然です。
Gemini 3.1 Flash Lite は、翻訳、分類、抽出、タグ付け、文書処理、軽量エージェントワークフローなど、コストに敏感でスループット重視の用途に向いています。
画像生成、音声生成、Live API には対応していません。Google Maps Grounding も利用できません。そのため、リアルタイム用途やメディア生成よりも、低コストなテキスト処理フローに適しています。

Gemini ファミリーのページと統合ガイドを続けて見る

Gemini ファミリーにおける Gemini 3.1 Flash Lite の位置付け

このルートは Gemini ファミリーの低コスト実行レイヤーであり、より強い汎用モデルの代替ではありません。高スループット・リトライしやすい・バッチ指向のワークロードに向いています。タスクの難しさや出力品質がより重要になったら、サイト上のより強い Flash ルートに上げてください。

ファミリーモデルのリンクと統合コンテンツを 1 か所にまとめ、ページの役割を明確にし、次のステップを分かりやすくします。