Gemini 3.1 Flash Lite API
- One API for Code Agents & CLIs. (View Docs)
$0.200(~ 14.4 credits) per 1M input tokens; $1.200(~ 86.4 credits) per 1M output tokens
$0.019(~ 1.4 credits) per 1M cache read tokens; $0.400(~ 28.8 credits) per 1M audio tokens
Google Search grounding charged separately per query.
99.9% の稼働率を保証する最も安定した構成で、本番環境に推奨されます。
すべてのバージョンで同じ API エンドポイントを使用し、異なるのは model パラメータのみです。
翻訳・抽出・文書ワークフロー向けの低コスト Gemini モデル
Gemini 3.1 Flash Lite は、コスト・レイテンシ・リトライしやすさがプレミアムモデル品質より重要な高スループット処理に向いています。1M コンテキスト、マルチモーダル入力、ツール対応を備えており、より広い Gemini スタックの低コスト処理レイヤーとして使いやすいモデルです。
ページキーワード
Gemini 3.1 Flash Lite API
リクエストモデル ID
gemini-3.1-flash-lite-preview

Gemini 3.1 Flash Lite API が向いている用途
低コストで大量処理
Flash Lite は、より大きな AI スタックの中で安価な処理レイヤーとして使いやすいモデルです。翻訳の再処理、タグ付けキュー、抽出ジョブ、一次分類を先に回し、例外ケースだけ強いモデルへエスカレーションできます。

1M コンテキストのマルチモーダル入力
テキスト、画像、動画、音声、PDF を 1 回のリクエストで送信でき、最大 1,050,000 入力トークンに対応します。長い文書や大きなバッチ、複数段階のコンテキストも分割せずに扱えます。

エージェントの下位タスクとツール利用
Function Calling、構造化出力、Thinking、コード実行、Search Grounding、キャッシュに対応します。低コストのエージェント下位タスク、retrieval の整形、マルチモデルパイプライン内の構造化前処理に向いています。

Gemini 3.1 Flash Lite API に EvoLink を使う理由
すでに OpenAI 風の基盤で運用しているチームにとって、EvoLink は Gemini 3.1 Flash Lite を本番に載せやすくします。ゲートウェイを 1 本化でき、移行コストも抑えやすく、安価なモデルと上位モデルのルーティングも整理しやすくなります。
OpenAI 風ワークフローのまま Gemini を追加できる
OpenAI SDK、共通認証、既存のリクエスト層を前提にしているチームでも、コア統合を書き直さずに Gemini 3.1 Flash Lite を追加できます。
Flash Lite をマルチモデル構成の低コスト層として使える
翻訳、抽出、分類のような安く回したいトラフィックをまず Flash Lite に流し、難しいケースや高価値リクエストだけを強いモデルに送る設計を、同じゲートウェイで実現できます。
ベンダー専用統合より移行コストが低い
API キー 1 つ、OpenAI 互換と Gemini ネイティブの両フォーマット、さらにキャッシュと Batch のサポートにより、既存のモデルカタログと並行して Gemini を運用しやすくなります。
Gemini 3.1 Flash Lite API の使い方
このページは接続の概要として使い、リクエスト形式の選択と preview model ID の確認までに留め、詳しいリクエスト例はドキュメント側に任せます。
ステップ 1 - リクエスト形式を選ぶ
Gemini 3.1 Flash Lite は OpenAI 互換リクエストでも Gemini ネイティブ API でも呼び出せるため、既存スタックに合わせて統合しやすく、接続経路を全面的に書き直す必要がありません。
ステップ 2 - 現在の request model ID を使う
本番トラフィックでは正確な request model ID である "gemini-3.1-flash-lite-preview" を使ってください。これによりページ主語は Gemini 3.1 Flash Lite API のまま保ちつつ、実際の呼び出し先とも一致します。
ステップ 3 - 向いている処理をここに集める
翻訳キュー、抽出ジョブ、タグ付けなど高スループット処理は Flash Lite に寄せ、例外ケースや難しいリクエストだけをより強いモデルへ回します。正確な request body、パラメータ、endpoint 例はドキュメントで確認してください。
Gemini 3.1 Flash Lite API の機能と制限
本番導入を検討する際に重要な主要機能と制限
1,050,000 入力トークン
最大 1,050,000 入力トークンと 65,536 出力トークンに対応します。
マルチモーダル入力
テキスト、画像、動画、音声、PDF を入力でき、出力はテキストです。
Thinking + 構造化出力
Thinking と構造化出力に対応し、機械可読で安定した結果を返せます。
Function Calling + ツール
Function Calling、コード実行、Search Grounding に対応します。
キャッシュ + Batch
コンテキストキャッシュと Batch API は、繰り返し処理や大規模ワークロードに向いています。
低コスト運用
現在の EvoLink の pay-as-you-go 料金は、ページ上部のライブ価格表で確認してください。
Gemini 3.1 Flash Lite API に関する FAQ
Everything you need to know about the product and billing.
Gemini ファミリーのページと統合ガイドを続けて見る
Gemini ファミリーにおける Gemini 3.1 Flash Lite の位置付け
このルートは Gemini ファミリーの低コスト実行レイヤーであり、より強い汎用モデルの代替ではありません。高スループット・リトライしやすい・バッチ指向のワークロードに向いています。タスクの難しさや出力品質がより重要になったら、サイト上のより強い Flash ルートに上げてください。
ファミリーモデルのリンクと統合コンテンツを 1 か所にまとめ、ページの役割を明確にし、次のステップを分かりやすくします。