Gemini 2.5 Flash Lite API
$0.081(~ 5.8 credits) per 1M input tokens; $0.321(~ 23.1 credits) per 1M output tokens
$0.0083(~ 0.6 credits) per 1M cache read tokens; $0.240(~ 17.3 credits) per 1M audio tokens
Google Search grounding charged separately per query.
99.9% の稼働率を保証する最も安定した構成で、本番環境に推奨されます。
すべてのバージョンで同じ API エンドポイントを使用し、異なるのは model パラメータのみです。
Gemini 2.5 Flash Lite API
Gemini 2.5 Flash Lite は EvoLink 上で Google の最もコスト効率の高い Gemini テキストルートです。トークン単価の低さが Gemini 2.5 Flash や Pro へのアップグレードよりも重要な場合に、翻訳、分類、抽出、タグ付け、要約を大規模に処理するために使用してください。
ページキーワード
Gemini 2.5 Flash Lite API
リクエストモデル ID
gemini-2.5-flash-lite

最適なワークロード
翻訳・ローカライゼーションパイプライン
製品コピー、サポートコンテンツ、ヘルプセンター記事、多言語バックログの大量バッチ処理に Flash Lite を使用してください。リクエスト単価を低く抑えることが、より強力な推論モデルへのアップグレードよりも重要な場合に最適です。

分類・タグ付け・抽出キュー
大量のチケット、フォーム、カタログコンテンツ、CRM ノート、内部テキスト記録のラベル付け、ソート、正規化、構造化フィールド抽出を行うキューに適しています。

要約・バッチテキスト処理
長いテキストの要約、繰り返しコンテンツの圧縮、データセットの前処理を行う低コストレイヤーとして使用し、難しいケースのみを Gemini 2.5 Flash や Gemini 2.5 Pro にルーティングしてください。

このルートを選ぶタイミング
Flash Lite は Gemini ルーティング戦略の低コストレイヤーとして最も効果を発揮します:1つのゲートウェイ、1つの認証パターン、そして低コストの大量処理とより強力な Gemini ルートの明確な分離。
コストとスループットが最優先の場合に Flash Lite を選択
ワークロードが主に翻訳、タグ付け、抽出、要約、バッチテキストクリーニングの場合、Flash Lite は単価を低く抑えつつ別の統合パスを作成する必要がないため、実用的な出発点です。
難易度の高い推論タスクにはデフォルトで Flash Lite を使用しない
タスクの品質閾値が高い場合、推論パスがより複雑な場合、または低コストの一次処理レイヤーを通過するエッジケースが多すぎる場合、Flash Lite をスタックの中核にすべきではありません。
品質が価格より重要な場合は Gemini 2.5 Flash または Pro にアップグレード
より強力な汎用ルートが必要な場合は Gemini 2.5 Flash に、タスクがより高性能なプレミアムモデルを正当化する場合は Gemini 2.5 Pro にアップグレードしてください。EvoLink はこのルーティング分離を1つのゲートウェイで簡単に運用できます。
始め方
このページをクイックルートガイドとして使用してください:リクエスト形式を選択し、正しいモデル ID を使用し、詳細なリクエスト構文はドキュメントを参照してください。
ステップ 1 – リクエスト形式を選択
既存のスタックに応じて、OpenAI 互換リクエストまたはネイティブ Gemini リクエストで Gemini 2.5 Flash Lite を呼び出します。
ステップ 2 – 正しいモデル ID を使用
このルートのリクエストモデル ID として "gemini-2.5-flash-lite" を使用してください。
ステップ 3 – 適切なワークロードをここにルーティング
翻訳、分類、抽出、タグ付け、要約、バッチテキスト処理に Flash Lite を使用してください。タスクがより強力な Gemini ルートを必要とする場合にのみアップグレードしてください。
主要機能と制限
このルートがワークロードに適しているかを判断する際に重要な主要制限と本番シグナル
1,048,576 入力トークン
長いプロンプト、大きなドキュメント、バッチテキスト処理に対応する最大 1,048,576 入力トークンをサポート。
65,536 最大出力トークン
ラベル、要約、抽出フィールド、テキスト応答などのコンパクトな出力に最適。
テキスト + 音声入力、テキスト出力
テキストと音声の入力を受け付け、文字起こし関連およびテキスト処理ワークフロー向けにテキスト出力を返します。
暗黙キャッシュ
繰り返しのコンテキストは暗黙キャッシュの恩恵を受けることができ、重複するリクエストのコスト削減に役立ちます。
Batch API
キュー処理、オフライン処理、その他の大量処理パターンに対応する Batch API をサポート。
最もコスト効率の高い Gemini テキストルート
能力と価格の両面で Gemini 2.5 Flash より下に位置し、大量テキストワークロードの実用的な予算レイヤーです。
Gemini 2.5 Flash Lite API よくある質問
Everything you need to know about the product and billing.
Gemini ルーティングの次のステップ
Gemini ファミリーにおける Flash Lite の位置
大量テキスト処理には Flash Lite を使用し、より強力な汎用ルートが必要な場合は Gemini 2.5 Flash に、タスクがプレミアムな推論品質を正当化する場合は Gemini 2.5 Pro にアップグレードしてください。
Flash Lite のスタック内での役割が明確になったら、このエリアから適切な Gemini ルートやドキュメントに移動してください。