HappyHorse 1.0 まもなく登場詳しく見る

Gemini 2.5 Flash Lite API

EvoLink で OpenAI 互換リクエストまたはネイティブ Gemini リクエストを通じて Gemini 2.5 Flash Lite を使用できます。このルートは、より強力な Gemini モデルへのアップグレードよりもコスト管理が重要な、低コスト・大量テキスト処理向けに設計されています。
モデルタイプ:
価格: 

$0.081(~ 5.8 credits) per 1M input tokens; $0.321(~ 23.1 credits) per 1M output tokens

$0.0083(~ 0.6 credits) per 1M cache read tokens; $0.240(~ 17.3 credits) per 1M audio tokens

Google Search grounding charged separately per query.

99.9% の稼働率を保証する最も安定した構成で、本番環境に推奨されます。

すべてのバージョンで同じ API エンドポイントを使用し、異なるのは model パラメータのみです。

Gemini 2.5 Flash Lite API

Gemini 2.5 Flash Lite は EvoLink 上で Google の最もコスト効率の高い Gemini テキストルートです。トークン単価の低さが Gemini 2.5 Flash や Pro へのアップグレードよりも重要な場合に、翻訳、分類、抽出、タグ付け、要約を大規模に処理するために使用してください。

ページキーワード

Gemini 2.5 Flash Lite API

リクエストモデル ID

gemini-2.5-flash-lite

Gemini 2.5 Flash Lite API

最適なワークロード

翻訳・ローカライゼーションパイプライン

製品コピー、サポートコンテンツ、ヘルプセンター記事、多言語バックログの大量バッチ処理に Flash Lite を使用してください。リクエスト単価を低く抑えることが、より強力な推論モデルへのアップグレードよりも重要な場合に最適です。

翻訳・ローカライゼーションパイプライン

分類・タグ付け・抽出キュー

大量のチケット、フォーム、カタログコンテンツ、CRM ノート、内部テキスト記録のラベル付け、ソート、正規化、構造化フィールド抽出を行うキューに適しています。

分類・タグ付け・抽出キュー

要約・バッチテキスト処理

長いテキストの要約、繰り返しコンテンツの圧縮、データセットの前処理を行う低コストレイヤーとして使用し、難しいケースのみを Gemini 2.5 Flash や Gemini 2.5 Pro にルーティングしてください。

要約・バッチテキスト処理

このルートを選ぶタイミング

Flash Lite は Gemini ルーティング戦略の低コストレイヤーとして最も効果を発揮します:1つのゲートウェイ、1つの認証パターン、そして低コストの大量処理とより強力な Gemini ルートの明確な分離。

コストとスループットが最優先の場合に Flash Lite を選択

ワークロードが主に翻訳、タグ付け、抽出、要約、バッチテキストクリーニングの場合、Flash Lite は単価を低く抑えつつ別の統合パスを作成する必要がないため、実用的な出発点です。

難易度の高い推論タスクにはデフォルトで Flash Lite を使用しない

タスクの品質閾値が高い場合、推論パスがより複雑な場合、または低コストの一次処理レイヤーを通過するエッジケースが多すぎる場合、Flash Lite をスタックの中核にすべきではありません。

品質が価格より重要な場合は Gemini 2.5 Flash または Pro にアップグレード

より強力な汎用ルートが必要な場合は Gemini 2.5 Flash に、タスクがより高性能なプレミアムモデルを正当化する場合は Gemini 2.5 Pro にアップグレードしてください。EvoLink はこのルーティング分離を1つのゲートウェイで簡単に運用できます。

始め方

このページをクイックルートガイドとして使用してください:リクエスト形式を選択し、正しいモデル ID を使用し、詳細なリクエスト構文はドキュメントを参照してください。

1

ステップ 1 – リクエスト形式を選択

既存のスタックに応じて、OpenAI 互換リクエストまたはネイティブ Gemini リクエストで Gemini 2.5 Flash Lite を呼び出します。

2

ステップ 2 – 正しいモデル ID を使用

このルートのリクエストモデル ID として "gemini-2.5-flash-lite" を使用してください。

3

ステップ 3 – 適切なワークロードをここにルーティング

翻訳、分類、抽出、タグ付け、要約、バッチテキスト処理に Flash Lite を使用してください。タスクがより強力な Gemini ルートを必要とする場合にのみアップグレードしてください。

主要機能と制限

このルートがワークロードに適しているかを判断する際に重要な主要制限と本番シグナル

コンテキスト

1,048,576 入力トークン

長いプロンプト、大きなドキュメント、バッチテキスト処理に対応する最大 1,048,576 入力トークンをサポート。

出力

65,536 最大出力トークン

ラベル、要約、抽出フィールド、テキスト応答などのコンパクトな出力に最適。

入力

テキスト + 音声入力、テキスト出力

テキストと音声の入力を受け付け、文字起こし関連およびテキスト処理ワークフロー向けにテキスト出力を返します。

キャッシュ

暗黙キャッシュ

繰り返しのコンテキストは暗黙キャッシュの恩恵を受けることができ、重複するリクエストのコスト削減に役立ちます。

スケール

Batch API

キュー処理、オフライン処理、その他の大量処理パターンに対応する Batch API をサポート。

料金

最もコスト効率の高い Gemini テキストルート

能力と価格の両面で Gemini 2.5 Flash より下に位置し、大量テキストワークロードの実用的な予算レイヤーです。

Gemini 2.5 Flash Lite API よくある質問

Everything you need to know about the product and billing.

はい。Flash Lite は価格と能力の両面で Gemini 2.5 Flash より下に位置しており、低コストの大量テキストワークロード向けに設計されています。
はい。EvoLink はこのルートに対して OpenAI 互換リクエストとネイティブ Gemini リクエストの両方をサポートしています。
リクエストモデル ID として "gemini-2.5-flash-lite" を使用してください。
Gemini 2.5 Flash Lite は最大 1,048,576 入力トークンと最大 65,536 出力トークンをサポートしています。
はい。このルートはテキストと音声の入力をサポートしており、テキスト出力を返します。
暗黙キャッシュは、リクエスト間でコンテキストが重複している場合に繰り返しトークンコストを削減できます。これは繰り返しプロンプトやバッチワークロードに特に有用です。
翻訳、タグ付け、抽出、要約、その他の大量テキストタスクで最も低い実用コストが必要な場合に Flash Lite を選択してください。より強力な汎用ルートが必要な場合は Flash にアップグレードしてください。
翻訳、分類、抽出、タグ付け、要約、その他のバッチテキスト処理ワークロードで、コストとスループットがデフォルトでより強力なモデルを使用することよりも重要な場合に最適です。
はい。Gemini 2.5 Flash Lite は function calling をサポートしていますが、通常は最も複雑なツール集約型推論タスクの最強オプションとしてではなく、低コストテキストルートとして位置づけるのが最適です。

Gemini ルーティングの次のステップ

Gemini ファミリーにおける Flash Lite の位置

大量テキスト処理には Flash Lite を使用し、より強力な汎用ルートが必要な場合は Gemini 2.5 Flash に、タスクがプレミアムな推論品質を正当化する場合は Gemini 2.5 Pro にアップグレードしてください。

Flash Lite のスタック内での役割が明確になったら、このエリアから適切な Gemini ルートやドキュメントに移動してください。