Gemini 2.5 Flash Lite API
$0.081(~ 5.8 credits) per 1M input tokens; $0.321(~ 23.1 credits) per 1M output tokens
$0.0083(~ 0.6 credits) per 1M cache read tokens; $0.240(~ 17.3 credits) per 1M audio tokens
Google Search grounding charged separately per query.
Stabilité maximale avec une disponibilité garantie de 99,9 %. Recommandé pour la production.
Le même endpoint API est utilisé pour toutes les versions. Seul le paramètre model change.
Gemini 2.5 Flash Lite API
Gemini 2.5 Flash Lite est la route texte Gemini la plus économique de Google sur EvoLink. Utilisez-la pour la traduction, la classification, l'extraction, le balisage et la synthèse à grande échelle lorsque le faible coût par token est plus important que la mise à niveau vers Gemini 2.5 Flash ou Pro.
Mot-clé de la page
Gemini 2.5 Flash Lite API
ID de modèle de requête
gemini-2.5-flash-lite

Charges de travail optimales
Pipelines de traduction et localisation
Utilisez Flash Lite pour de grands lots de textes produits, contenus de support, articles du centre d'aide et arriérés multilingues où maintenir un faible coût par requête compte plus que la mise à niveau vers un modèle de raisonnement plus puissant.

Files de classification, balisage et extraction
Idéal pour les files de traitement qui étiquettent, trient, normalisent ou extraient des champs structurés à partir de grands volumes de tickets, formulaires, contenus de catalogue, notes CRM ou enregistrements texte internes.

Synthèse et traitement de texte par lots
Utilisez-la comme couche à faible coût pour résumer de longs textes, compresser du contenu répétitif ou prétraiter des jeux de données avant de ne router que les cas les plus difficiles vers Gemini 2.5 Flash ou Gemini 2.5 Pro.

Quand choisir cette route
Flash Lite a le plus de sens en tant que couche à faible coût dans une stratégie de routage Gemini : un gateway, un modèle d'authentification et une séparation plus claire entre le traitement en masse économique et les routes Gemini plus puissantes.
Choisissez Flash Lite quand le coût et le débit dictent la décision
Si la charge de travail est principalement de la traduction, du balisage, de l'extraction, de la synthèse ou du nettoyage de texte par lots, Flash Lite est le point de départ pratique car il maintient le coût unitaire bas sans créer un chemin d'intégration séparé.
N'utilisez pas Flash Lite par défaut pour les tâches de raisonnement complexes
Flash Lite n'est pas la route sur laquelle centrer votre stack quand le seuil de qualité est plus élevé, le chemin de raisonnement plus complexe ou que trop de cas limites doivent passer par une couche de premier passage économique.
Passez à Gemini 2.5 Flash ou Pro quand la qualité compte plus que le prix
Passez à Gemini 2.5 Flash pour une route polyvalente plus puissante, ou à Gemini 2.5 Pro quand la tâche justifie un modèle premium plus performant. EvoLink facilite cette séparation de routage derrière un seul gateway.
Comment commencer
Utilisez cette page comme guide rapide de route : choisissez le format de requête, utilisez le bon ID de modèle et gardez la syntaxe détaillée dans la documentation.
Étape 1 – Choisissez le format de requête
Appelez Gemini 2.5 Flash Lite via des requêtes compatibles OpenAI ou des requêtes natives Gemini, selon le stack que vous utilisez déjà.
Étape 2 – Utilisez le bon ID de modèle
Utilisez l'ID de modèle de requête "gemini-2.5-flash-lite" pour cette route.
Étape 3 – Routez les bonnes charges de travail ici
Utilisez Flash Lite pour la traduction, la classification, l'extraction, le balisage, la synthèse et le traitement de texte par lots. Ne montez en gamme que quand la tâche nécessite une route Gemini plus puissante.
Capacités principales et limites
Les principales limites et signaux de production qui comptent pour décider si cette route convient à votre charge de travail
1 048 576 Tokens d'entrée
Supporte jusqu'à 1 048 576 tokens d'entrée pour les prompts longs, les gros documents et le traitement de texte par lots.
65 536 Tokens de sortie maximum
Plus adapté aux sorties compactes comme les étiquettes, synthèses, champs extraits et réponses texte.
Texte + Audio en entrée, Texte en sortie
Accepte les entrées texte et audio, avec sortie texte pour les workflows de transcription et de traitement de texte.
Mise en cache implicite
Le contexte répété peut bénéficier de la mise en cache implicite, ce qui aide à réduire les coûts sur les requêtes qui se chevauchent.
Batch API
Supporte le Batch API pour les traitements en file d'attente, hors ligne ou autres modèles à haut volume.
Route texte Gemini la plus économique
Positionnée en dessous de Gemini 2.5 Flash en capacité et en prix, ce qui en fait la couche budget pratique pour les charges de travail texte en masse.
FAQ de l'API Gemini 2.5 Flash Lite
Everything you need to know about the product and billing.
Prochaines étapes pour le routage Gemini
Où Flash Lite se situe dans la famille Gemini
Utilisez Flash Lite pour le traitement de texte en masse, passez à Gemini 2.5 Flash quand vous avez besoin d'une route polyvalente plus puissante, et à Gemini 2.5 Pro quand la tâche justifie une qualité de raisonnement premium.
Utilisez cette zone pour passer à la bonne route Gemini ou à la documentation une fois que le rôle de Flash Lite dans votre stack est clair.