HappyHorse 1.0 arrive bientôtEn savoir plus

Gemini 2.5 Flash Lite API

Utilisez Gemini 2.5 Flash Lite sur EvoLink via des requêtes compatibles OpenAI ou des requêtes natives Gemini. Cette route est conçue pour les charges de travail texte à haut volume et faible coût, où le contrôle des coûts compte plus que le passage à un modèle Gemini plus puissant.
Type de modèle:
Prix: 

$0.081(~ 5.8 credits) per 1M input tokens; $0.321(~ 23.1 credits) per 1M output tokens

$0.0083(~ 0.6 credits) per 1M cache read tokens; $0.240(~ 17.3 credits) per 1M audio tokens

Google Search grounding charged separately per query.

Stabilité maximale avec une disponibilité garantie de 99,9 %. Recommandé pour la production.

Le même endpoint API est utilisé pour toutes les versions. Seul le paramètre model change.

Gemini 2.5 Flash Lite API

Gemini 2.5 Flash Lite est la route texte Gemini la plus économique de Google sur EvoLink. Utilisez-la pour la traduction, la classification, l'extraction, le balisage et la synthèse à grande échelle lorsque le faible coût par token est plus important que la mise à niveau vers Gemini 2.5 Flash ou Pro.

Mot-clé de la page

Gemini 2.5 Flash Lite API

ID de modèle de requête

gemini-2.5-flash-lite

Gemini 2.5 Flash Lite API

Charges de travail optimales

Pipelines de traduction et localisation

Utilisez Flash Lite pour de grands lots de textes produits, contenus de support, articles du centre d'aide et arriérés multilingues où maintenir un faible coût par requête compte plus que la mise à niveau vers un modèle de raisonnement plus puissant.

Pipelines de traduction et localisation

Files de classification, balisage et extraction

Idéal pour les files de traitement qui étiquettent, trient, normalisent ou extraient des champs structurés à partir de grands volumes de tickets, formulaires, contenus de catalogue, notes CRM ou enregistrements texte internes.

Files de classification, balisage et extraction

Synthèse et traitement de texte par lots

Utilisez-la comme couche à faible coût pour résumer de longs textes, compresser du contenu répétitif ou prétraiter des jeux de données avant de ne router que les cas les plus difficiles vers Gemini 2.5 Flash ou Gemini 2.5 Pro.

Synthèse et traitement de texte par lots

Quand choisir cette route

Flash Lite a le plus de sens en tant que couche à faible coût dans une stratégie de routage Gemini : un gateway, un modèle d'authentification et une séparation plus claire entre le traitement en masse économique et les routes Gemini plus puissantes.

Choisissez Flash Lite quand le coût et le débit dictent la décision

Si la charge de travail est principalement de la traduction, du balisage, de l'extraction, de la synthèse ou du nettoyage de texte par lots, Flash Lite est le point de départ pratique car il maintient le coût unitaire bas sans créer un chemin d'intégration séparé.

N'utilisez pas Flash Lite par défaut pour les tâches de raisonnement complexes

Flash Lite n'est pas la route sur laquelle centrer votre stack quand le seuil de qualité est plus élevé, le chemin de raisonnement plus complexe ou que trop de cas limites doivent passer par une couche de premier passage économique.

Passez à Gemini 2.5 Flash ou Pro quand la qualité compte plus que le prix

Passez à Gemini 2.5 Flash pour une route polyvalente plus puissante, ou à Gemini 2.5 Pro quand la tâche justifie un modèle premium plus performant. EvoLink facilite cette séparation de routage derrière un seul gateway.

Comment commencer

Utilisez cette page comme guide rapide de route : choisissez le format de requête, utilisez le bon ID de modèle et gardez la syntaxe détaillée dans la documentation.

1

Étape 1 – Choisissez le format de requête

Appelez Gemini 2.5 Flash Lite via des requêtes compatibles OpenAI ou des requêtes natives Gemini, selon le stack que vous utilisez déjà.

2

Étape 2 – Utilisez le bon ID de modèle

Utilisez l'ID de modèle de requête "gemini-2.5-flash-lite" pour cette route.

3

Étape 3 – Routez les bonnes charges de travail ici

Utilisez Flash Lite pour la traduction, la classification, l'extraction, le balisage, la synthèse et le traitement de texte par lots. Ne montez en gamme que quand la tâche nécessite une route Gemini plus puissante.

Capacités principales et limites

Les principales limites et signaux de production qui comptent pour décider si cette route convient à votre charge de travail

Contexte

1 048 576 Tokens d'entrée

Supporte jusqu'à 1 048 576 tokens d'entrée pour les prompts longs, les gros documents et le traitement de texte par lots.

Sortie

65 536 Tokens de sortie maximum

Plus adapté aux sorties compactes comme les étiquettes, synthèses, champs extraits et réponses texte.

Entrée

Texte + Audio en entrée, Texte en sortie

Accepte les entrées texte et audio, avec sortie texte pour les workflows de transcription et de traitement de texte.

Cache

Mise en cache implicite

Le contexte répété peut bénéficier de la mise en cache implicite, ce qui aide à réduire les coûts sur les requêtes qui se chevauchent.

Échelle

Batch API

Supporte le Batch API pour les traitements en file d'attente, hors ligne ou autres modèles à haut volume.

Tarifs

Route texte Gemini la plus économique

Positionnée en dessous de Gemini 2.5 Flash en capacité et en prix, ce qui en fait la couche budget pratique pour les charges de travail texte en masse.

FAQ de l'API Gemini 2.5 Flash Lite

Everything you need to know about the product and billing.

Oui. Flash Lite est positionné en dessous de Gemini 2.5 Flash en prix et en capacité, et est conçu pour les charges de travail texte en masse à moindre coût.
Oui. EvoLink supporte à la fois les requêtes compatibles OpenAI et les requêtes natives Gemini pour cette route.
Utilisez "gemini-2.5-flash-lite" comme ID de modèle de requête.
Gemini 2.5 Flash Lite supporte jusqu'à 1 048 576 tokens d'entrée et jusqu'à 65 536 tokens de sortie.
Oui. Cette route supporte les entrées texte et audio, avec sortie texte.
La mise en cache implicite peut réduire le coût des tokens répétés lorsque les requêtes partagent un contexte qui se chevauche, ce qui est utile pour les prompts récurrents et les charges de travail par lots.
Choisissez Flash Lite quand la traduction, le balisage, l'extraction, la synthèse et autres tâches texte à haut volume nécessitent le coût pratique le plus bas. Passez à Flash quand vous avez besoin d'une route polyvalente plus puissante.
Il est le mieux adapté à la traduction, la classification, l'extraction, le balisage, la synthèse et autres charges de travail de traitement de texte par lots où le coût et le débit comptent plus que l'utilisation d'un modèle plus puissant par défaut.
Oui. Gemini 2.5 Flash Lite supporte le function calling, mais il est généralement mieux positionné comme route texte à faible coût plutôt que comme l'option la plus puissante pour les tâches de raisonnement les plus complexes avec des outils.

Prochaines étapes pour le routage Gemini

Où Flash Lite se situe dans la famille Gemini

Utilisez Flash Lite pour le traitement de texte en masse, passez à Gemini 2.5 Flash quand vous avez besoin d'une route polyvalente plus puissante, et à Gemini 2.5 Pro quand la tâche justifie une qualité de raisonnement premium.

Utilisez cette zone pour passer à la bonne route Gemini ou à la documentation une fois que le rôle de Flash Lite dans votre stack est clair.