Gemini 2.5 Flash Lite API

Utilisez Gemini 2.5 Flash Lite sur EvoLink via des requêtes compatibles OpenAI ou des requêtes natives Gemini. Cette route est conçue pour les charges de travail texte à haut volume et faible coût, où le contrôle des coûts compte plus que le passage à un modèle Gemini plus puissant.

Type de modèle:

Prix:

$0.094(~ 6.4 credits) par 1M tokens d'entrée; $0.374(~ 25.4 credits) par 1M tokens de sortie

$0.0088(~ 0.6 credits) par 1M tokens de lecture de cache; $0.281(~ 19.1 credits) par 1M tokens audio

L'ancrage Google Search est facturé séparément par requête.

Accès géré stable pour les charges de production. Recommandé lorsque vous avez besoin d'une facturation dans le tableau de bord, d'un contrôle des clés API et d'un comportement d'intégration prévisible.

Le même endpoint API est utilisé pour toutes les versions. Seul le paramètre model change.

PRICING

PLAN	CONTEXT WINDOW	MAX OUTPUT	INPUT	OUTPUT	CACHE READ	AUDIO INPUT
Gemini 2.5 Flash Lite	1,048,576	65,536	$0.095-6% (6.4 Credits)	$0.374-7% (25.4 Credits)	$0.009-12% (0.60 Credits)	$0.281-6% (19.1 Credits)
Web Search Tool Server-side web search capability						$0.033/search (2.2 Credits)

Pricing Note: Prices show both USD and Credits. Units default to / 1M tokens unless noted separately.

Cache Hit: Price applies to cached prompt tokens.

Audio Input: Audio tokens charged at a separate rate.

Gemini 2.5 Flash Lite API

Name: EvoLink AI Model API Platform
Brand: EvoLink
Availability: InStock

Gemini 2.5 Flash Lite est la route texte Gemini la plus économique de Google sur EvoLink. Utilisez-la pour la traduction, la classification, l'extraction, le balisage et la synthèse à grande échelle lorsque le faible coût par token est plus important que la mise à niveau vers Gemini 2.5 Flash ou Pro.

Mot-clé de la page

ID de modèle de requête

gemini-2.5-flash-lite

Charges de travail optimales

Pipelines de traduction et localisation

Utilisez Flash Lite pour de grands lots de textes produits, contenus de support, articles du centre d'aide et arriérés multilingues où maintenir un faible coût par requête compte plus que la mise à niveau vers un modèle de raisonnement plus puissant.

Files de classification, balisage et extraction

Idéal pour les files de traitement qui étiquettent, trient, normalisent ou extraient des champs structurés à partir de grands volumes de tickets, formulaires, contenus de catalogue, notes CRM ou enregistrements texte internes.

Synthèse et traitement de texte par lots

Utilisez-la comme couche à faible coût pour résumer de longs textes, compresser du contenu répétitif ou prétraiter des jeux de données avant de ne router que les cas les plus difficiles vers Gemini 2.5 Flash ou Gemini 2.5 Pro.

Quand choisir cette route

Flash Lite a le plus de sens en tant que couche à faible coût dans une stratégie de routage Gemini : un gateway, un modèle d'authentification et une séparation plus claire entre le traitement en masse économique et les routes Gemini plus puissantes.

Choisissez Flash Lite quand le coût et le débit dictent la décision

Si la charge de travail est principalement de la traduction, du balisage, de l'extraction, de la synthèse ou du nettoyage de texte par lots, Flash Lite est le point de départ pratique car il maintient le coût unitaire bas sans créer un chemin d'intégration séparé.

N'utilisez pas Flash Lite par défaut pour les tâches de raisonnement complexes

Flash Lite n'est pas la route sur laquelle centrer votre stack quand le seuil de qualité est plus élevé, le chemin de raisonnement plus complexe ou que trop de cas limites doivent passer par une couche de premier passage économique.

Passez à Gemini 2.5 Flash ou Pro quand la qualité compte plus que le prix

Passez à Gemini 2.5 Flash pour une route polyvalente plus puissante, ou à Gemini 2.5 Pro quand la tâche justifie un modèle premium plus performant. EvoLink facilite cette séparation de routage derrière un seul gateway.

Comment commencer

Utilisez cette page comme guide rapide de route : choisissez le format de requête, utilisez le bon ID de modèle et gardez la syntaxe détaillée dans la documentation.

Étape 1 – Choisissez le format de requête

Appelez Gemini 2.5 Flash Lite via des requêtes compatibles OpenAI ou des requêtes natives Gemini, selon le stack que vous utilisez déjà.

Étape 2 – Utilisez le bon ID de modèle

Utilisez l'ID de modèle de requête "gemini-2.5-flash-lite" pour cette route.

Étape 3 – Routez les bonnes charges de travail ici

Utilisez Flash Lite pour la traduction, la classification, l'extraction, le balisage, la synthèse et le traitement de texte par lots. Ne montez en gamme que quand la tâche nécessite une route Gemini plus puissante.

Capacités principales et limites

Les principales limites et signaux de production qui comptent pour décider si cette route convient à votre charge de travail

Contexte

1 048 576 Tokens d'entrée

Supporte jusqu'à 1 048 576 tokens d'entrée pour les prompts longs, les gros documents et le traitement de texte par lots.

Sortie

65 536 Tokens de sortie maximum

Plus adapté aux sorties compactes comme les étiquettes, synthèses, champs extraits et réponses texte.

Entrée

Texte + Audio en entrée, Texte en sortie

Accepte les entrées texte et audio, avec sortie texte pour les workflows de transcription et de traitement de texte.

Cache

Mise en cache implicite

Le contexte répété peut bénéficier de la mise en cache implicite, ce qui aide à réduire les coûts sur les requêtes qui se chevauchent.

Échelle

Batch API

Supporte le Batch API pour les traitements en file d'attente, hors ligne ou autres modèles à haut volume.

Tarifs

Route texte Gemini la plus économique

Positionnée en dessous de Gemini 2.5 Flash en capacité et en prix, ce qui en fait la couche budget pratique pour les charges de travail texte en masse.

FAQ de l'API Gemini 2.5 Flash Lite

Everything you need to know about the product and billing.

Oui. Flash Lite est positionné en dessous de Gemini 2.5 Flash en prix et en capacité, et est conçu pour les charges de travail texte en masse à moindre coût.

Oui. EvoLink supporte à la fois les requêtes compatibles OpenAI et les requêtes natives Gemini pour cette route.

Utilisez "gemini-2.5-flash-lite" comme ID de modèle de requête.

Gemini 2.5 Flash Lite supporte jusqu'à 1 048 576 tokens d'entrée et jusqu'à 65 536 tokens de sortie.

Oui. Cette route supporte les entrées texte et audio, avec sortie texte.

La mise en cache implicite peut réduire le coût des tokens répétés lorsque les requêtes partagent un contexte qui se chevauche, ce qui est utile pour les prompts récurrents et les charges de travail par lots.

Choisissez Flash Lite quand la traduction, le balisage, l'extraction, la synthèse et autres tâches texte à haut volume nécessitent le coût pratique le plus bas. Passez à Flash quand vous avez besoin d'une route polyvalente plus puissante.

Il est le mieux adapté à la traduction, la classification, l'extraction, le balisage, la synthèse et autres charges de travail de traitement de texte par lots où le coût et le débit comptent plus que l'utilisation d'un modèle plus puissant par défaut.

Oui. Gemini 2.5 Flash Lite supporte le function calling, mais il est généralement mieux positionné comme route texte à faible coût plutôt que comme l'option la plus puissante pour les tâches de raisonnement les plus complexes avec des outils.

Modèles Gemini API sur EvoLink

Gemini 2.5 Flash Lite est la route texte Gemini la moins chère de Google. Pour des capacités multimodales plus puissantes, passez à Gemini 2.5 Flash ; pour le raisonnement avancé, choisissez Gemini 3.1 Pro.

Explorer la famille Gemini Gemini 2.5 Flash Gemini 2.5 Pro Gemini 3.1 Pro