Comparer les modèles Gemini : Pro, Flash et Lite tarifs API

Name: EvoLink AI Model API Platform
Brand: EvoLink
Availability: InStock

Gemini API Family

Comparez les routes Gemini d'EvoLink pour le raisonnement haut de gamme, Flash a faible latence, les longs contextes et la comprehension multimodale.

Voir la documentation API Voir les tarifs

📦

7 routes

Niveaux Pro, Flash et Lite pour chaque budget

🔗

Acces API unifie

Compatible OpenAI, une cle pour tout Gemini

🎯

Choisir par workflow

Associer Pro vs Flash vs Lite a votre tache

Comparaison des modeles Comment choisir Cas d'usage Acces unifie FAQ

Comparer les routes Gemini API

Choisissez selon le workload : raisonnement flagship, trafic Flash de production, extraction a bas cout ou analyse multimodale long contexte.

Route	Ideal pour	Tarifs	Fenetre de contexte	Modalite	Statut
Gemini 3.1 Pro Preview Raisonnement flagship	Meilleure qualite Gemini pour raisonnement, code, agents et analyse long contexte.	$2/$12 <=200K; $4/$18 >200K	1M input / 64K output	Texte, code, image, video, audio, PDF en entree	Preview flagship
Gemini 3.5 Flash Stable — GA pour la production	Workflows agentiques, agents de code, deploiement de sous-agents et taches de production longue duree au cout Flash.	$1.50/$9.00 per MTok	1M input / 65K output	Texte, image, video, audio, PDF en entree	Stable (GA)
Gemini 3 Flash Preview Gemini 3 rapide	Apps multimodales a faible latence qui ont besoin du comportement Gemini 3.	$0.50/$3.00 per MTok (audio in: $1.00)	1M input / 64K output	Texte, image, video, audio, PDF en entree	Preview route
Gemini 3.1 Flash Lite Preview Gemini 3 le moins cher	Traduction, classification, extraction et traitement texte en volume.	$0.25/$1.50 per MTok (audio in: $0.50)	1M input / 64K output	Texte, image, video, audio, PDF en entree	Preview route
Gemini 2.5 Pro Pro stable	Raisonnement de production, aide au code, analyse et taches multimodales complexes.	$1.25/$10 <=200K; $2.50/$15 >200K	1M input / 64K output	Texte, image, video, audio, PDF en entree	Stable deep reasoning
Gemini 2.5 Flash Flash production	Chat rapide, extraction, resumes et trafic multimodal de production.	$0.30/$2.50 per MTok (audio in: $1.00)	1M input / 64K output	Texte, image, video, audio, PDF en entree	Production workhorse
Gemini 2.5 Flash Lite Cout le plus bas	Classification, extraction, routage et chat leger a haut volume.	$0.10/$0.40 per MTok (audio in: $0.30)	1M input / 64K output	Texte et audio en entree	Lowest-cost text route

Comment choisir le bon modele Gemini

Suivez ces 4 regles pour affiner votre choix entre les niveaux Pro, Flash et Lite.

Commencez par la profondeur de raisonnement

Agents de code complexes, utilisation d'outils multi-etapes, analyse documentaire approfondie et sortie haute precision — commencez avec Gemini 3.1 Pro ou Gemini 2.5 Pro.

Puis verifiez les besoins en latence et debit

Chat de production, bots de support, extraction en temps reel et apps multimodales a haute frequence — comparez Gemini 3 Flash ou Gemini 2.5 Flash.

Puis verifiez la sensibilite au cout

Classification a haut volume, traitement de texte par lots, routage et extraction legere — comparez Gemini 3.1 Flash Lite ou Gemini 2.5 Flash Lite.

Enfin, considerez les workflows de complexite mixte

Si la meme pipeline melange classification simple et etapes de raisonnement profond, envisagez EvoLink Smart Router au lieu de coder en dur un seul modele Gemini.

Smart Router →

Si vous connaissez deja votre type de tache, trouvez le point de depart recommande dans le tableau ci-dessous.

Choisir un modele Gemini par workflow : raisonnement, vitesse, cout et taches multimodales

Associez votre tache principale a la bonne route Gemini.

Votre tache	Depart recommande	Bon choix si…	A surveiller
Raisonnement complexe et agents de code	Gemini 3.1 Pro	Vous avez besoin de la meilleure qualite de raisonnement Gemini, d'utilisation d'outils multi-etapes ou d'analyse de code approfondie	Cout plus eleve — utilisez Flash pour les taches plus simples
Deep reasoning stable avec multimodal	Gemini 2.5 Pro	Vous avez besoin d'un raisonnement de niveau production avec un large support multimodal et une stabilite prouvee	Plafond de capacite legerement inferieur a 3.1 Pro
Workflows agentiques et agents de code	Gemini 3.5 Flash	Vous avez besoin d'une intelligence de pointe au cout Flash pour les agents de code, les boucles de sous-agents et les taches de longue duree	GA et stable — le Flash par defaut pour les workloads d'agents
Apps multimodales a faible latence	Gemini 3 Flash	Vous avez besoin de reponses rapides avec les capacites Gemini 3 en texte, image, audio et video	Route preview — verifiez les exigences de stabilite
Chat et extraction de production	Gemini 2.5 Flash	Vous avez besoin d'un modele de production eprouve pour le chat, les resumes et l'extraction a l'echelle	Bon defaut pour la plupart des workloads de production
Texte par lots a haut volume au cout le plus bas	Gemini 2.5 Flash Lite	Les taches sont de la classification, du routage ou des reponses courtes ou le cout prime	Limite aux entrees texte et audio uniquement
Workflows textuels de complexite mixte	EvoLink Smart Router	La meme pipeline a des taches simples et complexes entre Gemini et d'autres fournisseurs	Ideal quand vous ne voulez pas de logique de routage manuelle

Workflows API Gemini : agents, chat, documents et traitement multimodal

Decouvrez comment les modeles Gemini s'integrent dans des produits reels, des agents et des pipelines de traitement de contenu.

Agents de raisonnement et de code

Pour la generation de code, la correction de bugs, l'utilisation d'outils multi-etapes et les agents d'analyse complexes. Si la qualite de sortie affecte directement le comportement du produit, commencez avec Gemini 3.1 Pro. Pour une stabilite prouvee, comparez Gemini 2.5 Pro.

Voir Gemini 3.1 Pro →

Chat et support de production

Pour les bots de support, les assistants in-app, le Q&A sur base de connaissances et les conversations multi-tours a haute frequence. Testez d'abord avec Gemini 2.5 Flash pour un debit eprouve, puis comparez Flash Lite pour un cout moindre.

Voir Gemini 2.5 Flash →

Analyse documentaire et multimodale longue

Pour l'analyse de PDFs, la comprehension video, la transcription audio et les workflows de recherche multi-fichiers. La fenetre de contexte 1M de Gemini et son support multimodal natif font des routes Pro et Flash des choix solides.

Voir Gemini 2.5 Pro →

Routage d'agents et taches mixtes

Pour les workflows ou classification, extraction, raisonnement et generation coexistent dans la meme pipeline. Utilisez EvoLink Smart Router pour router automatiquement entre Gemini et d'autres fournisseurs via evolink/auto.

Voir Smart Router →

Voir les details de chaque modele Gemini

Chaque route renvoie vers une page modele dediee avec tarifs, specifications et details d'integration.

Gemini 3.1 Pro Preview

Raisonnement flagship

Fenetre de contexte: 1M input / 64K output
Tarifs: $2/$12 <=200K; $4/$18 >200K

Voir Gemini 3.1 Pro Preview →

Gemini 3.5 Flash

Stable — GA pour la production

Fenetre de contexte: 1M input / 65K output
Tarifs: $1.50/$9.00 per MTok

Voir Gemini 3.5 Flash →

Gemini 3 Flash Preview

Gemini 3 rapide

Fenetre de contexte: 1M input / 64K output
Tarifs: $0.50/$3.00 per MTok (audio in: $1.00)

Voir Gemini 3 Flash Preview →

Gemini 3.1 Flash Lite Preview

Gemini 3 le moins cher

Fenetre de contexte: 1M input / 64K output
Tarifs: $0.25/$1.50 per MTok (audio in: $0.50)

Voir Gemini 3.1 Flash Lite Preview →

Gemini 2.5 Pro

Pro stable

Fenetre de contexte: 1M input / 64K output
Tarifs: $1.25/$10 <=200K; $2.50/$15 >200K

Voir Gemini 2.5 Pro →

Gemini 2.5 Flash

Flash production

Fenetre de contexte: 1M input / 64K output
Tarifs: $0.30/$2.50 per MTok (audio in: $1.00)

Voir Gemini 2.5 Flash →

Gemini 2.5 Flash Lite

Cout le plus bas

Fenetre de contexte: 1M input / 64K output
Tarifs: $0.10/$0.40 per MTok (audio in: $0.30)

Voir Gemini 2.5 Flash Lite →

Accedez a tous les modeles Gemini via une seule API EvoLink

Les 7 routes Gemini sont disponibles via une seule cle API EvoLink et un endpoint compatible OpenAI. Passez de Pro a Flash ou Lite en changeant le parametre model — aucun compte ni cle supplementaire necessaire.

Passez de model="gemini-3.1-pro" a model="gemini-2.5-flash" sans reconstruire votre integration.

Une cle API pour tous les modeles Gemini

Endpoint compatible OpenAI

Changez de modele en modifiant le parametre model

Facturation unifiee et visibilite de l'utilisation

Voir la documentation API Creer une cle API Voir les tarifs

Comment evaluer le cout de l'API Gemini : Pro vs Flash vs Lite

Routes Pro : le raisonnement justifie le premium

Gemini 3.1 Pro et 2.5 Pro coutent plus par token, mais les agents de code complexes, l'analyse documentaire approfondie et l'utilisation d'outils multi-etapes produisent des sorties de plus haute valeur. N'utilisez pas Pro par defaut pour l'extraction ou la classification simples.

Routes Flash : meilleur equilibre pour le volume de production

Gemini 3 Flash et 2.5 Flash offrent de solides capacites multimodales a une fraction du prix Pro. Commencez ici pour le chat, les resumes et l'extraction a l'echelle de production avant de considerer Pro.

Routes Lite : minimiser les couts pour les taches simples a haut volume

Gemini 3.1 Flash Lite et 2.5 Flash Lite offrent le cout par token le plus bas. Utilisez-les pour la classification, le routage, le texte par lots et les reponses courtes ou la profondeur de raisonnement n'est pas critique.

Voir tous les tarifs →

Pricing summary

Gemini routes range from $0.10/MTok input (Flash Lite) to $4.00/MTok input (Pro >200K). All use per-token pricing via EvoLink.

Gemini 3.1 Pro

$2/$12 — $4/$18 /MTok

Context: 1M

Flagship reasoning with 1M context. Tiered pricing: $2/$12 under 200K, $4/$18 over 200K input tokens.

Gemini 3.5 Flash

$1.50/$9.00 /MTok

Context: 1M

Flash GA stable pour les workflows agentiques et le code a $1.50/$9.00 per MTok avec 1M de contexte et raisonnement integre.

Gemini 3 Flash

$0.50/$3.00 /MTok

Context: 1M

Gemini 3 generation Flash route at $0.50/$3.00 per MTok with 1M context.

Gemini 3.1 Flash Lite

$0.25/$1.50 /MTok

Context: 1M

Cheapest Gemini 3 route at $0.25/$1.50 per MTok for batch text workloads.

Gemini 2.5 Pro

$1.25/$10 — $2.50/$15 /MTok

Context: 1M

Stable deep reasoning at $1.25/$10 under 200K, $2.50/$15 over 200K.

Gemini 2.5 Flash

$0.30/$2.50 /MTok

Context: 1M

Production workhorse at $0.30/$2.50 per MTok with full multimodal support.

Gemini 2.5 Flash Lite

$0.10/$0.40 /MTok

Context: 1M

Lowest-cost Gemini route at $0.10/$0.40 per MTok for text and audio.

Guides et comparatifs Gemini

Consultez ces guides lorsque vous avez besoin de plus de contexte avant de choisir une route.

Gemini 3.1 Pro vs GPT-5.2 vs Claude Opus

Comparez les modeles flagship pour le reasoning, le code et les workloads d'agents en production.

GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 Pro

Decouvrez comment les derniers modeles premium se comparent pour la selection pratique d'API.

Guide de migration apres deprecation de Gemini 3 Pro

Migrez l'ancien trafic Gemini 3 Pro Preview vers les routes Gemini actuelles sans perturber le comportement en production.

Integration OpenCode avec les routes Gemini

Decouvrez comment acceder a Gemini aux cotes de Claude et GPT via la couche API unifiee d'EvoLink.

FAQ Gemini API

Everything you need to know about the product and billing.

Commencez par Gemini 3.1 Pro pour une qualite de reasoning maximale, Gemini 3.5 Flash pour les workflows agentiques et agents de code, Gemini 2.5 Pro pour un deep reasoning stable, Gemini 2.5 Flash pour les workloads de production rapides, et Flash Lite lorsque le cout est la contrainte principale.

Oui. Plusieurs routes Gemini prennent en charge de tres grandes fenetres de contexte, ce qui les rend utiles pour l'analyse de PDFs, la revision documentaire, les workflows de retrieval et le reasoning multi-fichiers.

Choisissez Pro lorsque la qualite des reponses, le code et le reasoning en plusieurs etapes sont prioritaires. Choisissez Flash lorsque la vitesse, le debit de production et la previsibilite des couts comptent davantage.