Gemini API Family
Comparez les routes Gemini d'EvoLink pour le raisonnement haut de gamme, Flash a faible latence, les longs contextes et la comprehension multimodale.
6 routes
Niveaux Pro, Flash et Lite pour chaque budget
Acces API unifie
Compatible OpenAI, une cle pour tout Gemini
Choisir par workflow
Associer Pro vs Flash vs Lite a votre tache
Comparer les routes Gemini API
Choisissez selon le workload : raisonnement flagship, trafic Flash de production, extraction a bas cout ou analyse multimodale long contexte.
| Route | Ideal pour | Tarifs | Fenetre de contexte | Modalite | Statut |
|---|---|---|---|---|---|
Gemini 3.1 Pro Preview Raisonnement flagship | Meilleure qualite Gemini pour raisonnement, code, agents et analyse long contexte. | $2/$12 <=200K; $4/$18 >200K | 1M input / 64K output | Texte, code, image, video, audio, PDF en entree | Preview flagship |
Gemini 3 Flash Preview Gemini 3 rapide | Apps multimodales a faible latence qui ont besoin du comportement Gemini 3. | $0.50/$3.00 per MTok (audio in: $1.00) | 1M input / 64K output | Texte, image, video, audio, PDF en entree | Preview route |
Gemini 3.1 Flash Lite Preview Gemini 3 le moins cher | Traduction, classification, extraction et traitement texte en volume. | $0.25/$1.50 per MTok (audio in: $0.50) | 1M input / 64K output | Texte, image, video, audio, PDF en entree | Preview route |
Gemini 2.5 Pro Pro stable | Raisonnement de production, aide au code, analyse et taches multimodales complexes. | $1.25/$10 <=200K; $2.50/$15 >200K | 1M input / 64K output | Texte, image, video, audio, PDF en entree | Stable deep reasoning |
Gemini 2.5 Flash Flash production | Chat rapide, extraction, resumes et trafic multimodal de production. | $0.30/$2.50 per MTok (audio in: $1.00) | 1M input / 64K output | Texte, image, video, audio, PDF en entree | Production workhorse |
Gemini 2.5 Flash Lite Cout le plus bas | Classification, extraction, routage et chat leger a haut volume. | $0.10/$0.40 per MTok (audio in: $0.30) | 1M input / 64K output | Texte et audio en entree | Lowest-cost text route |
Comment choisir le bon modele Gemini
Suivez ces 4 regles pour affiner votre choix entre les niveaux Pro, Flash et Lite.
Commencez par la profondeur de raisonnement
Agents de code complexes, utilisation d'outils multi-etapes, analyse documentaire approfondie et sortie haute precision — commencez avec Gemini 3.1 Pro ou Gemini 2.5 Pro.
Puis verifiez les besoins en latence et debit
Chat de production, bots de support, extraction en temps reel et apps multimodales a haute frequence — comparez Gemini 3 Flash ou Gemini 2.5 Flash.
Puis verifiez la sensibilite au cout
Classification a haut volume, traitement de texte par lots, routage et extraction legere — comparez Gemini 3.1 Flash Lite ou Gemini 2.5 Flash Lite.
Enfin, considerez les workflows de complexite mixte
Si la meme pipeline melange classification simple et etapes de raisonnement profond, envisagez EvoLink Smart Router au lieu de coder en dur un seul modele Gemini.
Smart Router →Si vous connaissez deja votre type de tache, trouvez le point de depart recommande dans le tableau ci-dessous.
Choisir un modele Gemini par workflow : raisonnement, vitesse, cout et taches multimodales
Associez votre tache principale a la bonne route Gemini.
| Votre tache | Depart recommande | Bon choix si… | A surveiller |
|---|---|---|---|
| Raisonnement complexe et agents de code | Gemini 3.1 Pro | Vous avez besoin de la meilleure qualite de raisonnement Gemini, d'utilisation d'outils multi-etapes ou d'analyse de code approfondie | Cout plus eleve — utilisez Flash pour les taches plus simples |
| Deep reasoning stable avec multimodal | Gemini 2.5 Pro | Vous avez besoin d'un raisonnement de niveau production avec un large support multimodal et une stabilite prouvee | Plafond de capacite legerement inferieur a 3.1 Pro |
| Apps multimodales a faible latence | Gemini 3 Flash | Vous avez besoin de reponses rapides avec les capacites Gemini 3 en texte, image, audio et video | Route preview — verifiez les exigences de stabilite |
| Chat et extraction de production | Gemini 2.5 Flash | Vous avez besoin d'un modele de production eprouve pour le chat, les resumes et l'extraction a l'echelle | Bon defaut pour la plupart des workloads de production |
| Texte par lots a haut volume au cout le plus bas | Gemini 2.5 Flash Lite | Les taches sont de la classification, du routage ou des reponses courtes ou le cout prime | Limite aux entrees texte et audio uniquement |
| Workflows textuels de complexite mixte | EvoLink Smart Router | La meme pipeline a des taches simples et complexes entre Gemini et d'autres fournisseurs | Ideal quand vous ne voulez pas de logique de routage manuelle |
Workflows API Gemini : agents, chat, documents et traitement multimodal
Decouvrez comment les modeles Gemini s'integrent dans des produits reels, des agents et des pipelines de traitement de contenu.
Agents de raisonnement et de code
Pour la generation de code, la correction de bugs, l'utilisation d'outils multi-etapes et les agents d'analyse complexes. Si la qualite de sortie affecte directement le comportement du produit, commencez avec Gemini 3.1 Pro. Pour une stabilite prouvee, comparez Gemini 2.5 Pro.
Chat et support de production
Pour les bots de support, les assistants in-app, le Q&A sur base de connaissances et les conversations multi-tours a haute frequence. Testez d'abord avec Gemini 2.5 Flash pour un debit eprouve, puis comparez Flash Lite pour un cout moindre.
Analyse documentaire et multimodale longue
Pour l'analyse de PDFs, la comprehension video, la transcription audio et les workflows de recherche multi-fichiers. La fenetre de contexte 1M de Gemini et son support multimodal natif font des routes Pro et Flash des choix solides.
Routage d'agents et taches mixtes
Pour les workflows ou classification, extraction, raisonnement et generation coexistent dans la meme pipeline. Utilisez EvoLink Smart Router pour router automatiquement entre Gemini et d'autres fournisseurs via evolink/auto.
Voir les details de chaque modele Gemini
Chaque route renvoie vers une page modele dediee avec tarifs, specifications et details d'integration.
Gemini 3.1 Pro Preview
Raisonnement flagship
- Fenetre de contexte
- 1M input / 64K output
- Tarifs
- $2/$12 <=200K; $4/$18 >200K
Gemini 3 Flash Preview
Gemini 3 rapide
- Fenetre de contexte
- 1M input / 64K output
- Tarifs
- $0.50/$3.00 per MTok (audio in: $1.00)
Gemini 3.1 Flash Lite Preview
Gemini 3 le moins cher
- Fenetre de contexte
- 1M input / 64K output
- Tarifs
- $0.25/$1.50 per MTok (audio in: $0.50)
Gemini 2.5 Pro
Pro stable
- Fenetre de contexte
- 1M input / 64K output
- Tarifs
- $1.25/$10 <=200K; $2.50/$15 >200K
Gemini 2.5 Flash
Flash production
- Fenetre de contexte
- 1M input / 64K output
- Tarifs
- $0.30/$2.50 per MTok (audio in: $1.00)
Gemini 2.5 Flash Lite
Cout le plus bas
- Fenetre de contexte
- 1M input / 64K output
- Tarifs
- $0.10/$0.40 per MTok (audio in: $0.30)
Accedez a tous les modeles Gemini via une seule API EvoLink
Les 6 routes Gemini sont disponibles via une seule cle API EvoLink et un endpoint compatible OpenAI. Passez de Pro a Flash ou Lite en changeant le parametre model — aucun compte ni cle supplementaire necessaire.
Passez de model="gemini-3.1-pro" a model="gemini-2.5-flash" sans reconstruire votre integration.Comment evaluer le cout de l'API Gemini : Pro vs Flash vs Lite
Routes Pro : le raisonnement justifie le premium
Gemini 3.1 Pro et 2.5 Pro coutent plus par token, mais les agents de code complexes, l'analyse documentaire approfondie et l'utilisation d'outils multi-etapes produisent des sorties de plus haute valeur. N'utilisez pas Pro par defaut pour l'extraction ou la classification simples.
Routes Flash : meilleur equilibre pour le volume de production
Gemini 3 Flash et 2.5 Flash offrent de solides capacites multimodales a une fraction du prix Pro. Commencez ici pour le chat, les resumes et l'extraction a l'echelle de production avant de considerer Pro.
Routes Lite : minimiser les couts pour les taches simples a haut volume
Gemini 3.1 Flash Lite et 2.5 Flash Lite offrent le cout par token le plus bas. Utilisez-les pour la classification, le routage, le texte par lots et les reponses courtes ou la profondeur de raisonnement n'est pas critique.
Pricing summary
Gemini routes range from $0.10/MTok input (Flash Lite) to $4.00/MTok input (Pro >200K). All use per-token pricing via EvoLink.
Gemini 3.1 Pro
$2/$12 — $4/$18 /MTok
Context: 1M
Flagship reasoning with 1M context. Tiered pricing: $2/$12 under 200K, $4/$18 over 200K input tokens.
Gemini 3 Flash
$0.50/$3.00 /MTok
Context: 1M
Gemini 3 generation Flash route at $0.50/$3.00 per MTok with 1M context.
Gemini 3.1 Flash Lite
$0.25/$1.50 /MTok
Context: 1M
Cheapest Gemini 3 route at $0.25/$1.50 per MTok for batch text workloads.
Gemini 2.5 Pro
$1.25/$10 — $2.50/$15 /MTok
Context: 1M
Stable deep reasoning at $1.25/$10 under 200K, $2.50/$15 over 200K.
Gemini 2.5 Flash
$0.30/$2.50 /MTok
Context: 1M
Production workhorse at $0.30/$2.50 per MTok with full multimodal support.
Gemini 2.5 Flash Lite
$0.10/$0.40 /MTok
Context: 1M
Lowest-cost Gemini route at $0.10/$0.40 per MTok for text and audio.
Guides et comparatifs Gemini
Consultez ces guides lorsque vous avez besoin de plus de contexte avant de choisir une route.
Gemini 3.1 Pro vs GPT-5.2 vs Claude Opus
Comparez les modeles flagship pour le reasoning, le code et les workloads d'agents en production.
GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 Pro
Decouvrez comment les derniers modeles premium se comparent pour la selection pratique d'API.
Guide de migration apres deprecation de Gemini 3 Pro
Migrez l'ancien trafic Gemini 3 Pro Preview vers les routes Gemini actuelles sans perturber le comportement en production.
Integration OpenCode avec les routes Gemini
Decouvrez comment acceder a Gemini aux cotes de Claude et GPT via la couche API unifiee d'EvoLink.
FAQ Gemini API
Everything you need to know about the product and billing.