Gemini Omni bientôt disponibleEn savoir plus

API Gemini 3.1 Pro Preview

La route Gemini 3.1 Pro Preview d?EvoLink vise les workflows exigeants de code, raisonnement agentique et analyse, avec contexte 1M, mode thinking et variante CustomTools.
Type de modèle:
Prix: 

$1.865 - 3.729(~ 126.8 - 253.6 credits) per 1M input tokens; $11.182 - 16.774(~ 760.4 - 1140.6 credits) per 1M output tokens

$0.187 - 0.374(~ 12.7 - 25.4 credits) per 1M cache read tokens

Google Search grounding charged separately per query.

Stabilité maximale avec une disponibilité garantie de 99,9 %. Recommandé pour la production.

Le même endpoint API est utilisé pour toutes les versions. Seul le paramètre model change.

Gemini 3.1 Pro ? Route API Gemini de raisonnement

Gemini 3.1 Pro est la route Gemini EvoLink pour le code et le raisonnement. Acc?s ? $2 input / $12 output par 1M tokens avec compatibilit? OpenAI SDK, mode thinking et support d?outils.

exemple 1

Ce qui fait de Gemini 3.1 Pro le modèle phare de Google

Codage et raisonnement de pointe

Gemini 3.1 Pro est le modèle le plus performant de Google pour les tâches de codage. Il est compétitif sur les benchmarks publics tels que SWE-bench et HumanEval face à Claude Opus 4.6 et GPT 5.4.

exemple 2

Workflows agentiques et CustomTools

Conçu pour les boucles d'agents multi-étapes avec mode thinking, function calling, structured outputs et une variante dédiée CustomTools (gemini-3.1-pro-customtools) pour les pipelines intensifs en outils.

exemple 3

Contexte 1M + Contrôles production

Traitez des bases de code entières, de longs documents et des conversations multi-tours dans une seule requête. Utilisez le caching, la Batch API et le Google Search grounding pour les déploiements à l'échelle production.

exemple 4

Pourquoi choisir Gemini 3.1 Pro sur EvoLink

Gemini 3.1 Pro offre un raisonnement performant à un tarif inférieur aux modèles comparables — et EvoLink ajoute la compatibilité OpenAI SDK, le suivi d'usage et la facturation unifiée.

Meilleur rapport qualité-prix

À $2/$12 par 1M tokens, Gemini 3.1 Pro est bien en dessous de Claude Opus 4.6 ($15/$75). Consultez nos comparatifs de benchmarks pour des données de performance détaillées sur des tâches spécifiques.

Remplacement direct d'OpenAI

Utilisez le même format /v1/chat/completions et le SDK OpenAI. Passez d'un modèle GPT en changeant une seule ligne — le string du modèle et l'URL de base API.

Transparence totale de l'usage

Chaque réponse inclut prompt_tokens, completion_tokens, reasoning_tokens et l'utilisation du cache. Suivez le coût par requête et la profondeur de raisonnement au niveau des tokens.

Comment appeler Gemini 3.1 Pro Preview

Utilisez le format OpenAI SDK et le string de modèle gemini-3.1-pro-preview.

1

Étape 1 - Définir le modèle

Utilisez model: "gemini-3.1-pro-preview" dans le corps de la requête.

2

Étape 2 - Envoyer les messages

Fournissez un tableau messages avec des paires role/content (longueur min 1).

3

Étape 3 - Inspecter output + usage

Lisez choices[0].message.content et suivez usage.prompt_tokens, completion_tokens et reasoning_tokens.

Specs Gemini 3.1 Pro Preview

Détails techniques du modèle phare de raisonnement de Google

Modèle

Model ID

gemini-3.1-pro-preview (général) ou gemini-3.1-pro-customtools (workloads intensifs en outils).

Tarifs

Tarif d'entrée

$2.00 par 1M tokens (standard), $4.00 par 1M pour les prompts de plus de 200K tokens.

Tarifs

Tarif de sortie

$12.00 par 1M tokens (standard), $18.00 par 1M pour les prompts à haut volume de plus de 200K tokens.

Limites

Fenêtre de contexte

1 000 000 tokens d'entrée (contexte 1M). Sortie max : 65 536 tokens.

Multimodal

Entrées supportées

Texte, code, images, vidéo, audio, PDF. Sortie texte uniquement. Google Search grounding + contexte URL disponibles.

Cycle de vie

Mise à niveau depuis 3.0 Pro

Benchmarks de codage améliorés, meilleur suivi des instructions et tool use agentique renforcé par rapport au Gemini 3 Pro Preview d'origine.

FAQ API Gemini 3.1 Pro

Everything you need to know about the product and billing.

Gemini 3.1 Pro est compétitif sur les benchmarks de codage et de raisonnement. Son principal avantage est le tarif : à $2/$12 par 1M tokens, il est nettement inférieur à Claude Opus 4.6 ($15/$75) et GPT 5.4. Consultez nos comparatifs détaillés pour des données de performance par tâche.
Google a amélioré les scores de benchmarks de codage, la précision du suivi des instructions, la fiabilité de l'utilisation agentique d'outils et la cohérence des réponses. Une variante CustomTools dédiée a également été ajoutée pour les workflows intensifs en outils. Les deux partagent la même fenêtre de contexte 1M et les mêmes tarifs.
gemini-3.1-pro-customtools est une route exposée séparément sur EvoLink, optimisée pour les requêtes qui s'appuient sur le function calling, les tools arrays et les boucles d'agents multi-étapes. Mêmes tarifs que la route de base. Utilisez gemini-3.1-pro-preview pour le raisonnement général.
Standard : $2.00 input / $12.00 output par 1M tokens. Prompts de plus de 200K tokens : $4.00 input / $18.00 output. Lectures cache : $0.20 par 1M tokens. Google Search grounding : $35 par 1K requêtes grounded.
Utilisez "gemini-3.1-pro-preview" comme valeur model. Pour les workloads intensifs en outils, utilisez "gemini-3.1-pro-customtools". Les deux se connectent à api.evolink.ai/v1/chat/completions avec l'auth Bearer token.
Oui. Le mode thinking active le raisonnement en chaîne pour les tâches complexes. Les reasoning tokens sont comptabilisés séparément dans completion_tokens_details.reasoning_tokens, vous permettant de surveiller la profondeur de raisonnement et le coût.
1 000 000 tokens d'entrée (contexte 1M) avec un maximum de 65 536 tokens de sortie. Prend en charge le caching (implicite + explicite) et la Batch API pour les pipelines en contexte long.
Oui. L'endpoint EvoLink est entièrement compatible avec le SDK OpenAI. Utilisez /v1/chat/completions avec le format standard model + messages. Passez de n'importe quel modèle OpenAI en changeant le string du modèle et l'URL de base — aucune autre modification de code nécessaire.
Wait 5-10 minutes and retry. For production reliability, use the recommended preview route for your workload and keep a fallback model configured.

Où se situe Gemini 3.1 Pro dans la famille Gemini

Gemini 3.1 Pro est le modèle de raisonnement phare actuel de Google. Utilisez CustomTools pour les workflows d’agents intensifs en outils, Flash pour les tâches à moindre coût, ou comparez avec GPT 5.4 et Claude Opus 4.6 pour une mise en contexte concurrentielle. Explorez la famille Gemini ou consultez les guides comparatifs pour choisir le bon modèle.