Gemini 3.1 Pro Preview API
$1.865 - 3.729(~ 126.8 - 253.6 credits) per 1M input tokens; $11.182 - 16.774(~ 760.4 - 1140.6 credits) per 1M output tokens
$0.187 - 0.374(~ 12.7 - 25.4 credits) per 1M cache read tokens
Google Search grounding charged separately per query.
Höchste Stabilität mit garantierter 99,9% Verfügbarkeit. Empfohlen für Produktionsumgebungen.
Für alle Versionen wird derselbe API-Endpunkt verwendet. Nur der model-Parameter unterscheidet sich.
Gemini 3.1 Pro ? Gemini Reasoning API Route
Gemini 3.1 Pro ist EvoLinks leistungsstarke Gemini Route f?r Coding und Reasoning. Zugriff ab $2 Input / $12 Output pro 1M Tokens mit OpenAI-SDK-Kompatibilit?t, Thinking-Modus und Tool Support.

Was Gemini 3.1 Pro zu Googles Spitzenmodell macht
Frontier-Coding & Reasoning
Gemini 3.1 Pro ist Googles stärkstes Modell für Coding-Aufgaben. Es ist wettbewerbsfähig in öffentlichen Benchmarks wie SWE-bench und HumanEval — vergleichbar mit Claude Opus 4.6 und GPT 5.4.

Agentische Workflows & CustomTools
Gebaut für mehrstufige Agent-Loops mit Thinking-Modus, Function Calling, Structured Outputs und einer dedizierten CustomTools-Variante (gemini-3.1-pro-customtools) für tool-intensive Pipelines.

1M Kontext + Produktions-Controls
Verarbeiten Sie ganze Codebasen, lange Dokumente und Multi-Turn-Konversationen in einer Anfrage. Nutzen Sie Caching, Batch API und Google Search Grounding für Deployments im Produktionsmaßstab.

Warum Gemini 3.1 Pro auf EvoLink
Gemini 3.1 Pro bietet starkes Reasoning zu einem niedrigeren Preis als vergleichbare Modelle — und EvoLink ergänzt OpenAI-SDK-Kompatibilität, Usage-Tracking und einheitliche Abrechnung.
Bestes Preis-Leistungs-Verhältnis
Mit $2/$12 pro 1M Tokens liegt Gemini 3.1 Pro deutlich unter Claude Opus 4.6 ($15/$75). Vergleichen Sie unsere Benchmark-Analysen für detaillierte Leistungsdaten bei spezifischen Tasks.
Drop-In-OpenAI-Ersatz
Nutzen Sie dasselbe /v1/chat/completions-Format und das OpenAI SDK. Wechseln Sie von GPT-Modellen durch Änderung einer Zeile — Model-String und API-Base-URL.
Volle Usage-Transparenz
Jede Antwort enthält prompt_tokens, completion_tokens, reasoning_tokens und Cache-Nutzung. Verfolgen Sie Kosten pro Request und Reasoning-Tiefe auf Token-Ebene.
So rufen Sie Gemini 3.1 Pro Preview auf
Nutzen Sie das OpenAI-SDK-Format und den Model-String gemini-3.1-pro-preview.
Schritt 1 - Modell setzen
Verwenden Sie model: "gemini-3.1-pro-preview" im Request-Body.
Schritt 2 - Messages senden
Übergeben Sie ein messages-Array mit role/content-Pairs (min. Länge 1).
Schritt 3 - Output + Usage prüfen
Lesen Sie choices[0].message.content und tracken Sie usage.prompt_tokens, completion_tokens und reasoning_tokens.
Gemini 3.1 Pro Preview Specs
Technische Details zu Googles Flagship-Reasoning-Modell
Model ID
gemini-3.1-pro-preview (allgemein) oder gemini-3.1-pro-customtools (tool-intensive Workloads).
Input-Preise
$2.00 pro 1M Tokens (Standard), $4.00 pro 1M bei Prompts über 200K Tokens.
Output-Preise
$12.00 pro 1M Tokens (Standard), $18.00 pro 1M bei High-Volume-Prompts über 200K Tokens.
Kontextfenster
1.000.000 Input-Tokens (1M Kontext). Max Output: 65.536 Tokens.
Unterstützte Inputs
Text, Code, Bilder, Video, Audio, PDF. Output ist nur Text. Google Search Grounding + URL-Kontext verfügbar.
Upgrade gegenüber 3.0 Pro
Verbesserte Coding-Benchmarks, stärkeres Instruction Following und besserer agentischer Tool Use im Vergleich zum ursprünglichen Gemini 3 Pro Preview.
Gemini 3.1 Pro API FAQ
Everything you need to know about the product and billing.
Wo sich Gemini 3.1 Pro in der Gemini-Familie einordnet
Gemini 3.1 Pro ist Googles aktuelles Flaggschiff-Reasoning-Modell. Verwenden Sie CustomTools für tool-intensive Agenten-Workflows, Flash für kostengünstigere Aufgaben oder vergleichen Sie mit GPT 5.4 und Claude Opus 4.6 für eine wettbewerbsfähige Einordnung. Erkunden Sie die Gemini-Familie oder lesen Sie Vergleichsanleitungen, um das richtige Modell auszuwählen.