Gemini API Family
Vergleichen Sie EvoLinks Gemini Routen fuer Flagship-Reasoning, latenzarme Flash-Optionen, Long-Context-Workloads und multimodales Verstehen.
6 Routen
Pro-, Flash- und Lite-Stufen fuer jedes Budget
Einheitlicher API-Zugang
OpenAI-kompatibel, ein Schluessel fuer alle Gemini
Nach Workflow waehlen
Pro vs. Flash vs. Lite zur Aufgabe zuordnen
Gemini API Routen vergleichen
Starten Sie beim Workload: Flagship-Reasoning, Flash-Produktionstraffic, kostenguenstige Extraktion oder multimodale Long-Context-Analyse.
| Route | Ideal fuer | Preise | Kontextfenster | Modalitaet | Status |
|---|---|---|---|---|---|
Gemini 3.1 Pro Preview Flagship-Reasoning | Hohe Gemini Reasoning-Qualitaet, Coding, Agents und Long-Context-Analyse. | $2/$12 <=200K; $4/$18 >200K | 1M input / 64K output | Text, Code, Bild, Video, Audio, PDF Eingaben | Preview flagship |
Gemini 3 Flash Preview Schnelles Gemini 3 | Latenzarme multimodale Apps mit staerkerem Gemini 3 Verhalten. | $0.50/$3.00 per MTok (audio in: $1.00) | 1M input / 64K output | Text, Bild, Video, Audio, PDF Eingaben | Preview route |
Gemini 3.1 Flash Lite Preview Guendigstes Gemini 3 | Hochvolumige Uebersetzung, Klassifizierung, Extraktion und Text-Batch-Verarbeitung. | $0.25/$1.50 per MTok (audio in: $0.50) | 1M input / 64K output | Text, Bild, Video, Audio, PDF Eingaben | Preview route |
Gemini 2.5 Pro Stabiles Pro | Produktions-Reasoning, Coding-Hilfe, Analyse und komplexe multimodale Aufgaben. | $1.25/$10 <=200K; $2.50/$15 >200K | 1M input / 64K output | Text, Bild, Video, Audio, PDF Eingaben | Stable deep reasoning |
Gemini 2.5 Flash Produktions-Flash | Schneller Chat, Extraktion, Zusammenfassungen und multimodaler Produktionstraffic. | $0.30/$2.50 per MTok (audio in: $1.00) | 1M input / 64K output | Text, Bild, Video, Audio, PDF Eingaben | Production workhorse |
Gemini 2.5 Flash Lite Niedrigste Kosten | Hochvolumige Klassifizierung, Extraktion, Routing und leichte Chat-Flows. | $0.10/$0.40 per MTok (audio in: $0.30) | 1M input / 64K output | Text und Audio Eingaben | Lowest-cost text route |
Wie Sie das richtige Gemini-Modell auswaehlen
Folgen Sie diesen 4 Regeln, um Ihre Auswahl ueber Pro-, Flash- und Lite-Stufen einzugrenzen.
Beginnen Sie mit der Reasoning-Tiefe
Komplexe Coding-Agenten, Multi-Step-Tool-Nutzung, tiefe Dokumentanalyse und hochpraezise Ausgabe — starten Sie mit Gemini 3.1 Pro oder Gemini 2.5 Pro.
Dann pruefen Sie Latenz- und Durchsatz-Bedarf
Produktions-Chat, Support-Bots, Echtzeit-Extraktion und hochfrequente multimodale Apps — vergleichen Sie Gemini 3 Flash oder Gemini 2.5 Flash.
Dann pruefen Sie die Kostensensibilitaet
Hochvolumige Klassifizierung, Batch-Textverarbeitung, Routing und leichte Extraktion — vergleichen Sie Gemini 3.1 Flash Lite oder Gemini 2.5 Flash Lite.
Schliesslich: gemischte Workflows bedenken
Wenn dieselbe Pipeline einfache Klassifizierung mit tiefem Reasoning mischt, ziehen Sie EvoLink Smart Router in Betracht, anstatt ein Gemini-Modell fest zu codieren.
Smart Router →Wenn Sie Ihren Aufgabentyp bereits kennen, finden Sie den empfohlenen Startpunkt in der Tabelle unten.
Gemini-Modell nach Workflow waehlen: Reasoning, Geschwindigkeit, Kosten und multimodale Aufgaben
Ordnen Sie Ihre Hauptaufgabe der richtigen Gemini-Route zu.
| Ihre Aufgabe | Empfohlener Start | Passt gut, wenn … | Beachten Sie |
|---|---|---|---|
| Komplexes Reasoning und Coding-Agenten | Gemini 3.1 Pro | Sie die hoechste Gemini-Reasoning-Qualitaet, Multi-Step-Tool-Nutzung oder tiefe Code-Analyse benoetigen | Hoehere Kosten — nutzen Sie Flash fuer einfachere Aufgaben |
| Stabiles Deep Reasoning mit Multimodal | Gemini 2.5 Pro | Sie produktionstaugliches Reasoning mit breiter multimodaler Unterstuetzung und bewiesener Stabilitaet brauchen | Etwas niedrigere Leistungsobergrenze als 3.1 Pro |
| Latenzarme multimodale Apps | Gemini 3 Flash | Sie schnelle Antworten mit Gemini-3-Generierungsfaehigkeiten ueber Text, Bild, Audio und Video brauchen | Preview-Route — Stabilitaetsanforderungen pruefen |
| Produktions-Chat und Extraktion | Gemini 2.5 Flash | Sie ein bewaehrtes Produktions-Arbeitspferd fuer Chat, Zusammenfassungen und skalierte Extraktion brauchen | Guter Default fuer die meisten Produktions-Workloads |
| Hochvolumiger Batch-Text zu niedrigsten Kosten | Gemini 2.5 Flash Lite | Aufgaben Klassifizierung, Routing oder kurze Antworten sind, bei denen Kosten am wichtigsten sind | Beschraenkt auf Text- und Audio-Input |
| Text-Workflows mit gemischter Komplexitaet | EvoLink Smart Router | Dieselbe Pipeline einfache und komplexe Aufgaben ueber Gemini und andere Anbieter enthaelt | Am besten, wenn Sie keine manuelle Modell-Routing-Logik pflegen moechten |
Gemini-API-Workflows: Agenten, Chat, Dokumente und multimodale Verarbeitung
Sehen Sie, wie Gemini-Modelle in echte Produkte, Agenten und Content-Verarbeitungspipelines passen.
Reasoning- und Coding-Agenten
Fuer Code-Generierung, Bug-Fixing, Multi-Step-Tool-Nutzung und komplexe Analyse-Agenten. Wenn die Output-Qualitaet direkt das Produktverhalten beeinflusst, starten Sie mit Gemini 3.1 Pro. Fuer bewiesene Stabilitaet vergleichen Sie Gemini 2.5 Pro.
Produktions-Chat und Support
Fuer Support-Bots, In-App-Assistenten, Wissensdatenbank-Q&A und hochfrequente Multi-Turn-Gespraeche. Testen Sie zuerst mit Gemini 2.5 Flash fuer bewaehrten Durchsatz, dann vergleichen Sie Flash Lite fuer niedrigere Kosten.
Lange Dokument- und multimodale Analyse
Fuer PDF-Analyse, Video-Verstaendnis, Audio-Transkription und Multi-Datei-Research-Workflows. Geminis 1M-Kontextfenster und native multimodale Unterstuetzung machen Pro- und Flash-Routen zu starken Optionen.
Agenten-Routing und gemischte Aufgaben
Fuer Workflows, in denen Klassifizierung, Extraktion, Reasoning und Generierung in derselben Pipeline koexistieren. Nutzen Sie EvoLink Smart Router, um automatisch zwischen Gemini und anderen Anbietern via evolink/auto zu routen.
Gemini-Modelldetails ansehen
Jede Route verlinkt auf eine eigene Modellseite mit Preisen, Spezifikationen und Integrationsdetails.
Gemini 3.1 Pro Preview
Flagship-Reasoning
- Kontextfenster
- 1M input / 64K output
- Preise
- $2/$12 <=200K; $4/$18 >200K
Gemini 3 Flash Preview
Schnelles Gemini 3
- Kontextfenster
- 1M input / 64K output
- Preise
- $0.50/$3.00 per MTok (audio in: $1.00)
Gemini 3.1 Flash Lite Preview
Guendigstes Gemini 3
- Kontextfenster
- 1M input / 64K output
- Preise
- $0.25/$1.50 per MTok (audio in: $0.50)
Gemini 2.5 Pro
Stabiles Pro
- Kontextfenster
- 1M input / 64K output
- Preise
- $1.25/$10 <=200K; $2.50/$15 >200K
Gemini 2.5 Flash
Produktions-Flash
- Kontextfenster
- 1M input / 64K output
- Preise
- $0.30/$2.50 per MTok (audio in: $1.00)
Gemini 2.5 Flash Lite
Niedrigste Kosten
- Kontextfenster
- 1M input / 64K output
- Preise
- $0.10/$0.40 per MTok (audio in: $0.30)
Zugriff auf alle Gemini-Modelle ueber eine einzige EvoLink-API
Alle 6 Gemini-Routen sind ueber einen einzigen EvoLink-API-Schluessel und einen OpenAI-kompatiblen Endpunkt verfuegbar. Wechseln Sie zwischen Pro, Flash und Lite durch Aendern des model-Parameters — keine separaten Konten oder Schluessel noetig.
Wechseln Sie model="gemini-3.1-pro" zu model="gemini-2.5-flash" ohne Ihre Integration neu zu bauen.Gemini-API-Kosten richtig einschaetzen: Pro vs. Flash vs. Lite
Pro-Routen: Reasoning rechtfertigt den Aufpreis
Gemini 3.1 Pro und 2.5 Pro kosten mehr pro Token, aber komplexe Coding-Agenten, tiefe Dokumentanalyse und Multi-Step-Tool-Nutzung erzeugen hoeherwertige Ausgaben. Nutzen Sie Pro nicht standardmaessig fuer einfache Extraktion oder Klassifizierung.
Flash-Routen: beste Balance fuer Produktionsvolumen
Gemini 3 Flash und 2.5 Flash liefern starke multimodale Faehigkeiten zu einem Bruchteil der Pro-Preise. Starten Sie hier fuer Chat, Zusammenfassungen und skalierte Extraktion, bevor Sie Pro in Betracht ziehen.
Lite-Routen: Kosten minimieren fuer einfache Massenaufgaben
Gemini 3.1 Flash Lite und 2.5 Flash Lite bieten die niedrigsten Pro-Token-Kosten. Nutzen Sie sie fuer Klassifizierung, Routing, Batch-Text und kurze Antworten, bei denen Reasoning-Tiefe nicht entscheidend ist.
Pricing summary
Gemini routes range from $0.10/MTok input (Flash Lite) to $4.00/MTok input (Pro >200K). All use per-token pricing via EvoLink.
Gemini 3.1 Pro
$2/$12 — $4/$18 /MTok
Context: 1M
Flagship reasoning with 1M context. Tiered pricing: $2/$12 under 200K, $4/$18 over 200K input tokens.
Gemini 3 Flash
$0.50/$3.00 /MTok
Context: 1M
Gemini 3 generation Flash route at $0.50/$3.00 per MTok with 1M context.
Gemini 3.1 Flash Lite
$0.25/$1.50 /MTok
Context: 1M
Cheapest Gemini 3 route at $0.25/$1.50 per MTok for batch text workloads.
Gemini 2.5 Pro
$1.25/$10 — $2.50/$15 /MTok
Context: 1M
Stable deep reasoning at $1.25/$10 under 200K, $2.50/$15 over 200K.
Gemini 2.5 Flash
$0.30/$2.50 /MTok
Context: 1M
Production workhorse at $0.30/$2.50 per MTok with full multimodal support.
Gemini 2.5 Flash Lite
$0.10/$0.40 /MTok
Context: 1M
Lowest-cost Gemini route at $0.10/$0.40 per MTok for text and audio.
Gemini Leitfaeden und Vergleiche
Nutzen Sie diese Leitfaeden, wenn Sie vor der Routenwahl mehr Kontext benoetigen.
Gemini 3.1 Pro vs GPT-5.2 vs Claude Opus
Vergleichen Sie Flagship-Modelle fuer Reasoning, Coding und produktive Agent-Workloads.
GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 Pro
Sehen Sie, wie die neuesten Premium-Modelle im praktischen API-Vergleich abschneiden.
Gemini 3 Pro Deprecation-Migrationsleitfaden
Migrieren Sie alten Gemini 3 Pro Preview Traffic auf aktuelle Gemini Routen, ohne das Produktionsverhalten zu beeintraechtigen.
OpenCode-Integration mit Gemini Routen
Erfahren Sie, wie Sie ueber EvoLinks einheitliche API-Schicht auf Gemini neben Claude und GPT Modellen zugreifen koennen.
Gemini API FAQ
Everything you need to know about the product and billing.