Vergleiche Gemini-Modelle: Pro, Flash & Lite API-Preise

Name: EvoLink AI Model API Platform
Brand: EvoLink
Availability: InStock

Gemini API Family

Vergleichen Sie EvoLinks Gemini Routen fuer Flagship-Reasoning, latenzarme Flash-Optionen, Long-Context-Workloads und multimodales Verstehen.

API-Dokumentation Preise ansehen

📦

7 Routen

Pro-, Flash- und Lite-Stufen fuer jedes Budget

🔗

Einheitlicher API-Zugang

OpenAI-kompatibel, ein Schluessel fuer alle Gemini

🎯

Nach Workflow waehlen

Pro vs. Flash vs. Lite zur Aufgabe zuordnen

Modellvergleich Auswahl-Hilfe Anwendungsfaelle Einheitlicher Zugang FAQ

Gemini API Routen vergleichen

Starten Sie beim Workload: Flagship-Reasoning, Flash-Produktionstraffic, kostenguenstige Extraktion oder multimodale Long-Context-Analyse.

Route	Ideal fuer	Preise	Kontextfenster	Modalitaet	Status
Gemini 3.1 Pro Preview Flagship-Reasoning	Hohe Gemini Reasoning-Qualitaet, Coding, Agents und Long-Context-Analyse.	$2/$12 <=200K; $4/$18 >200K	1M input / 64K output	Text, Code, Bild, Video, Audio, PDF Eingaben	Preview flagship
Gemini 3.5 Flash Stabil — GA fuer Produktion	Agentische Workflows, Coding-Agenten, Sub-Agent-Deployment und langfristige Produktionsaufgaben zu Flash-Kosten.	$1.50/$9.00 per MTok	1M input / 65K output	Text, Bild, Video, Audio, PDF Eingaben	Stable (GA)
Gemini 3 Flash Preview Schnelles Gemini 3	Latenzarme multimodale Apps mit staerkerem Gemini 3 Verhalten.	$0.50/$3.00 per MTok (audio in: $1.00)	1M input / 64K output	Text, Bild, Video, Audio, PDF Eingaben	Preview route
Gemini 3.1 Flash Lite Preview Guendigstes Gemini 3	Hochvolumige Uebersetzung, Klassifizierung, Extraktion und Text-Batch-Verarbeitung.	$0.25/$1.50 per MTok (audio in: $0.50)	1M input / 64K output	Text, Bild, Video, Audio, PDF Eingaben	Preview route
Gemini 2.5 Pro Stabiles Pro	Produktions-Reasoning, Coding-Hilfe, Analyse und komplexe multimodale Aufgaben.	$1.25/$10 <=200K; $2.50/$15 >200K	1M input / 64K output	Text, Bild, Video, Audio, PDF Eingaben	Stable deep reasoning
Gemini 2.5 Flash Produktions-Flash	Schneller Chat, Extraktion, Zusammenfassungen und multimodaler Produktionstraffic.	$0.30/$2.50 per MTok (audio in: $1.00)	1M input / 64K output	Text, Bild, Video, Audio, PDF Eingaben	Production workhorse
Gemini 2.5 Flash Lite Niedrigste Kosten	Hochvolumige Klassifizierung, Extraktion, Routing und leichte Chat-Flows.	$0.10/$0.40 per MTok (audio in: $0.30)	1M input / 64K output	Text und Audio Eingaben	Lowest-cost text route

Wie Sie das richtige Gemini-Modell auswaehlen

Folgen Sie diesen 4 Regeln, um Ihre Auswahl ueber Pro-, Flash- und Lite-Stufen einzugrenzen.

Beginnen Sie mit der Reasoning-Tiefe

Komplexe Coding-Agenten, Multi-Step-Tool-Nutzung, tiefe Dokumentanalyse und hochpraezise Ausgabe — starten Sie mit Gemini 3.1 Pro oder Gemini 2.5 Pro.

Dann pruefen Sie Latenz- und Durchsatz-Bedarf

Produktions-Chat, Support-Bots, Echtzeit-Extraktion und hochfrequente multimodale Apps — vergleichen Sie Gemini 3 Flash oder Gemini 2.5 Flash.

Dann pruefen Sie die Kostensensibilitaet

Hochvolumige Klassifizierung, Batch-Textverarbeitung, Routing und leichte Extraktion — vergleichen Sie Gemini 3.1 Flash Lite oder Gemini 2.5 Flash Lite.

Schliesslich: gemischte Workflows bedenken

Wenn dieselbe Pipeline einfache Klassifizierung mit tiefem Reasoning mischt, ziehen Sie EvoLink Smart Router in Betracht, anstatt ein Gemini-Modell fest zu codieren.

Smart Router →

Wenn Sie Ihren Aufgabentyp bereits kennen, finden Sie den empfohlenen Startpunkt in der Tabelle unten.

Gemini-Modell nach Workflow waehlen: Reasoning, Geschwindigkeit, Kosten und multimodale Aufgaben

Ordnen Sie Ihre Hauptaufgabe der richtigen Gemini-Route zu.

Ihre Aufgabe	Empfohlener Start	Passt gut, wenn …	Beachten Sie
Komplexes Reasoning und Coding-Agenten	Gemini 3.1 Pro	Sie die hoechste Gemini-Reasoning-Qualitaet, Multi-Step-Tool-Nutzung oder tiefe Code-Analyse benoetigen	Hoehere Kosten — nutzen Sie Flash fuer einfachere Aufgaben
Stabiles Deep Reasoning mit Multimodal	Gemini 2.5 Pro	Sie produktionstaugliches Reasoning mit breiter multimodaler Unterstuetzung und bewiesener Stabilitaet brauchen	Etwas niedrigere Leistungsobergrenze als 3.1 Pro
Agentische Workflows und Coding-Agenten	Gemini 3.5 Flash	Sie Frontier-Intelligenz zu Flash-Kosten fuer Coding-Agenten, Sub-Agent-Schleifen und langfristige Aufgaben benoetigen	GA und stabil — der Standard-Flash fuer Agent-Workloads
Latenzarme multimodale Apps	Gemini 3 Flash	Sie schnelle Antworten mit Gemini-3-Generierungsfaehigkeiten ueber Text, Bild, Audio und Video brauchen	Preview-Route — Stabilitaetsanforderungen pruefen
Produktions-Chat und Extraktion	Gemini 2.5 Flash	Sie ein bewaehrtes Produktions-Arbeitspferd fuer Chat, Zusammenfassungen und skalierte Extraktion brauchen	Guter Default fuer die meisten Produktions-Workloads
Hochvolumiger Batch-Text zu niedrigsten Kosten	Gemini 2.5 Flash Lite	Aufgaben Klassifizierung, Routing oder kurze Antworten sind, bei denen Kosten am wichtigsten sind	Beschraenkt auf Text- und Audio-Input
Text-Workflows mit gemischter Komplexitaet	EvoLink Smart Router	Dieselbe Pipeline einfache und komplexe Aufgaben ueber Gemini und andere Anbieter enthaelt	Am besten, wenn Sie keine manuelle Modell-Routing-Logik pflegen moechten

Gemini-API-Workflows: Agenten, Chat, Dokumente und multimodale Verarbeitung

Sehen Sie, wie Gemini-Modelle in echte Produkte, Agenten und Content-Verarbeitungspipelines passen.

Reasoning- und Coding-Agenten

Fuer Code-Generierung, Bug-Fixing, Multi-Step-Tool-Nutzung und komplexe Analyse-Agenten. Wenn die Output-Qualitaet direkt das Produktverhalten beeinflusst, starten Sie mit Gemini 3.1 Pro. Fuer bewiesene Stabilitaet vergleichen Sie Gemini 2.5 Pro.

Gemini 3.1 Pro ansehen →

Produktions-Chat und Support

Fuer Support-Bots, In-App-Assistenten, Wissensdatenbank-Q&A und hochfrequente Multi-Turn-Gespraeche. Testen Sie zuerst mit Gemini 2.5 Flash fuer bewaehrten Durchsatz, dann vergleichen Sie Flash Lite fuer niedrigere Kosten.

Gemini 2.5 Flash ansehen →

Lange Dokument- und multimodale Analyse

Fuer PDF-Analyse, Video-Verstaendnis, Audio-Transkription und Multi-Datei-Research-Workflows. Geminis 1M-Kontextfenster und native multimodale Unterstuetzung machen Pro- und Flash-Routen zu starken Optionen.

Gemini 2.5 Pro ansehen →

Agenten-Routing und gemischte Aufgaben

Fuer Workflows, in denen Klassifizierung, Extraktion, Reasoning und Generierung in derselben Pipeline koexistieren. Nutzen Sie EvoLink Smart Router, um automatisch zwischen Gemini und anderen Anbietern via evolink/auto zu routen.

Smart Router ansehen →

Gemini-Modelldetails ansehen

Jede Route verlinkt auf eine eigene Modellseite mit Preisen, Spezifikationen und Integrationsdetails.

Gemini 3.1 Pro Preview

Flagship-Reasoning

Kontextfenster: 1M input / 64K output
Preise: $2/$12 <=200K; $4/$18 >200K

Ansehen Gemini 3.1 Pro Preview →

Gemini 3.5 Flash

Stabil — GA fuer Produktion

Kontextfenster: 1M input / 65K output
Preise: $1.50/$9.00 per MTok

Ansehen Gemini 3.5 Flash →

Gemini 3 Flash Preview

Schnelles Gemini 3

Kontextfenster: 1M input / 64K output
Preise: $0.50/$3.00 per MTok (audio in: $1.00)

Ansehen Gemini 3 Flash Preview →

Gemini 3.1 Flash Lite Preview

Guendigstes Gemini 3

Kontextfenster: 1M input / 64K output
Preise: $0.25/$1.50 per MTok (audio in: $0.50)

Ansehen Gemini 3.1 Flash Lite Preview →

Gemini 2.5 Pro

Stabiles Pro

Kontextfenster: 1M input / 64K output
Preise: $1.25/$10 <=200K; $2.50/$15 >200K

Ansehen Gemini 2.5 Pro →

Gemini 2.5 Flash

Produktions-Flash

Kontextfenster: 1M input / 64K output
Preise: $0.30/$2.50 per MTok (audio in: $1.00)

Ansehen Gemini 2.5 Flash →

Gemini 2.5 Flash Lite

Niedrigste Kosten

Kontextfenster: 1M input / 64K output
Preise: $0.10/$0.40 per MTok (audio in: $0.30)

Ansehen Gemini 2.5 Flash Lite →

Zugriff auf alle Gemini-Modelle ueber eine einzige EvoLink-API

Alle 7 Gemini-Routen sind ueber einen einzigen EvoLink-API-Schluessel und einen OpenAI-kompatiblen Endpunkt verfuegbar. Wechseln Sie zwischen Pro, Flash und Lite durch Aendern des model-Parameters — keine separaten Konten oder Schluessel noetig.

Wechseln Sie model="gemini-3.1-pro" zu model="gemini-2.5-flash" ohne Ihre Integration neu zu bauen.

Ein API-Schluessel fuer alle Gemini-Modelle

OpenAI-kompatibler Endpunkt

Modelle wechseln durch Aendern des model-Parameters

Einheitliche Abrechnung und Nutzungsuebersicht

API-Dokumentation API-Schluessel erstellen Preise ansehen

Gemini-API-Kosten richtig einschaetzen: Pro vs. Flash vs. Lite

Pro-Routen: Reasoning rechtfertigt den Aufpreis

Gemini 3.1 Pro und 2.5 Pro kosten mehr pro Token, aber komplexe Coding-Agenten, tiefe Dokumentanalyse und Multi-Step-Tool-Nutzung erzeugen hoeherwertige Ausgaben. Nutzen Sie Pro nicht standardmaessig fuer einfache Extraktion oder Klassifizierung.

Flash-Routen: beste Balance fuer Produktionsvolumen

Gemini 3 Flash und 2.5 Flash liefern starke multimodale Faehigkeiten zu einem Bruchteil der Pro-Preise. Starten Sie hier fuer Chat, Zusammenfassungen und skalierte Extraktion, bevor Sie Pro in Betracht ziehen.

Lite-Routen: Kosten minimieren fuer einfache Massenaufgaben

Gemini 3.1 Flash Lite und 2.5 Flash Lite bieten die niedrigsten Pro-Token-Kosten. Nutzen Sie sie fuer Klassifizierung, Routing, Batch-Text und kurze Antworten, bei denen Reasoning-Tiefe nicht entscheidend ist.

Alle Preise ansehen →

Pricing summary

Gemini routes range from $0.10/MTok input (Flash Lite) to $4.00/MTok input (Pro >200K). All use per-token pricing via EvoLink.

Gemini 3.1 Pro

$2/$12 — $4/$18 /MTok

Context: 1M

Flagship reasoning with 1M context. Tiered pricing: $2/$12 under 200K, $4/$18 over 200K input tokens.

Gemini 3.5 Flash

$1.50/$9.00 /MTok

Context: 1M

GA-stabiler Flash fuer agentische Workflows und Coding bei $1.50/$9.00 per MTok mit 1M Kontext und integriertem Reasoning.

Gemini 3 Flash

$0.50/$3.00 /MTok

Context: 1M

Gemini 3 generation Flash route at $0.50/$3.00 per MTok with 1M context.

Gemini 3.1 Flash Lite

$0.25/$1.50 /MTok

Context: 1M

Cheapest Gemini 3 route at $0.25/$1.50 per MTok for batch text workloads.

Gemini 2.5 Pro

$1.25/$10 — $2.50/$15 /MTok

Context: 1M

Stable deep reasoning at $1.25/$10 under 200K, $2.50/$15 over 200K.

Gemini 2.5 Flash

$0.30/$2.50 /MTok

Context: 1M

Production workhorse at $0.30/$2.50 per MTok with full multimodal support.

Gemini 2.5 Flash Lite

$0.10/$0.40 /MTok

Context: 1M

Lowest-cost Gemini route at $0.10/$0.40 per MTok for text and audio.

Gemini Leitfaeden und Vergleiche

Nutzen Sie diese Leitfaeden, wenn Sie vor der Routenwahl mehr Kontext benoetigen.

Gemini 3.1 Pro vs GPT-5.2 vs Claude Opus

Vergleichen Sie Flagship-Modelle fuer Reasoning, Coding und produktive Agent-Workloads.

GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 Pro

Sehen Sie, wie die neuesten Premium-Modelle im praktischen API-Vergleich abschneiden.

Gemini 3 Pro Deprecation-Migrationsleitfaden

Migrieren Sie alten Gemini 3 Pro Preview Traffic auf aktuelle Gemini Routen, ohne das Produktionsverhalten zu beeintraechtigen.

OpenCode-Integration mit Gemini Routen

Erfahren Sie, wie Sie ueber EvoLinks einheitliche API-Schicht auf Gemini neben Claude und GPT Modellen zugreifen koennen.

Gemini API FAQ

Everything you need to know about the product and billing.

Starten Sie mit Gemini 3.1 Pro fuer maximale Reasoning-Qualitaet, Gemini 3.5 Flash fuer agentische Workflows und Coding-Agenten, Gemini 2.5 Pro fuer stabiles Deep Reasoning, Gemini 2.5 Flash fuer schnelle Produktions-Workloads und Flash Lite, wenn Kosten der wichtigste Faktor sind.

Ja. Mehrere Gemini Routen unterstuetzen sehr grosse Kontextfenster und eignen sich damit fuer PDF-Analyse, Dokumentenpruefung, Retrieval-Workflows und Reasoning ueber mehrere Dateien.

Waehlen Sie Pro, wenn Antwortqualitaet, Coding und mehrstufiges Reasoning am wichtigsten sind. Waehlen Sie Flash, wenn Geschwindigkeit, Produktionsdurchsatz und planbare Kosten Vorrang haben.