Comparison

Gemini 3.5 Flash vs Gemini 3 Flash Preview: Preise, Kontext und Migrationsanleitung

Name: EvoLink AI Model API Platform
Brand: EvoLink
Availability: InStock

EvoLink Team

Product Team

20. Mai 2026

8 Min. Lesezeit

Letzte Überprüfung: 20. Mai 2026. Die folgenden Preis- und Fähigkeitsangaben basieren auf der offiziellen Google-Modelldokumentation und EvoLink-Plattformdaten, geprüft an diesem Datum.

Googles Gemini-Flash-Familie umfasst jetzt zwei Generationen, die über die API verfügbar sind: Gemini 3.5 Flash (stabil) und Gemini 3 Flash Preview. Wenn Ihr Team bereits Gemini 3 Flash Preview in der Produktion einsetzt oder ein neues Flash-Modell evaluiert, lautet die Antwort nicht einfach „neuer ist besser". Die richtige Frage ist: Rechtfertigt der Fähigkeitszuwachs einen 3-fachen Preisanstieg für Ihre konkreten Workloads?

Zusammenfassung

Gemini 3 Flash Preview bleibt die günstigere Option mit $0.50/$3.00 pro 1M Tokens (Input/Output). Ideal für kostensensitive Workloads mit hohem Volumen, bei denen der Preview-Status akzeptabel ist.
Gemini 3.5 Flash kostet $1.50/$9.00 pro 1M Tokens, wird aber als stabiles GA-Modell mit verbessertem Reasoning, Function Calling und strukturierter Ausgabe für Agenten-Workflows ausgeliefert.
Beide teilen ein 1M-Token-Kontextfenster und ein 65.536-Token-Ausgabelimit.
Die Migration auf API-Ebene ist unkompliziert (Modell-ID austauschen), aber die Auswirkung auf das Budget ist erheblich — kalkulieren Sie vor dem Wechsel.

Vergleichstabelle

Dimension	Gemini 3.5 Flash	Gemini 3 Flash Preview
Model ID	`gemini-3.5-flash`	`gemini-3-flash-preview`
Status	Stabil (GA)	Preview
Input-Preis	$1.50 / 1M Tokens	$0.50 / 1M Tokens
Output-Preis	$9.00 / 1M Tokens	$3.00 / 1M Tokens
Cache-Hit-Preis	$0.15 / 1M Tokens	$0.05 / 1M Tokens
Audio-Input-Preis	$1.50 / 1M Tokens	$1.00 / 1M Tokens
Kontextfenster	1.000.000 Tokens	1.048.576 Tokens
Ausgabelimit	65.536 Tokens	65.536 Tokens
Multimodale Eingaben	Text, image, video, audio, PDF	Text, image, video, audio, PDF
Function Calling	Yes	Yes
Strukturierte Ausgabe	Yes	Yes
Code-Ausführung	Yes	Yes
Context caching	Yes	Yes
Batch API	Yes	Yes
Google Search grounding	Yes	Yes
Eingebautes Reasoning	Yes (verbessert)	Yes

Wann Sie bei Gemini 3 Flash Preview bleiben sollten

Gemini 3 Flash Preview ist in folgenden Szenarien weiterhin eine starke Wahl:

Kosten sind die primäre Anforderung

Bei $0.50 Input und $3.00 Output pro 1M Tokens ist Gemini 3 Flash Preview 3-mal günstiger als Gemini 3.5 Flash. Für hochvolumige Klassifikations-, Extraktions-, Formatierungs- und Routing-Aufgaben, bei denen die Qualität bereits ausreicht, summiert sich der Kostenunterschied schnell.

Beispiel: Eine Pipeline, die täglich 10M Input-Tokens und 2M Output-Tokens verarbeitet:

Modell	Tägliche Input-Kosten	Tägliche Output-Kosten	Tagesgesamt	Monatsgesamt
Gemini 3 Flash Preview	$5,00	$6,00	$11,00	$330
Gemini 3.5 Flash	$15,00	$18,00	$33,00	$990

Das ergibt eine Differenz von $660/Monat für eine einzelne Pipeline.

Der Preview-Status ist akzeptabel

Wenn Ihr Workload gelegentliche Änderungen im API-Verhalten toleriert und Sie bereits mit den Eigenheiten von Preview-Modellen umgehen (Versionspinning, Tests nach Updates), vermeidet das Verbleiben bei Gemini 3 Flash Preview unnötige Migrationskosten.

Die aktuelle Qualität erfüllt Ihre Abnahmekriterien

Wenn Ihre bestehende Gemini-3-Flash-Preview-Integration Ihre Qualitätsprüfungen besteht — Schema-Validität, Faktentreue, Latenz, Wiederholungsrate — gibt es keinen Grund zu migrieren, nur weil ein neueres Modell existiert.

Wann Sie zu Gemini 3.5 Flash migrieren sollten

Gemini 3.5 Flash wird in folgenden Situationen zur besseren Wahl:

Sie benötigen GA-Stabilitätsgarantien

Preview-Modelle können ihr Verhalten zwischen Versionen ändern. Gemini 3.5 Flash ist ein stabiles GA-Modell mit vorhersagbarerem Verhalten für Produktionsdeployments, die sich keine unerwarteten Regressionen leisten können.

Agenten-Workflows erfordern stärkeres Reasoning

Gemini 3.5 Flash bietet verbesserte eingebaute Reasoning-Fähigkeiten. Für Agenten-Teilschritte mit mehrstufiger Planung, Werkzeugauswahl oder komplexen Function-Calling-Ketten kann das verbesserte Reasoning Wiederholungs- und Fallback-Raten senken — was den höheren Token-Preis ausgleichen kann.

Zuverlässigkeit der strukturierten Ausgabe ist entscheidend

Wenn Ihre Pipeline auf strikte Schema-Einhaltung angewiesen ist (JSON Mode, Function-Calling-Antworten, typisierte Ausgaben), kann die verbesserte strukturierte Ausgabe von Gemini 3.5 Flash Validierungsfehler und nachgelagerte Fehlerbehandlung reduzieren.

Sie bauen neue Workloads von Grund auf

Für neue Projekte ohne bestehende Gemini-3-Flash-Preview-Integration vermeidet der Start mit Gemini 3.5 Flash den Aufbau auf einem Preview-Modell, das möglicherweise in Zukunft eingestellt wird.

Migrations-Checkliste

Wenn Sie sich für die Migration von Gemini 3 Flash Preview zu Gemini 3.5 Flash entscheiden:

1. Modell-ID aktualisieren

gemini-3-flash-preview → gemini-3.5-flash

Wenn Sie EvoLinks einheitliche API verwenden, aktualisieren Sie den Model-Parameter in Ihrer Anfrage. Änderungen an Endpunkt oder Authentifizierung sind nicht erforderlich.

2. Budget neu kalkulieren

Multiplizieren Sie Ihre aktuellen Gemini-3-Flash-Preview-Ausgaben mit etwa 3, um die Kosten für Gemini 3.5 Flash abzuschätzen. Berücksichtigen Sie mögliche Einsparungen durch niedrigere Wiederholungsraten, wenn Ihre Workloads vom verbesserten Reasoning profitieren.

3. Parallele Evaluation durchführen

Bevor Sie Produktionstraffic umstellen, führen Sie beide Modelle mit demselben Workload-Sample aus. Vergleichen Sie:

Aufgabenerfolgsrate
Wiederholungsrate
Latenz (Time-to-First-Token und vollständige Antwort)
Schema-Validitätsrate
Kosten pro erfolgreicher Aufgabe

4. Monitoring und Alerts aktualisieren

Passen Sie Kostenalerts und Budget-Schwellenwerte an die neue Preisstufe an.

5. Fallback planen

Behalten Sie Gemini 3 Flash Preview während der Migration als Fallback-Route bei. Falls Gemini 3.5 Flash Kontingentdruck oder Latenzspitzen zeigt, können Sie ohne Codeänderungen zurückwechseln.

Kosten pro erfolgreicher Aufgabe: der eigentliche Vergleich

Der Token-Preis ist nur ein Teil des Gesamtbildes. Wenn Gemini 3.5 Flash bei Ihren Workloads weniger Wiederholungen, weniger Fallbacks und höhere Erstversuchserfolgsraten liefert, verringert sich der effektive Kostenunterschied.

Metrik	Darauf achten
Token-Kosten pro Anfrage	Direkte Preisdifferenz
Wiederholungsrate	Wie oft die erste Antwort die Validierung nicht besteht
Fallback-Rate	Wie oft Flash zu einem stärkeren Modell eskalieren muss
Latenz	Time-to-First-Token und vollständige Antwortzeit
Aufgabenerfolgsrate	Anteil der Aufgaben, die beim ersten Versuch die Abnahmekriterien erfüllen
Kosten pro erfolgreicher Aufgabe	Mischkosten nach Wiederholungen, Fallbacks und verschwendeten Tokens

Ein Modell, das pro Token 3-mal so viel kostet, aber beim ersten Versuch erfolgreich ist, kann günstiger sein als eines, das 2–3 Wiederholungen benötigt.

Was ist mit Gemini 3.1 Flash Lite Preview?

Teams, denen Gemini 3.5 Flash zu teuer und Gemini 3 Flash Preview nicht stabil genug ist, sollten auch Gemini 3.1 Flash Lite Preview in Betracht ziehen — bei $0.25/$1.50 pro 1M Tokens. Es ist die günstigste Option in der Gemini-Flash-Familie, konzipiert für hochvolumige, wiederholungstolerante Workloads, bei denen Latenz und Kosten wichtiger sind als maximale Qualität.

Modell	Input	Output	Geeignet für
Gemini 3.1 Flash Lite Preview	$0,25	$1,50	Höchstes Volumen, Kosten zuerst
Gemini 3 Flash Preview	$0,50	$3,00	Balance zwischen Kosten und Fähigkeiten
Gemini 3.5 Flash	$1,50	$9,00	GA-Stabilität und Agenten-Workflows

FAQ

Ist Gemini 3.5 Flash ein direkter Ersatz für Gemini 3 Flash Preview?

Funktional ja — beide unterstützen dieselben Eingabemodalitäten, Function Calling, strukturierte Ausgabe und Context Caching. Allerdings ist Gemini 3.5 Flash ein GA-Modell zu einem höheren Preis, während Gemini 3 Flash Preview weiterhin zu Preview-Preisen verfügbar bleibt.

Wird Gemini 3 Flash Preview eingestellt?

Google hat zum Stand 20. Mai 2026 kein Einstellungsdatum für Gemini 3 Flash Preview angekündigt. Preview-Modelle werden jedoch im Allgemeinen im Laufe der Zeit durch stabile Versionen ersetzt. Beobachten Sie die Gemini API Release Notes für Einstellungsankündigungen.

Kann ich beide Modelle über EvoLink nutzen?

Ja. EvoLink unterstützt beide Modell-IDs über seine einheitliche API. Sie können verschiedene Workloads je nach Kosten-, Qualitäts- oder Latenzanforderungen an unterschiedliche Modelle routen, ohne separate Anbieter-Integrationen verwalten zu müssen.

Lohnt sich der 3-fache Preisanstieg?

Das hängt vollständig von Ihrem Workload ab. Für hochvolumige, kostensensitive Aufgaben, bei denen Gemini 3 Flash Preview die Qualitätsanforderungen bereits erfüllt, ist das Upgrade möglicherweise nicht gerechtfertigt. Für Agenten-Workflows, strukturierte Output-Pipelines und Produktionssysteme, die GA-Stabilität benötigen, können die Verbesserungen bei Reasoning und Zuverlässigkeit den Kostenanstieg ausgleichen.

Wie teste ich vor der Migration?

Führen Sie beide Modelle mit einer repräsentativen Stichprobe Ihrer Produktions-Workloads aus. Vergleichen Sie Aufgabenerfolgsrate, Wiederholungsrate, Latenz und Kosten pro erfolgreicher Aufgabe. Treffen Sie die Entscheidung auf Basis gemessener Ergebnisse, nicht auf der Annahme, das neuere Modell sei generell besser.

Gemini Flash-Modelle auf EvoLink vergleichen

EvoLink bietet eine einheitliche API für den Zugriff auf Gemini 3.5 Flash und Gemini 3 Flash Preview. Testen Sie Routing, Fallback-Verhalten und Workload-Kosten über eine einzige Integration.

Weiterführende Artikel:

Gemini 3.5 Flash API — Produktseite mit Preisen, Modell-ID und Playground
Gemini 3.5 Flash Pricing Guide — Token-Kostenaufschlüsselung und Produktionsbudget-Beispiele
Gemini 3.5 Flash für Coding-Agenten — Agenten-Workflow-Bewertung und Kostenanalyse
Gemini 3.5 Flash vs Claude Haiku 4.5 — Familienübergreifender Kosteneffizienz-Vergleich
Gemini 3.5 Flash API Release Watch — Release-Tracking und Statusupdates

Auf EvoLink erkunden:

Gemini 3.5 Flash API — $1.50/$9.00 pro 1M Tokens, stabiles GA
Gemini 3 Flash Preview API — $0.50/$3.00 pro 1M Tokens, Preview
Gemini API-Familie — Alle Gemini-Routen nach Preis und Workload vergleichen

Quellen

Alle Beiträge

#Gemini 3.5 Flash #Gemini 3 Flash Preview #Gemini API #model migration #Flash models