Release-Beobachtung

Gemini 3.5 Flash API ist jetzt verfügbar: Modell-ID, Preise und Produktionshinweise

Name: EvoLink AI Model API Platform
Brand: EvoLink
Availability: InStock

EvoLink Team

Product Team

18. Mai 2026

Aktualisiert am 20. Mai 2026

4 Min. Lesezeit

Update (20. Mai 2026): Google hat die offizielle Gemini-API-Dokumentation aktualisiert. Gemini 3.5 Flash ist jetzt als allgemein verfügbar und stabil für skalierten Produktionseinsatz gelistet. Die Modell-ID lautet gemini-3.5-flash. Diese Seite wurde vom Release-Watch-Format auf bestätigte Verfügbarkeit aktualisiert.

Die vollständige Gemini 3.5 Flash API-Seite mit Preisen, Code-Beispielen und Anwendungsfällen finden Sie unter Gemini 3.5 Flash API auf EvoLink.

TL;DR

Gemini 3.5 Flash ist jetzt allgemein verfügbar (GA) und als stabil für Produktionseinsatz markiert.
Modell-ID: gemini-3.5-flash — bestätigt in Googles offiziellen Gemini-API-Docs.
Preise: $1,50 Input / $9,00 Output pro 1M Tokens (Standard-Tier), mit Kontext-Caching und Batch-Rabatten.
Kontext: 1.000.000 Input-Tokens / 65.536 Output-Tokens.
Kernstärken: Agent-Workflows, Coding-Agents, Sub-Agent-Deployment, langfristige Aufgaben.
Kein Preview — Produktionsteams können Traffic vertrauensvoll darüber routen.

Was sich seit dem 18. Mai geändert hat

Am 18. Mai 2026 berichtete diese Seite, dass Googles offizielle Gemini-API-Docs Gemini 3.5 Flash nicht aufführten. Hier die Änderungen:

Element	Status 18. Mai	Aktueller Status (20. Mai)
Offizielle Veröffentlichung	Nicht bestätigt	Allgemein verfügbar, stabil
Modell-ID	Nicht bestätigt	`gemini-3.5-flash`
Preise	Nicht bestätigt	$1,50 Input / $9,00 Output pro 1M Tokens
Kontextfenster	Nicht bestätigt	1M Input / 65K Output
Tool-Calling	Nicht bestätigt	Function Calling, strukturierte Ausgaben, Code-Ausführung unterstützt
Kontext-Caching	Nicht bestätigt	Unterstützt
Batch API	Nicht bestätigt	Unterstützt
Produktionsstatus	Nicht verfügbar	Stabil für skalierten Produktionseinsatz

Bestätigte Fähigkeiten

Googles offizielle Dokumentation beschreibt Gemini 3.5 Flash als Modell für reale Aufgaben mit Frontier-Intelligenz bei Flash-Geschwindigkeit und -Kosten.

Agent-Workflows

Optimiert für Agent-Workflows, parallele Ausführungsschleifen und Sub-Agent-Deployment. Function Calling, strukturierte Ausgaben und Code-Ausführung werden nativ unterstützt.

Coding-Aufgaben

Das Modell verarbeitet Codegenerierung, Debugging, Refactoring und Testschreiben mit Flash-Geschwindigkeit — ideal für Coding-Agent-Schleifen.

Langfristige Aufgaben

Mit 1M Eingabekontext verarbeitet es vollständige Codebases, Multi-Dokument-Analysen, juristische Prüfungen und PDF-intensive Workflows ohne Kontextkürzung.

Multimodale Eingaben

Text, Bild, Video, Audio und PDF werden mit einheitlicher Preisgestaltung unterstützt.

Preisübersicht

Tier	Input (pro 1M Tokens)	Output (pro 1M Tokens)
Standard	$1,50	$9,00
Kontext-Caching	Reduzierte Inputkosten	Gleicher Output
Batch API	Zusätzliche Rabatte	Zusätzliche Rabatte

Detaillierte EvoLink-Preise finden Sie auf der Gemini 3.5 Flash API-Seite.

Was das für Produktionsteams bedeutet

Produktionstraffic jetzt möglich

Gemini 3.5 Flash ist kein Preview-Modell. Google markiert es als stabil für skalierten Produktionseinsatz.

Für Agent- und Coding-Workloads evaluieren

Google positioniert dieses Modell explizit für Agent-Workflows und Coding-Aufgaben. Benchmarken Sie es gegen Ihr aktuelles Standardmodell.

Gemini-Familie vergleichen

Modell	Am besten für	Kostenprofil
Gemini 3.5 Flash	Agent-Workflows, Coding, langfristige Aufgaben	Flash-Tier
Gemini 3.1 Pro	Schwierigste Reasoning-Aufgaben	Höhere Kosten
Gemini 3.1 Flash Lite	Hochvolumige Batches, einfache Extraktion	Niedrigste Kosten

Gemini 3.5 Flash auf EvoLink nutzen →

Offizielle Quellen

FAQ

Ist Gemini 3.5 Flash jetzt über die API verfügbar?

Ja. Google listet Gemini 3.5 Flash als allgemein verfügbar und stabil für skalierten Produktionseinsatz. Die Modell-ID ist gemini-3.5-flash.

Was ist die Modell-ID für Gemini 3.5 Flash?

Die bestätigte Modell-ID lautet gemini-3.5-flash.

Was kostet Gemini 3.5 Flash?

Standardpreis: $1,50 pro 1M Input-Tokens und $9,00 pro 1M Output-Tokens. Kontext-Caching und Batch API bieten zusätzliche Einsparungen.

Ist Gemini 3.5 Flash produktionsreif?

Ja. Google markiert es als stabil für skalierten Produktionseinsatz.

Wofür eignet sich Gemini 3.5 Flash am besten?

Agent-Workflows, Coding-Agents, Sub-Agent-Deployment, langfristige Aufgaben und kosteneffiziente Produktionsinferenz mit 1M Kontext.

Kann ich über EvoLink auf Gemini 3.5 Flash zugreifen?

Ja. EvoLink bietet OpenAI-kompatiblen und nativen Gemini-API-Zugang. Details auf der Gemini 3.5 Flash API-Seite.

Alle Beiträge

#Gemini 3.5 Flash #Gemini API #Google AI #Flash models #release watch