Gemini 3.5 Flash API
$1.399(~ 95.1 credits) per 1M input tokens; $8.387(~ 570.3 credits) per 1M output tokens
$0.141(~ 9.6 credits) per 1M cache read tokens; $1.399(~ 95.1 credits) per 1M audio tokens
Google Search grounding charged separately per query.
Höchste Stabilität mit garantierter 99,9% Verfügbarkeit. Empfohlen für Produktionsumgebungen.
Für alle Versionen wird derselbe API-Endpunkt verwendet. Nur der model-Parameter unterscheidet sich.
Produktionsreifes Flash-Modell für Agent-Workflows und Coding
Gemini 3.5 Flash ist allgemein verfügbar und stabil für produktiven Einsatz in großem Maßstab. Entwickelt für Agent-Workflows, Coding-Agents, Sub-Agent-Deployment und langfristige Aufgaben — mit Frontier-Intelligenz zu Flash-Kosten, 1M Kontext, integriertem Reasoning und vollem Tool-Support.
Seiten-Keyword
Gemini 3.5 Flash API
Request-Modell-ID
gemini-3.5-flash

Geeignete Einsatzfälle für die Gemini 3.5 Flash API
Coding-Agents und mehrstufige Entwicklungsschleifen
Gemini 3.5 Flash glänzt bei Coding-Aufgaben — Codegenerierung, Debugging, Refactoring und Testschreiben — mit Flash-Geschwindigkeit. Ideal als Standardmodell in Coding-Agent-Schleifen, wo jede Iteration Tokens verbraucht und Latenz zählt.

Agent-Workflows und Sub-Agent-Deployment
Gebaut für parallele agentische Ausführungsschleifen: Function Calling, strukturierte Ausgaben, Code-Ausführung und Search Grounding. Setzen Sie es als Sub-Agent in Multi-Agent-Systemen ein, wo Geschwindigkeit und Kosten pro Aufruf die Gesamtwirtschaftlichkeit bestimmen.

Langfristige Aufgaben und Dokumentenverarbeitung
Mit 1M Eingabekontext und 65K Ausgabe-Token bewältigt Gemini 3.5 Flash langfristige Aufgaben über viele Schritte — juristische Dokumentenprüfung, Codebase-Analyse, Forschungssynthese und PDF-intensive Workflows — ohne Kontextkürzung.

Produktionsinferenz zu Flash-Kosten
Allgemein verfügbar und stabil für skalierten Produktionseinsatz. Kontext-Caching, Batch API und einheitliche multimodale Preise machen es zum Standard-Hochdurchsatzmodell für Teams, die Reasoning-Qualität ohne Pro-Kosten benötigen.

Warum EvoLink für die Gemini 3.5 Flash API
Für Teams mit OpenAI-ähnlicher Infrastruktur macht EvoLink Gemini 3.5 Flash produktionsnäher: ein Gateway, geringere Migrationskosten und saubereres Routing zwischen günstigen und Premium-Modellen.
Gemini nutzen und OpenAI-Workflows behalten
Wenn Ihr Team bereits auf OpenAI SDK, gemeinsamer Authentifizierung und bestehenden Request-Layern aufbaut, können Sie Gemini 3.5 Flash hinzufügen, ohne die Kernintegration neu zu schreiben.
Flash als günstige Stufe im Multi-Model-Stack einsetzen
Leiten Sie günstige Übersetzungs-, Extraktions- und Klassifizierungsanfragen zuerst an Flash weiter und senden Sie nur schwierigere oder wertvollere Requests auf stärkere Modelle im selben Gateway.
Weniger Migrationsaufwand als bei vendorspezifischen Integrationen
Ein API-Schlüssel, OpenAI-kompatible und native Gemini-Formate sowie Caching- und Batch-Support erleichtern den gemeinsamen Betrieb von Gemini mit Ihrem übrigen Modellkatalog.
So verwenden Sie die Gemini 3.5 Flash API
Nutzen Sie diese Seite als Zugriffsübersicht: Wählen Sie das Request-Format, verwenden Sie die Preview-Modell-ID und lassen Sie detaillierte Request-Beispiele in der Dokumentation.
Schritt 1 - Request-Format wählen
Gemini 3.5 Flash kann über OpenAI-kompatible Requests oder die native Gemini API aufgerufen werden. So passt das Modell in bestehende Stacks, ohne den gesamten Integrationspfad neu aufzubauen.
Schritt 2 - Die aktuelle Request-Modell-ID verwenden
Verwenden Sie für produktiven Traffic die genaue Request-Modell-ID "gemini-3.5-flash". So bleibt das Seiten-Keyword auf Gemini 3.5 Flash API fokussiert und passt gleichzeitig zur tatsächlich aufgerufenen Route.
Schritt 3 - Die richtigen Workloads hier skalieren
Nutzen Sie Flash für Übersetzungs-Queues, Extraktionsjobs, Tagging und andere Workloads mit hohem Volumen, und leiten Sie Grenzfälle oder schwierigere Requests an stärkere Modelle weiter. Exakte Request-Bodies, Parameter und Endpoint-Beispiele gehören in die Dokumentation.
Funktionen und Limits der Gemini 3.5 Flash API
Die wichtigsten Fähigkeiten und Grenzen für Produktionsintegrationen
1.050.000 Eingabe-Token
Bis zu 1.050.000 Eingabe-Token und 65.536 Ausgabe-Token.
Multimodale Eingaben
Text-, Bild-, Video-, Audio- und PDF-Eingaben mit Textausgabe.
Thinking + strukturierte Ausgaben
Thinking und strukturierte Ausgaben werden unterstützt, um zuverlässige, maschinenlesbare Ergebnisse zu erzeugen.
Function Calling + Tools
Function Calling, Code-Ausführung und Search Grounding werden unterstützt.
Caching + Batch
Kontext-Caching und Batch API eignen sich für wiederholte oder großvolumige Workloads.
Sehr günstige Nutzung
Die aktuellen Pay-as-you-go-Preise auf EvoLink entnehmen Sie bitte der Live-Preistabelle oben auf der Seite.
Gemini 3.5 Flash im Vergleich zu anderen Gemini-Modellen
Vergleichen Sie Positionierung, Kontext, Reasoning-Stil und Tooling der Gemini-Familie, um die richtige Route für Ihren Workload zu wählen
| Model | Best for | Context window | Reasoning style | Tooling & streaming |
|---|---|---|---|---|
| Gemini 3.5 Flash | Agent-Workflows, Coding-Agents, langfristige Aufgaben | 1M Eingabe / 65K Ausgabe | Integriertes Reasoning mit Flash-Geschwindigkeit | Function Calling, Code-Ausführung, strukturierte Ausgaben, Caching, Batch |
| Gemini 3 Flash Preview | Allgemeine schnelle Workloads, vorherige Flash-Generation | 1M Eingabe / 65K Ausgabe | Standard-Flash-Reasoning | Function Calling, strukturierte Ausgaben, Caching |
| Gemini 3.1 Pro | Schwierigste Reasoning-Aufgaben, komplexe Analyse | 1M Eingabe / 65K Ausgabe | Tiefstes Reasoning mit Thinking-Token | Volle Tool-Suite, Code-Ausführung, Search Grounding |
| Gemini 3.1 Flash Lite | Hochvolumige Batches, günstige Extraktion, einfache Aufgaben | 1M Eingabe / 65K Ausgabe | Leichtgewichtig, kein tiefes Reasoning | Function Calling, strukturierte Ausgaben, Caching, Batch |
FAQs zur Gemini 3.5 Flash API
Everything you need to know about the product and billing.
Gemini API-Modelle auf EvoLink
Gemini 3.5 Flash ist die günstigste Route der Gemini-Familie. Für stärkere Multimodalität wechseln Sie zu Gemini 3 Flash Preview, für Frontier-Reasoning zu Gemini 3.1 Pro. Alle Modelle nutzen dasselbe API-Format.