Gemini 3 Flash Preview API
- One API for Code Agents & CLIs. (View Docs)
$0.400(~ 28.8 credits) per 1M input tokens; $2.400(~ 172.8 credits) per 1M output tokens
$0.040(~ 2.9 credits) per 1M cache read tokens; $0.800(~ 57.6 credits) per 1M audio tokens
Google Search grounding charged separately per query.
Höchste Stabilität mit garantierter 99,9% Verfügbarkeit. Empfohlen für Produktionsumgebungen.
Für alle Versionen wird derselbe API-Endpunkt verwendet. Nur der model-Parameter unterscheidet sich.
Gemini 3 Flash Preview API auf EvoLink
Für Geschwindigkeit und Scale gebaut: Gemini 3 Flash Preview versteht Text, Bilder, Video, Audio und PDFs und verarbeitet enorme Kontexte (bis 1M Tokens). Ideal für Echtzeit‑Assistenten, Dokument‑Verständnis und Medienanalyse.

Was Sie mit Gemini 3 Flash Preview bauen können
Multimodale Inputs, zuverlässige Text‑Outputs
Eine Anfrage kann Text, Bilder, Video, Audio oder PDFs enthalten und Text‑Output zurückgeben. Damit lassen sich Meetings zusammenfassen, Medien prüfen und strukturierte Insights extrahieren — ohne getrennte Pipelines.

1M‑Token‑Kontext für lange Sessions
Bis zu 1.048.576 Input‑Tokens und 65.536 Output‑Tokens pro Request. So bleiben lange Dokumente, Codebases oder Multi‑Turn‑Chats in einem konsistenten Kontext.

Tools, Grounding und Reasoning
Nutzen Sie Thinking und Structured Outputs mit Function Calling, Code Execution, File Search, Search Grounding und URL‑Kontext. Batch API und Caching werden für Scale und Kostenkontrolle unterstützt.

Warum EvoLink für Gemini 3 Flash Preview
Führen Sie gemini-3-flash-preview im OpenAI‑SDK‑ oder Google‑Native‑API‑Format mit offiziellen Gemini‑Funktionen und Pricing aus.
Eine Integration, zwei Formate
Gemini 3 Flash Preview im OpenAI‑SDK‑ oder nativen Gemini‑Format aufrufen, ohne App‑Logik zu ändern.
Batch + Caching‑Savings
Batch‑Processing und Context‑Caching senken Wiederholungskosten bei sicheren High‑Volume‑Workloads.
Ready für Produktion
Multimodale Inputs, Long‑Context und Tool‑Support decken echte Produktions‑Assistenten, Analysen und Automationen ab.
So rufen Sie Gemini 3 Flash Preview auf
Wählen Sie OpenAI‑SDK‑ oder Google‑Native‑API‑Format und senden Sie Ihre Anfrage.
Schritt 1 - API‑Format wählen
OpenAI‑SDK‑Format: POST /v1/chat/completions mit model "gemini-3-flash-preview". Native API‑Format: POST /v1beta/models/gemini-3-flash-preview:{method} mit generateContent oder streamGenerateContent.
Schritt 2 - Auth und Inputs hinzufügen
Authorization: Bearer <token> senden. Messages/Contents mit Text oder multimodalen Parts (Bild, Video, Audio, PDF) übergeben.
Schritt 3 - Streamen oder Skalieren
Streaming für Echtzeit‑UX aktivieren oder X‑Async‑Mode für eine Task‑ID nutzen. Batch + Caching für kosteneffiziente High‑Volume‑Runs kombinieren.
Technische Specs
Offizielle Modell‑Capabilities für gemini-3-flash-preview
1.048.576 Input‑Tokens
Bis zu 1.048.576 Input‑Tokens und 65.536 Output‑Tokens.
Multimodale Inputs
Text, Bild, Video, Audio und PDF als Input, Text als Output.
Thinking + Structured Outputs
Thinking und strukturierte Outputs für zuverlässige, maschinenlesbare Ergebnisse.
Function Calling + Tools
Function Calling, Code Execution und File Search werden unterstützt.
Caching + Batch
Context‑Caching und Batch API für wiederholte oder großskalige Workloads.
Search Grounding + URL‑Kontext
Search Grounding und URL‑Kontext werden unterstützt (Google Maps Grounding nicht).
Gemini 3 Flash Preview API FAQs
Everything you need to know about the product and billing.