Gemini 3 Flash Preview API
Greifen Sie über EvoLink auf Googles Gemini 3 Flash Preview (gemini-3-flash-preview) zu — OpenAI‑SDK‑kompatibel und mit nativer Gemini‑API‑Unterstützung. Senden Sie Text, Bild, Video, Audio und PDF mit 1.048.576 Token Kontext sowie Caching‑ und Batch‑Optionen für Produktions‑Workloads.
PRICING
| PLAN | CONTEXT WINDOW | MAX OUTPUT | INPUT | OUTPUT | CACHE READ |
|---|---|---|---|---|---|
| Gemini 3 Flash | 1.05M | 65.5K | ≤200.0K$0.400-20% $0.500Official Price >200.0K$0.400-20% $0.500Official Price | ≤200.0K$2.40-20% $3.00Official Price >200.0K$2.40-20% $3.00Official Price | ≤200.0K$0.040-19% $0.050Official Price >200.0K$0.040-19% $0.050Official Price |
| Gemini 3 Flash (Beta) | 1.05M | 65.5K | ≤200.0K$0.130-74% $0.500Official Price >200.0K$0.130-74% $0.500Official Price | ≤200.0K$0.780-74% $3.00Official Price >200.0K$0.780-74% $3.00Official Price | ≤200.0K$0.013-74% $0.050Official Price >200.0K$0.013-74% $0.050Official Price |
Pricing Note: Price unit: USD / 1M tokens
Cache Hit: Price applies to cached prompt tokens.
Two ways to run Gemini 3 Flash — pick the tier that matches your workload.
- · Gemini 3 Flash: the default tier for production reliability and predictable availability.
- · Gemini 3 Flash (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.
Gemini 3 Flash Preview API auf EvoLink
Für Geschwindigkeit und Scale gebaut: Gemini 3 Flash Preview versteht Text, Bilder, Video, Audio und PDFs und verarbeitet enorme Kontexte (bis 1M Tokens). Ideal für Echtzeit‑Assistenten, Dokument‑Verständnis und Medienanalyse.

Was Sie mit Gemini 3 Flash Preview bauen können
Multimodale Inputs, zuverlässige Text‑Outputs
Eine Anfrage kann Text, Bilder, Video, Audio oder PDFs enthalten und Text‑Output zurückgeben. Damit lassen sich Meetings zusammenfassen, Medien prüfen und strukturierte Insights extrahieren — ohne getrennte Pipelines.

1M‑Token‑Kontext für lange Sessions
Bis zu 1.048.576 Input‑Tokens und 65.536 Output‑Tokens pro Request. So bleiben lange Dokumente, Codebases oder Multi‑Turn‑Chats in einem konsistenten Kontext.

Tools, Grounding und Reasoning
Nutzen Sie Thinking und Structured Outputs mit Function Calling, Code Execution, File Search, Search Grounding und URL‑Kontext. Batch API und Caching werden für Scale und Kostenkontrolle unterstützt.

Warum EvoLink für Gemini 3 Flash Preview
Führen Sie gemini-3-flash-preview im OpenAI‑SDK‑ oder Google‑Native‑API‑Format mit offiziellen Gemini‑Funktionen und Pricing aus.
Eine Integration, zwei Formate
Gemini 3 Flash Preview im OpenAI‑SDK‑ oder nativen Gemini‑Format aufrufen, ohne App‑Logik zu ändern.
Batch + Caching‑Savings
Batch‑Processing und Context‑Caching senken Wiederholungskosten bei sicheren High‑Volume‑Workloads.
Ready für Produktion
Multimodale Inputs, Long‑Context und Tool‑Support decken echte Produktions‑Assistenten, Analysen und Automationen ab.
So rufen Sie Gemini 3 Flash Preview auf
Wählen Sie OpenAI‑SDK‑ oder Google‑Native‑API‑Format und senden Sie Ihre Anfrage.
Schritt 1 - API‑Format wählen
OpenAI‑SDK‑Format: POST /v1/chat/completions mit model "gemini-3-flash-preview". Native API‑Format: POST /v1beta/models/gemini-3-flash-preview:{method} mit generateContent oder streamGenerateContent.
Schritt 2 - Auth und Inputs hinzufügen
Authorization: Bearer <token> senden. Messages/Contents mit Text oder multimodalen Parts (Bild, Video, Audio, PDF) übergeben.
Schritt 3 - Streamen oder Skalieren
Streaming für Echtzeit‑UX aktivieren oder X‑Async‑Mode für eine Task‑ID nutzen. Batch + Caching für kosteneffiziente High‑Volume‑Runs kombinieren.
Technische Specs
Offizielle Modell‑Capabilities für gemini-3-flash-preview
1.048.576 Input‑Tokens
Bis zu 1.048.576 Input‑Tokens und 65.536 Output‑Tokens.
Multimodale Inputs
Text, Bild, Video, Audio und PDF als Input, Text als Output.
Thinking + Structured Outputs
Thinking und strukturierte Outputs für zuverlässige, maschinenlesbare Ergebnisse.
Function Calling + Tools
Function Calling, Code Execution und File Search werden unterstützt.
Caching + Batch
Context‑Caching und Batch API für wiederholte oder großskalige Workloads.
Search Grounding + URL‑Kontext
Search Grounding und URL‑Kontext werden unterstützt (Google Maps Grounding nicht).
Gemini 3 Flash Preview API FAQs
Everything you need to know about the product and billing.