Gemini 3 Flash Preview API

Greifen Sie über EvoLink auf Googles Gemini 3 Flash Preview (gemini-3-flash-preview) zu — OpenAI‑SDK‑kompatibel und mit nativer Gemini‑API‑Unterstützung. Senden Sie Text, Bild, Video, Audio und PDF mit 1.048.576 Token Kontext sowie Caching‑ und Batch‑Optionen für Produktions‑Workloads.

Nutzt du Coding-CLIs? Führe Gemini 3 Flash Preview über EvoCode aus — eine API für Code-Agents & CLIs. (Doku ansehen)

Modelltyp:

✓Gemini 3 Flash Preview

Preis:

$0.466(~ 31.7 credits) pro 1 Mio. Input-Tokens; $2.796(~ 190.1 credits) pro 1 Mio. Output-Tokens

$0.047(~ 3.2 credits) pro 1 Mio. Cache-Read-Tokens; $0.932(~ 63.4 credits) pro 1 Mio. Audio-Tokens

Google Search Grounding wird pro Anfrage separat berechnet.

Stabiler verwalteter Zugriff für Produktions-Workloads. Empfohlen, wenn Sie Dashboard-Abrechnung, API-Key-Kontrolle und planbares Integrationsverhalten benötigen.

Für alle Versionen wird derselbe API-Endpunkt verwendet. Nur der model-Parameter unterscheidet sich.

PRICING

PLAN	CONTEXT WINDOW	MAX OUTPUT	INPUT	OUTPUT	CACHE READ	AUDIO INPUT
Gemini 3 Flash	1,050,000	65,536	$0.467-7% (31.7 Credits)	$2.796-7% (190.1 Credits)	$0.048-6% (3.2 Credits)	$0.933-7% (63.4 Credits)
Web Search Tool Server-side web search capability						$0.014/search (0.89 Credits)

Pricing Note: Prices show both USD and Credits. Units default to / 1M tokens unless noted separately.

Cache Hit: Price applies to cached prompt tokens.

Audio Input: Audio tokens charged at a separate rate.

Gemini 3 Flash Preview API auf EvoLink

Name: EvoLink AI Model API Platform
Brand: EvoLink
Availability: InStock

Für Geschwindigkeit und Scale gebaut: Gemini 3 Flash Preview versteht Text, Bilder, Video, Audio und PDFs und verarbeitet enorme Kontexte (bis 1M Tokens). Ideal für Echtzeit‑Assistenten, Dokument‑Verständnis und Medienanalyse.

Was Sie mit Gemini 3 Flash Preview bauen können

Multimodale Inputs, zuverlässige Text‑Outputs

Eine Anfrage kann Text, Bilder, Video, Audio oder PDFs enthalten und Text‑Output zurückgeben. Damit lassen sich Meetings zusammenfassen, Medien prüfen und strukturierte Insights extrahieren — ohne getrennte Pipelines.

1M‑Token‑Kontext für lange Sessions

Bis zu 1.048.576 Input‑Tokens und 65.536 Output‑Tokens pro Request. So bleiben lange Dokumente, Codebases oder Multi‑Turn‑Chats in einem konsistenten Kontext.

Tools, Grounding und Reasoning

Nutzen Sie Thinking und Structured Outputs mit Function Calling, Code Execution, File Search, Search Grounding und URL‑Kontext. Batch API und Caching werden für Scale und Kostenkontrolle unterstützt.

Warum EvoLink für Gemini 3 Flash Preview

Führen Sie gemini-3-flash-preview im OpenAI‑SDK‑ oder Google‑Native‑API‑Format mit offiziellen Gemini‑Funktionen und Pricing aus.

Eine Integration, zwei Formate

Gemini 3 Flash Preview im OpenAI‑SDK‑ oder nativen Gemini‑Format aufrufen, ohne App‑Logik zu ändern.

Batch + Caching‑Savings

Batch‑Processing und Context‑Caching senken Wiederholungskosten bei sicheren High‑Volume‑Workloads.

Ready für Produktion

Multimodale Inputs, Long‑Context und Tool‑Support decken echte Produktions‑Assistenten, Analysen und Automationen ab.

So rufen Sie Gemini 3 Flash Preview auf

Wählen Sie OpenAI‑SDK‑ oder Google‑Native‑API‑Format und senden Sie Ihre Anfrage.

Schritt 1 - API‑Format wählen

OpenAI‑SDK‑Format: POST /v1/chat/completions mit model "gemini-3-flash-preview". Native API‑Format: POST /v1beta/models/gemini-3-flash-preview:{method} mit generateContent oder streamGenerateContent.

Schritt 2 - Auth und Inputs hinzufügen

Authorization: Bearer <token> senden. Messages/Contents mit Text oder multimodalen Parts (Bild, Video, Audio, PDF) übergeben.

Schritt 3 - Streamen oder Skalieren

Streaming für Echtzeit‑UX aktivieren oder X‑Async‑Mode für eine Task‑ID nutzen. Batch + Caching für kosteneffiziente High‑Volume‑Runs kombinieren.

Technische Specs

Offizielle Modell‑Capabilities für gemini-3-flash-preview

Kontext

1.048.576 Input‑Tokens

Bis zu 1.048.576 Input‑Tokens und 65.536 Output‑Tokens.

Multimodal

Multimodale Inputs

Text, Bild, Video, Audio und PDF als Input, Text als Output.

Reasoning

Thinking + Structured Outputs

Thinking und strukturierte Outputs für zuverlässige, maschinenlesbare Ergebnisse.

Tools

Function Calling + Tools

Function Calling, Code Execution und File Search werden unterstützt.

Scale

Caching + Batch

Context‑Caching und Batch API für wiederholte oder großskalige Workloads.

Grounding

Search Grounding + URL‑Kontext

Search Grounding und URL‑Kontext werden unterstützt (Google Maps Grounding nicht).

Gemini 3 Flash Preview API FAQs

Everything you need to know about the product and billing.

Gemini 3 Flash ist ein ausgewogenes Modell für Speed, Scale und starkes Reasoning. Es ist für Alltags‑Tasks, agentisches Coding und multimodales Long‑Context‑Verständnis gebaut — ein praktisches Default‑Modell für Produktion.

Der offizielle Preview‑Name ist "gemini-3-flash-preview". Verwenden Sie diesen exakten Identifier in Requests.

Text, Bild, Video, Audio und PDF als Input, Text‑Output. Ermöglicht Mixed‑Media‑Summary, Extraction und QA in einem Workflow.

Bis zu 1.048.576 Input‑Tokens und 65.536 Output‑Tokens — ideal für lange Dokumente, Codebases oder Multi‑Turn‑Sessions.

Function Calling, Structured Outputs, Code Execution, File Search, Thinking, Context Caching und Batch API. Search Grounding und URL‑Kontext werden unterstützt, ebenso multimodale Function‑Responses und Code Execution mit Bildern.

Bild‑ und Audio‑Generierung sowie die Live API werden nicht unterstützt. Google‑Maps‑Grounding ist für dieses Modell nicht verfügbar.

Letztes Update: Dezember 2025. Knowledge Cutoff: Januar 2025.

EvoLink unterstützt OpenAI‑SDK‑Format (POST /v1/chat/completions) und Google‑Native‑API‑Format (POST /v1beta/models/gemini-3-flash-preview:{method}) mit generateContent oder streamGenerateContent. Authorization: Bearer <token> im Header hinzufügen.

Gemini 3 Flash Preview kostet $0.50 Input / $3.00 Output pro 1M Tokens, verglichen mit Gemini 3.1 Pro bei $2.00 / $12.00. Flash ist damit je nach Output-Anteil ca. 4-6x günstiger. Flash ist auf Geschwindigkeit und Durchsatz optimiert, Pro eignet sich für Aufgaben, die tieferes Reasoning erfordern.

Ja. Gemini 3 Flash Preview akzeptiert Audio-Input zu $1.00 pro 1M Tokens neben Text, Bild, Video und PDF. Audio-Output und die Live API werden nicht unterstützt.

Wo sich Gemini 3 Flash in der Gemini-Familie einordnet

Gemini 3 Flash Preview ist das geschwindigkeitsoptimierte Gemini-3-Modell. Es verarbeitet Text, Bilder, Video, Audio und PDFs zu 6× niedrigeren Kosten als Gemini 3 Pro. Für Aufgaben, die tieferes Reasoning erfordern, wechseln Sie zu Gemini 3.1 Pro. Wechseln Sie zu Pro für anspruchsvolleres Reasoning oder zu Flash Lite für noch niedrigere Kosten.

Gemini API Family Gemini 3.1 Pro Preview Gemini 3.1 Flash Lite Gemini 2.5 Flash