Seedance 2.0 API — Coming SoonGet early access

Gemini 3 Flash Preview API

Greifen Sie über EvoLink auf Googles Gemini 3 Flash Preview (gemini-3-flash-preview) zu — OpenAI‑SDK‑kompatibel und mit nativer Gemini‑API‑Unterstützung. Senden Sie Text, Bild, Video, Audio und PDF mit 1.048.576 Token Kontext sowie Caching‑ und Batch‑Optionen für Produktions‑Workloads.

Run With API
Using coding CLIs? Run Gemini 3 Flash via EvoCode — One API for Code Agents & CLIs. (View Docs)
$

PRICING

PLANCONTEXT WINDOWMAX OUTPUTINPUTOUTPUTCACHE READ
Gemini 3 Flash1.05M65.5K
200.0K$0.400-20%
$0.500Official Price
>200.0K$0.400-20%
$0.500Official Price
200.0K$2.40-20%
$3.00Official Price
>200.0K$2.40-20%
$3.00Official Price
200.0K$0.040-19%
$0.050Official Price
>200.0K$0.040-19%
$0.050Official Price
Gemini 3 Flash (Beta)1.05M65.5K
200.0K$0.130-74%
$0.500Official Price
>200.0K$0.130-74%
$0.500Official Price
200.0K$0.780-74%
$3.00Official Price
>200.0K$0.780-74%
$3.00Official Price
200.0K$0.013-74%
$0.050Official Price
>200.0K$0.013-74%
$0.050Official Price

Pricing Note: Price unit: USD / 1M tokens

Cache Hit: Price applies to cached prompt tokens.

Two ways to run Gemini 3 Flash — pick the tier that matches your workload.

  • · Gemini 3 Flash: the default tier for production reliability and predictable availability.
  • · Gemini 3 Flash (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.

Gemini 3 Flash Preview API auf EvoLink

Für Geschwindigkeit und Scale gebaut: Gemini 3 Flash Preview versteht Text, Bilder, Video, Audio und PDFs und verarbeitet enorme Kontexte (bis 1M Tokens). Ideal für Echtzeit‑Assistenten, Dokument‑Verständnis und Medienanalyse.

Gemini 3 Flash Preview API

Was Sie mit Gemini 3 Flash Preview bauen können

Multimodale Inputs, zuverlässige Text‑Outputs

Eine Anfrage kann Text, Bilder, Video, Audio oder PDFs enthalten und Text‑Output zurückgeben. Damit lassen sich Meetings zusammenfassen, Medien prüfen und strukturierte Insights extrahieren — ohne getrennte Pipelines.

Multimodale Inputs

1M‑Token‑Kontext für lange Sessions

Bis zu 1.048.576 Input‑Tokens und 65.536 Output‑Tokens pro Request. So bleiben lange Dokumente, Codebases oder Multi‑Turn‑Chats in einem konsistenten Kontext.

Long context

Tools, Grounding und Reasoning

Nutzen Sie Thinking und Structured Outputs mit Function Calling, Code Execution, File Search, Search Grounding und URL‑Kontext. Batch API und Caching werden für Scale und Kostenkontrolle unterstützt.

Tooling

Warum EvoLink für Gemini 3 Flash Preview

Führen Sie gemini-3-flash-preview im OpenAI‑SDK‑ oder Google‑Native‑API‑Format mit offiziellen Gemini‑Funktionen und Pricing aus.

Eine Integration, zwei Formate

Gemini 3 Flash Preview im OpenAI‑SDK‑ oder nativen Gemini‑Format aufrufen, ohne App‑Logik zu ändern.

Batch + Caching‑Savings

Batch‑Processing und Context‑Caching senken Wiederholungskosten bei sicheren High‑Volume‑Workloads.

Ready für Produktion

Multimodale Inputs, Long‑Context und Tool‑Support decken echte Produktions‑Assistenten, Analysen und Automationen ab.

So rufen Sie Gemini 3 Flash Preview auf

Wählen Sie OpenAI‑SDK‑ oder Google‑Native‑API‑Format und senden Sie Ihre Anfrage.

1

Schritt 1 - API‑Format wählen

OpenAI‑SDK‑Format: POST /v1/chat/completions mit model "gemini-3-flash-preview". Native API‑Format: POST /v1beta/models/gemini-3-flash-preview:{method} mit generateContent oder streamGenerateContent.

2

Schritt 2 - Auth und Inputs hinzufügen

Authorization: Bearer <token> senden. Messages/Contents mit Text oder multimodalen Parts (Bild, Video, Audio, PDF) übergeben.

3

Schritt 3 - Streamen oder Skalieren

Streaming für Echtzeit‑UX aktivieren oder X‑Async‑Mode für eine Task‑ID nutzen. Batch + Caching für kosteneffiziente High‑Volume‑Runs kombinieren.

Technische Specs

Offizielle Modell‑Capabilities für gemini-3-flash-preview

Kontext

1.048.576 Input‑Tokens

Bis zu 1.048.576 Input‑Tokens und 65.536 Output‑Tokens.

Multimodal

Multimodale Inputs

Text, Bild, Video, Audio und PDF als Input, Text als Output.

Reasoning

Thinking + Structured Outputs

Thinking und strukturierte Outputs für zuverlässige, maschinenlesbare Ergebnisse.

Tools

Function Calling + Tools

Function Calling, Code Execution und File Search werden unterstützt.

Scale

Caching + Batch

Context‑Caching und Batch API für wiederholte oder großskalige Workloads.

Grounding

Search Grounding + URL‑Kontext

Search Grounding und URL‑Kontext werden unterstützt (Google Maps Grounding nicht).

Gemini 3 Flash Preview API FAQs

Everything you need to know about the product and billing.

Gemini 3 Flash ist ein ausgewogenes Modell für Speed, Scale und starkes Reasoning. Es ist für Alltags‑Tasks, agentisches Coding und multimodales Long‑Context‑Verständnis gebaut — ein praktisches Default‑Modell für Produktion.
Der offizielle Preview‑Name ist "gemini-3-flash-preview". Verwenden Sie diesen exakten Identifier in Requests.
Text, Bild, Video, Audio und PDF als Input, Text‑Output. Ermöglicht Mixed‑Media‑Summary, Extraction und QA in einem Workflow.
Bis zu 1.048.576 Input‑Tokens und 65.536 Output‑Tokens — ideal für lange Dokumente, Codebases oder Multi‑Turn‑Sessions.
Function Calling, Structured Outputs, Code Execution, File Search, Thinking, Context Caching und Batch API. Search Grounding und URL‑Kontext werden unterstützt, ebenso multimodale Function‑Responses und Code Execution mit Bildern.
Bild‑ und Audio‑Generierung sowie die Live API werden nicht unterstützt. Google‑Maps‑Grounding ist für dieses Modell nicht verfügbar.
Letztes Update: Dezember 2025. Knowledge Cutoff: Januar 2025.
EvoLink unterstützt OpenAI‑SDK‑Format (POST /v1/chat/completions) und Google‑Native‑API‑Format (POST /v1beta/models/gemini-3-flash-preview:{method}) mit generateContent oder streamGenerateContent. Authorization: Bearer <token> im Header hinzufügen.