Seedance 2.0 API — Coming SoonGet early access

API Gemini 3 Flash Preview

Accédez à Gemini 3 Flash Preview de Google (gemini-3-flash-preview) via EvoLink avec compatibilité OpenAI SDK et support natif Gemini API. Envoyez du texte, des images, de la vidéo, de l’audio et des PDF avec 1 048 576 tokens de contexte, plus options de caching et batch pour la production.

Run With API
Using coding CLIs? Run Gemini 3 Flash via EvoCode — One API for Code Agents & CLIs. (View Docs)
$

PRICING

PLANCONTEXT WINDOWMAX OUTPUTINPUTOUTPUTCACHE READ
Gemini 3 Flash1.05M65.5K
200.0K$0.400-20%
$0.500Official Price
>200.0K$0.400-20%
$0.500Official Price
200.0K$2.40-20%
$3.00Official Price
>200.0K$2.40-20%
$3.00Official Price
200.0K$0.040-19%
$0.050Official Price
>200.0K$0.040-19%
$0.050Official Price
Gemini 3 Flash (Beta)1.05M65.5K
200.0K$0.130-74%
$0.500Official Price
>200.0K$0.130-74%
$0.500Official Price
200.0K$0.780-74%
$3.00Official Price
>200.0K$0.780-74%
$3.00Official Price
200.0K$0.013-74%
$0.050Official Price
>200.0K$0.013-74%
$0.050Official Price

Pricing Note: Price unit: USD / 1M tokens

Cache Hit: Price applies to cached prompt tokens.

Two ways to run Gemini 3 Flash — pick the tier that matches your workload.

  • · Gemini 3 Flash: the default tier for production reliability and predictable availability.
  • · Gemini 3 Flash (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.

API Gemini 3 Flash Preview sur EvoLink

Pensé pour la vitesse et l’échelle, Gemini 3 Flash Preview comprend texte, images, vidéo, audio et PDFs et gère un contexte massif (jusqu’à 1M tokens). Il fournit des réponses claires pour assistants temps réel, compréhension documentaire et analyse média.

API Gemini 3 Flash Preview

Ce que vous pouvez construire avec Gemini 3 Flash Preview

Entrées multimodales, sorties texte fiables

Une seule requête peut inclure texte, images, vidéo, audio ou PDF et renvoyer un output texte. Idéal pour résumer des réunions, analyser des médias et extraire des insights structurés sans pipelines séparés.

Entrées multimodales

Contexte 1M tokens pour sessions longues

Jusqu’à 1 048 576 tokens en entrée et 65 536 tokens en sortie par requête. Vous pouvez garder documents longs, codebases ou chats multi‑tours dans un contexte cohérent.

Long context

Outils, grounding et raisonnement

Utilisez thinking et structured outputs avec function calling, exécution de code, recherche de fichiers, search grounding et contexte d’URL. Batch API et caching sont pris en charge pour l’échelle et le contrôle des coûts.

Tooling

Pourquoi EvoLink pour Gemini 3 Flash Preview

Exécutez gemini-3-flash-preview via OpenAI SDK ou Google Native API avec les capacités officielles Gemini et la tarification associée.

Une intégration, deux formats

Appelez Gemini 3 Flash Preview au format OpenAI SDK ou Gemini natif sans changer la logique de l’app.

Économies batch + caching

Le batch processing et le context caching réduisent les coûts de répétition tout en scalant des workloads élevés.

Prêt pour la production

Entrées multimodales, long contexte et support d’outils couvrent assistants, analyses et automatisations en production.

Comment appeler Gemini 3 Flash Preview

Choisissez le format OpenAI SDK ou Google Native API, puis envoyez la requête.

1

Étape 1 - Choisir le format API

Format OpenAI SDK : POST /v1/chat/completions avec model "gemini-3-flash-preview". Format API native : POST /v1beta/models/gemini-3-flash-preview:{method} avec generateContent ou streamGenerateContent.

2

Étape 2 - Ajouter auth et inputs

Inclure Authorization: Bearer <token>. Envoyer messages/contents avec texte ou parties multimodales (image, vidéo, audio, PDF).

3

Étape 3 - Streamer ou scaler

Activez le streaming pour une UX temps réel, ou utilisez X-Async-Mode pour une task ID. Combinez batch et caching pour des runs à coût optimisé.

Specs techniques

Capacités officielles du modèle gemini-3-flash-preview

Contexte

1 048 576 tokens d’entrée

Jusqu’à 1 048 576 tokens en entrée et 65 536 tokens en sortie.

Multimodal

Entrées multimodales

Texte, image, vidéo, audio et PDF en entrée, sortie texte.

Raisonnement

Thinking + structured outputs

Thinking et structured outputs pour des résultats fiables et machine‑lisibles.

Outils

Function calling + outils

Function calling, exécution de code et recherche de fichiers supportés.

Scale

Caching + batch

Context caching et Batch API pour des workloads répétés ou à grande échelle.

Grounding

Search grounding + contexte d’URL

Search grounding et contexte d’URL supportés (pas de grounding Google Maps).

FAQ API Gemini 3 Flash Preview

Everything you need to know about the product and billing.

Gemini 3 Flash est un modèle équilibré pour la vitesse, l’échelle et un raisonnement solide. Conçu pour les tâches du quotidien, le code agentique et la compréhension multimodale long‑contexte, il constitue un choix par défaut pratique pour la production.
Le nom officiel du modèle preview est "gemini-3-flash-preview". Utilisez cet identifiant exact dans les requêtes.
Texte, image, vidéo, audio et PDF en entrée, sortie texte. Cela permet résumés, extraction et QA multimédia dans un seul workflow.
Jusqu’à 1 048 576 tokens en entrée et 65 536 tokens en sortie, utile pour documents longs, codebases et sessions multi‑tours.
Function calling, structured outputs, exécution de code, recherche de fichiers, thinking, context caching et Batch API. Search grounding et contexte d’URL sont supportés, ainsi que les réponses d’outils multimodales et l’exécution de code avec images.
La génération d’images, la génération audio et la Live API ne sont pas supportées. Le grounding Google Maps n’est pas supporté pour ce modèle.
Dernière mise à jour : décembre 2025. Knowledge cutoff : janvier 2025.
EvoLink supporte le format OpenAI SDK (POST /v1/chat/completions) et le format Google Native API (POST /v1beta/models/gemini-3-flash-preview:{method}) avec generateContent ou streamGenerateContent. Ajoutez Authorization: Bearer <token> dans l’en‑tête.