API Gemini 3 Flash Preview
Accédez à Gemini 3 Flash Preview de Google (gemini-3-flash-preview) via EvoLink avec compatibilité OpenAI SDK et support natif Gemini API. Envoyez du texte, des images, de la vidéo, de l’audio et des PDF avec 1 048 576 tokens de contexte, plus options de caching et batch pour la production.
PRICING
| PLAN | CONTEXT WINDOW | MAX OUTPUT | INPUT | OUTPUT | CACHE READ |
|---|---|---|---|---|---|
| Gemini 3 Flash | 1.05M | 65.5K | ≤200.0K$0.400-20% $0.500Official Price >200.0K$0.400-20% $0.500Official Price | ≤200.0K$2.40-20% $3.00Official Price >200.0K$2.40-20% $3.00Official Price | ≤200.0K$0.040-19% $0.050Official Price >200.0K$0.040-19% $0.050Official Price |
| Gemini 3 Flash (Beta) | 1.05M | 65.5K | ≤200.0K$0.130-74% $0.500Official Price >200.0K$0.130-74% $0.500Official Price | ≤200.0K$0.780-74% $3.00Official Price >200.0K$0.780-74% $3.00Official Price | ≤200.0K$0.013-74% $0.050Official Price >200.0K$0.013-74% $0.050Official Price |
Pricing Note: Price unit: USD / 1M tokens
Cache Hit: Price applies to cached prompt tokens.
Two ways to run Gemini 3 Flash — pick the tier that matches your workload.
- · Gemini 3 Flash: the default tier for production reliability and predictable availability.
- · Gemini 3 Flash (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.
API Gemini 3 Flash Preview sur EvoLink
Pensé pour la vitesse et l’échelle, Gemini 3 Flash Preview comprend texte, images, vidéo, audio et PDFs et gère un contexte massif (jusqu’à 1M tokens). Il fournit des réponses claires pour assistants temps réel, compréhension documentaire et analyse média.

Ce que vous pouvez construire avec Gemini 3 Flash Preview
Entrées multimodales, sorties texte fiables
Une seule requête peut inclure texte, images, vidéo, audio ou PDF et renvoyer un output texte. Idéal pour résumer des réunions, analyser des médias et extraire des insights structurés sans pipelines séparés.

Contexte 1M tokens pour sessions longues
Jusqu’à 1 048 576 tokens en entrée et 65 536 tokens en sortie par requête. Vous pouvez garder documents longs, codebases ou chats multi‑tours dans un contexte cohérent.

Outils, grounding et raisonnement
Utilisez thinking et structured outputs avec function calling, exécution de code, recherche de fichiers, search grounding et contexte d’URL. Batch API et caching sont pris en charge pour l’échelle et le contrôle des coûts.

Pourquoi EvoLink pour Gemini 3 Flash Preview
Exécutez gemini-3-flash-preview via OpenAI SDK ou Google Native API avec les capacités officielles Gemini et la tarification associée.
Une intégration, deux formats
Appelez Gemini 3 Flash Preview au format OpenAI SDK ou Gemini natif sans changer la logique de l’app.
Économies batch + caching
Le batch processing et le context caching réduisent les coûts de répétition tout en scalant des workloads élevés.
Prêt pour la production
Entrées multimodales, long contexte et support d’outils couvrent assistants, analyses et automatisations en production.
Comment appeler Gemini 3 Flash Preview
Choisissez le format OpenAI SDK ou Google Native API, puis envoyez la requête.
Étape 1 - Choisir le format API
Format OpenAI SDK : POST /v1/chat/completions avec model "gemini-3-flash-preview". Format API native : POST /v1beta/models/gemini-3-flash-preview:{method} avec generateContent ou streamGenerateContent.
Étape 2 - Ajouter auth et inputs
Inclure Authorization: Bearer <token>. Envoyer messages/contents avec texte ou parties multimodales (image, vidéo, audio, PDF).
Étape 3 - Streamer ou scaler
Activez le streaming pour une UX temps réel, ou utilisez X-Async-Mode pour une task ID. Combinez batch et caching pour des runs à coût optimisé.
Specs techniques
Capacités officielles du modèle gemini-3-flash-preview
1 048 576 tokens d’entrée
Jusqu’à 1 048 576 tokens en entrée et 65 536 tokens en sortie.
Entrées multimodales
Texte, image, vidéo, audio et PDF en entrée, sortie texte.
Thinking + structured outputs
Thinking et structured outputs pour des résultats fiables et machine‑lisibles.
Function calling + outils
Function calling, exécution de code et recherche de fichiers supportés.
Caching + batch
Context caching et Batch API pour des workloads répétés ou à grande échelle.
Search grounding + contexte d’URL
Search grounding et contexte d’URL supportés (pas de grounding Google Maps).
FAQ API Gemini 3 Flash Preview
Everything you need to know about the product and billing.