API Gemini 3 Flash Preview
- One API for Code Agents & CLIs. (View Docs)
$0.400(~ 28.8 credits) per 1M input tokens; $2.400(~ 172.8 credits) per 1M output tokens
$0.040(~ 2.9 credits) per 1M cache read tokens; $0.800(~ 57.6 credits) per 1M audio tokens
Google Search grounding charged separately per query.
Stabilité maximale avec une disponibilité garantie de 99,9 %. Recommandé pour la production.
Le même endpoint API est utilisé pour toutes les versions. Seul le paramètre model change.
API Gemini 3 Flash Preview sur EvoLink
Pensé pour la vitesse et l’échelle, Gemini 3 Flash Preview comprend texte, images, vidéo, audio et PDFs et gère un contexte massif (jusqu’à 1M tokens). Il fournit des réponses claires pour assistants temps réel, compréhension documentaire et analyse média.

Ce que vous pouvez construire avec Gemini 3 Flash Preview
Entrées multimodales, sorties texte fiables
Une seule requête peut inclure texte, images, vidéo, audio ou PDF et renvoyer un output texte. Idéal pour résumer des réunions, analyser des médias et extraire des insights structurés sans pipelines séparés.

Contexte 1M tokens pour sessions longues
Jusqu’à 1 048 576 tokens en entrée et 65 536 tokens en sortie par requête. Vous pouvez garder documents longs, codebases ou chats multi‑tours dans un contexte cohérent.

Outils, grounding et raisonnement
Utilisez thinking et structured outputs avec function calling, exécution de code, recherche de fichiers, search grounding et contexte d’URL. Batch API et caching sont pris en charge pour l’échelle et le contrôle des coûts.

Pourquoi EvoLink pour Gemini 3 Flash Preview
Exécutez gemini-3-flash-preview via OpenAI SDK ou Google Native API avec les capacités officielles Gemini et la tarification associée.
Une intégration, deux formats
Appelez Gemini 3 Flash Preview au format OpenAI SDK ou Gemini natif sans changer la logique de l’app.
Économies batch + caching
Le batch processing et le context caching réduisent les coûts de répétition tout en scalant des workloads élevés.
Prêt pour la production
Entrées multimodales, long contexte et support d’outils couvrent assistants, analyses et automatisations en production.
Comment appeler Gemini 3 Flash Preview
Choisissez le format OpenAI SDK ou Google Native API, puis envoyez la requête.
Étape 1 - Choisir le format API
Format OpenAI SDK : POST /v1/chat/completions avec model "gemini-3-flash-preview". Format API native : POST /v1beta/models/gemini-3-flash-preview:{method} avec generateContent ou streamGenerateContent.
Étape 2 - Ajouter auth et inputs
Inclure Authorization: Bearer <token>. Envoyer messages/contents avec texte ou parties multimodales (image, vidéo, audio, PDF).
Étape 3 - Streamer ou scaler
Activez le streaming pour une UX temps réel, ou utilisez X-Async-Mode pour une task ID. Combinez batch et caching pour des runs à coût optimisé.
Specs techniques
Capacités officielles du modèle gemini-3-flash-preview
1 048 576 tokens d’entrée
Jusqu’à 1 048 576 tokens en entrée et 65 536 tokens en sortie.
Entrées multimodales
Texte, image, vidéo, audio et PDF en entrée, sortie texte.
Thinking + structured outputs
Thinking et structured outputs pour des résultats fiables et machine‑lisibles.
Function calling + outils
Function calling, exécution de code et recherche de fichiers supportés.
Caching + batch
Context caching et Batch API pour des workloads répétés ou à grande échelle.
Search grounding + contexte d’URL
Search grounding et contexte d’URL supportés (pas de grounding Google Maps).
FAQ API Gemini 3 Flash Preview
Everything you need to know about the product and billing.