API Gemini 3 Flash Preview

Accédez à Gemini 3 Flash Preview de Google (gemini-3-flash-preview) via EvoLink avec compatibilité OpenAI SDK et support natif Gemini API. Envoyez du texte, des images, de la vidéo, de l’audio et des PDF avec 1 048 576 tokens de contexte, plus options de caching et batch pour la production.

Vous utilisez des CLI de codage ? Exécutez Gemini 3 Flash Preview via EvoCode — une seule API pour les agents de code et les CLI. (Voir la doc)

Type de modèle:

✓Gemini 3 Flash Preview

Prix:

$0.466(~ 31.7 credits) par 1M tokens d'entrée; $2.796(~ 190.1 credits) par 1M tokens de sortie

$0.047(~ 3.2 credits) par 1M tokens de lecture de cache; $0.932(~ 63.4 credits) par 1M tokens audio

L'ancrage Google Search est facturé séparément par requête.

Accès géré stable pour les charges de production. Recommandé lorsque vous avez besoin d'une facturation dans le tableau de bord, d'un contrôle des clés API et d'un comportement d'intégration prévisible.

Le même endpoint API est utilisé pour toutes les versions. Seul le paramètre model change.

PRICING

PLAN	CONTEXT WINDOW	MAX OUTPUT	INPUT	OUTPUT	CACHE READ	AUDIO INPUT
Gemini 3 Flash	1,050,000	65,536	$0.467-7% (31.7 Credits)	$2.796-7% (190.1 Credits)	$0.048-6% (3.2 Credits)	$0.933-7% (63.4 Credits)
Web Search Tool Server-side web search capability						$0.014/search (0.89 Credits)

Pricing Note: Prices show both USD and Credits. Units default to / 1M tokens unless noted separately.

Cache Hit: Price applies to cached prompt tokens.

Audio Input: Audio tokens charged at a separate rate.

API Gemini 3 Flash Preview sur EvoLink

Name: EvoLink AI Model API Platform
Brand: EvoLink
Availability: InStock

Pensé pour la vitesse et l’échelle, Gemini 3 Flash Preview comprend texte, images, vidéo, audio et PDFs et gère un contexte massif (jusqu’à 1M tokens). Il fournit des réponses claires pour assistants temps réel, compréhension documentaire et analyse média.

Ce que vous pouvez construire avec Gemini 3 Flash Preview

Entrées multimodales, sorties texte fiables

Une seule requête peut inclure texte, images, vidéo, audio ou PDF et renvoyer un output texte. Idéal pour résumer des réunions, analyser des médias et extraire des insights structurés sans pipelines séparés.

Contexte 1M tokens pour sessions longues

Jusqu’à 1 048 576 tokens en entrée et 65 536 tokens en sortie par requête. Vous pouvez garder documents longs, codebases ou chats multi‑tours dans un contexte cohérent.

Outils, grounding et raisonnement

Utilisez thinking et structured outputs avec function calling, exécution de code, recherche de fichiers, search grounding et contexte d’URL. Batch API et caching sont pris en charge pour l’échelle et le contrôle des coûts.

Pourquoi EvoLink pour Gemini 3 Flash Preview

Exécutez gemini-3-flash-preview via OpenAI SDK ou Google Native API avec les capacités officielles Gemini et la tarification associée.

Une intégration, deux formats

Appelez Gemini 3 Flash Preview au format OpenAI SDK ou Gemini natif sans changer la logique de l’app.

Économies batch + caching

Le batch processing et le context caching réduisent les coûts de répétition tout en scalant des workloads élevés.

Prêt pour la production

Entrées multimodales, long contexte et support d’outils couvrent assistants, analyses et automatisations en production.

Comment appeler Gemini 3 Flash Preview

Choisissez le format OpenAI SDK ou Google Native API, puis envoyez la requête.

Étape 1 - Choisir le format API

Format OpenAI SDK : POST /v1/chat/completions avec model "gemini-3-flash-preview". Format API native : POST /v1beta/models/gemini-3-flash-preview:{method} avec generateContent ou streamGenerateContent.

Étape 2 - Ajouter auth et inputs

Inclure Authorization: Bearer <token>. Envoyer messages/contents avec texte ou parties multimodales (image, vidéo, audio, PDF).

Étape 3 - Streamer ou scaler

Activez le streaming pour une UX temps réel, ou utilisez X-Async-Mode pour une task ID. Combinez batch et caching pour des runs à coût optimisé.

Specs techniques

Capacités officielles du modèle gemini-3-flash-preview

Contexte

1 048 576 tokens d’entrée

Jusqu’à 1 048 576 tokens en entrée et 65 536 tokens en sortie.

Multimodal

Entrées multimodales

Texte, image, vidéo, audio et PDF en entrée, sortie texte.

Raisonnement

Thinking + structured outputs

Thinking et structured outputs pour des résultats fiables et machine‑lisibles.

Outils

Function calling + outils

Function calling, exécution de code et recherche de fichiers supportés.

Scale

Caching + batch

Context caching et Batch API pour des workloads répétés ou à grande échelle.

Grounding

Search grounding + contexte d’URL

Search grounding et contexte d’URL supportés (pas de grounding Google Maps).

FAQ API Gemini 3 Flash Preview

Everything you need to know about the product and billing.

Gemini 3 Flash est un modèle équilibré pour la vitesse, l’échelle et un raisonnement solide. Conçu pour les tâches du quotidien, le code agentique et la compréhension multimodale long‑contexte, il constitue un choix par défaut pratique pour la production.

Le nom officiel du modèle preview est "gemini-3-flash-preview". Utilisez cet identifiant exact dans les requêtes.

Texte, image, vidéo, audio et PDF en entrée, sortie texte. Cela permet résumés, extraction et QA multimédia dans un seul workflow.

Jusqu’à 1 048 576 tokens en entrée et 65 536 tokens en sortie, utile pour documents longs, codebases et sessions multi‑tours.

Function calling, structured outputs, exécution de code, recherche de fichiers, thinking, context caching et Batch API. Search grounding et contexte d’URL sont supportés, ainsi que les réponses d’outils multimodales et l’exécution de code avec images.

La génération d’images, la génération audio et la Live API ne sont pas supportées. Le grounding Google Maps n’est pas supporté pour ce modèle.

Dernière mise à jour : décembre 2025. Knowledge cutoff : janvier 2025.

EvoLink supporte le format OpenAI SDK (POST /v1/chat/completions) et le format Google Native API (POST /v1beta/models/gemini-3-flash-preview:{method}) avec generateContent ou streamGenerateContent. Ajoutez Authorization: Bearer <token> dans l’en‑tête.

Gemini 3 Flash Preview coûte $0.50 input / $3.00 output par 1M tokens, contre $2.00 / $12.00 pour Gemini 3.1 Pro. Flash est environ 4 à 6 fois moins cher selon le ratio de sortie. Flash est optimisé pour la vitesse et le débit ; Pro convient aux tâches nécessitant un raisonnement plus approfondi.

Oui. Gemini 3 Flash Preview accepte l'entrée audio à $1.00 par 1M tokens en plus du texte, de l'image, de la vidéo et du PDF. La sortie audio et la Live API ne sont pas prises en charge.

Où se situe Gemini 3 Flash dans la famille Gemini

Gemini 3 Flash Preview est le modèle Gemini 3 optimisé pour la vitesse. Il traite texte, images, vidéo, audio et PDF à un coût 6× inférieur à Gemini 3 Pro. Pour les tâches nécessitant un raisonnement plus approfondi, passez à Gemini 3.1 Pro. Passez à Pro pour un raisonnement plus poussé, ou à Flash Lite pour un coût encore plus bas.

Gemini API Family Gemini 3.1 Pro Preview Gemini 3.1 Flash Lite Gemini 2.5 Flash