Seedance 2.0 API — Coming SoonGet early access

Gemini 3 Vista previa de Flash API

Acceda a Gemini 3 Flash Preview de Google (gemini-3-flash-preview) a través de EvoLink con compatibilidad OpenAI SDK y soporte nativo Gemini API. Envíe entradas de texto, imágenes, vídeo, audio y PDF con una ventana de contexto de 1.048.576 tokens, además de opciones de almacenamiento en caché y por lotes para cargas de trabajo de producción.

Run With API
Using coding CLIs? Run Gemini 3 Flash via EvoCode — One API for Code Agents & CLIs. (View Docs)
$

PRICING

PLANCONTEXT WINDOWMAX OUTPUTINPUTOUTPUTCACHE READ
Gemini 3 Flash1.05M65.5K
200.0K$0.400-20%
$0.500Official Price
>200.0K$0.400-20%
$0.500Official Price
200.0K$2.40-20%
$3.00Official Price
>200.0K$2.40-20%
$3.00Official Price
200.0K$0.040-19%
$0.050Official Price
>200.0K$0.040-19%
$0.050Official Price
Gemini 3 Flash (Beta)1.05M65.5K
200.0K$0.130-74%
$0.500Official Price
>200.0K$0.130-74%
$0.500Official Price
200.0K$0.780-74%
$3.00Official Price
>200.0K$0.780-74%
$3.00Official Price
200.0K$0.013-74%
$0.050Official Price
>200.0K$0.013-74%
$0.050Official Price

Pricing Note: Price unit: USD / 1M tokens

Cache Hit: Price applies to cached prompt tokens.

Two ways to run Gemini 3 Flash — pick the tier that matches your workload.

  • · Gemini 3 Flash: the default tier for production reliability and predictable availability.
  • · Gemini 3 Flash (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.

Gemini 3 Vista previa de Flash API en EvoLink

Diseñado para ofrecer velocidad y escala, Gemini 3 Flash Preview comprende texto, imágenes, videos, audio y archivos PDF, y maneja un contexto masivo (hasta 1 millón de tokens). Ofrece respuestas claras y confiables para asistentes en tiempo real, comprensión de documentos y análisis de medios.

Gemini 3 Vista previa de Flash API

Lo que puedes construir con Gemini 3 Flash Preview

Entradas multimodales, salidas de texto confiables

Una sola solicitud puede incluir texto, imágenes, video, audio o archivos PDF y devolver una salida de texto. Esto facilita resumir reuniones, revisar medios y extraer información estructurada sin canales separados.

Entradas multimodales

Contexto de 1 millón de tokens para sesiones largas

Maneje hasta 1.048.576 tokens de entrada y 65.536 tokens de salida en una sola solicitud. Eso le permite mantener documentos extensos, bases de código o chats de varios turnos en un contexto coherente.

Contexto largo

Herramientas, conexión a tierra y razonamiento

Utilice resultados pensados ​​y estructurados con llamadas a funciones, ejecución de código, búsqueda de archivos, base de búsqueda y contexto URL. Se admiten el lote API y el almacenamiento en caché para controlar la escala y los costos.

Estampación

Por qué utilizar EvoLink para Gemini 3 Vista previa de Flash

Ejecute gemini-3-flash-preview mediante el formato OpenAI SDK o el formato Google nativo API con capacidades y precios oficiales de Gemini.

Una integración, dos formatos

Llame a Gemini 3 Flash Preview en OpenAI SDK o formato nativo Gemini sin cambiar la lógica de la aplicación.

Ahorro en lotes y almacenamiento en caché

Utilice el procesamiento por lotes y el almacenamiento en caché de contexto para reducir los costos de repetición mientras escala cargas de trabajo de gran volumen de forma segura.

Listo para uso en producción

Las entradas multimodales, el contexto extenso y el soporte de herramientas cubren asistentes de producción reales, análisis y flujos de trabajo de automatización.

Cómo llamar a Gemini 3 Vista previa de Flash

Elija el formato OpenAI SDK o Google Nativo API y luego envíe su solicitud.

1

Paso 1: elija el formato API

OpenAI SDK formato: POST /v1/chat/completions con modelo "gemini-3-flash-preview". Formato nativo API: POST /v1beta/models/gemini-3-flash-preview:{method} con método generateContent o streamGenerateContent.

2

Paso 2: agregar autenticación y entradas

Incluir autorización: Portador <token>. Envía mensajes/contenidos con texto o partes multimodales (imagen, vídeo, audio, PDF).

3

Paso 3: transmitir o escalar

Habilite la transmisión para UX en tiempo real o use X-Async-Mode para devolver una ID de tarea. Combine el almacenamiento en caché y por lotes para realizar ejecuciones de gran volumen rentables.

Especificaciones técnicas

Capacidades oficiales del modelo para gemini-3-flash-preview

Contexto

1.048.576 tokens de entrada

Hasta 1.048.576 tokens de entrada y 65.536 tokens de salida.

Multimodal

Entradas multimodales

Entradas de texto, imágenes, vídeo, audio y PDF con salida de texto.

Razonamiento

Pensamiento + Resultados Estructurados

Se admiten resultados de pensamiento y estructurados para obtener resultados confiables y legibles por máquina.

Herramientas

Llamada a funciones + herramientas

Se admiten llamadas de funciones, ejecución de código y búsqueda de archivos.

Escala

Almacenamiento en caché + lote

El almacenamiento en caché de contexto y el lote API se admiten para cargas de trabajo repetidas o de gran escala.

Toma de tierra

Conexión a tierra de búsqueda + contexto URL

Se admiten la conexión a tierra de búsqueda y el contexto URL (la conexión a tierra de Google Maps no lo es).

Gemini 3 Vista previa de Flash API Preguntas frecuentes

Everything you need to know about the product and billing.

Gemini 3 Flash es un modelo equilibrado creado para ofrecer velocidad, escala y razonamiento sólido. Está diseñado para tareas cotidianas, codificación agente y comprensión multimodal de contexto largo, lo que lo convierte en un valor predeterminado práctico para cargas de trabajo de producción.
El nombre oficial del modelo de vista previa es "gemini-3-flash-preview". Utilice este identificador exacto en las solicitudes.
Gemini 3 Flash Preview admite entradas de texto, imágenes, videos, audio y PDF, y devuelve salida de texto. Esto permite resumir, extraer y responder preguntas en medios mixtos en un único flujo de trabajo.
Admite hasta 1.048.576 tokens de entrada y 65.536 tokens de salida, lo que brinda una gran ventana de contexto para documentos extensos, bases de código o sesiones de varios turnos.
Admite llamadas a funciones, salidas estructuradas, ejecución de código, búsqueda de archivos, pensamiento, almacenamiento en caché de contexto y Batch API. Se admiten la base de búsqueda y el contexto URL, junto con respuestas de funciones multimodales y ejecución de código con imágenes.
No se admiten la generación de imágenes, la generación de audio y Live API. La conexión a tierra con Google Maps tampoco es compatible con este modelo.
La última actualización figura en diciembre de 2025 y el límite de conocimiento es enero de 2025.
EvoLink admite el formato OpenAI SDK (POST /v1/chat/completions) y el formato Google nativo API (POST /v1beta/models/gemini-3-flash-preview:{method}) usando generateContent o streamGenerateContent. Agregue Autorización: Portador <token> en el encabezado de la solicitud.