Gemini 3 Vista previa de Flash API
Acceda a Gemini 3 Flash Preview de Google (gemini-3-flash-preview) a través de EvoLink con compatibilidad OpenAI SDK y soporte nativo Gemini API. Envíe entradas de texto, imágenes, vídeo, audio y PDF con una ventana de contexto de 1.048.576 tokens, además de opciones de almacenamiento en caché y por lotes para cargas de trabajo de producción.
PRICING
| PLAN | CONTEXT WINDOW | MAX OUTPUT | INPUT | OUTPUT | CACHE READ |
|---|---|---|---|---|---|
| Gemini 3 Flash | 1.05M | 65.5K | ≤200.0K$0.400-20% $0.500Official Price >200.0K$0.400-20% $0.500Official Price | ≤200.0K$2.40-20% $3.00Official Price >200.0K$2.40-20% $3.00Official Price | ≤200.0K$0.040-19% $0.050Official Price >200.0K$0.040-19% $0.050Official Price |
| Gemini 3 Flash (Beta) | 1.05M | 65.5K | ≤200.0K$0.130-74% $0.500Official Price >200.0K$0.130-74% $0.500Official Price | ≤200.0K$0.780-74% $3.00Official Price >200.0K$0.780-74% $3.00Official Price | ≤200.0K$0.013-74% $0.050Official Price >200.0K$0.013-74% $0.050Official Price |
Pricing Note: Price unit: USD / 1M tokens
Cache Hit: Price applies to cached prompt tokens.
Two ways to run Gemini 3 Flash — pick the tier that matches your workload.
- · Gemini 3 Flash: the default tier for production reliability and predictable availability.
- · Gemini 3 Flash (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.
Gemini 3 Vista previa de Flash API en EvoLink
Diseñado para ofrecer velocidad y escala, Gemini 3 Flash Preview comprende texto, imágenes, videos, audio y archivos PDF, y maneja un contexto masivo (hasta 1 millón de tokens). Ofrece respuestas claras y confiables para asistentes en tiempo real, comprensión de documentos y análisis de medios.

Lo que puedes construir con Gemini 3 Flash Preview
Entradas multimodales, salidas de texto confiables
Una sola solicitud puede incluir texto, imágenes, video, audio o archivos PDF y devolver una salida de texto. Esto facilita resumir reuniones, revisar medios y extraer información estructurada sin canales separados.

Contexto de 1 millón de tokens para sesiones largas
Maneje hasta 1.048.576 tokens de entrada y 65.536 tokens de salida en una sola solicitud. Eso le permite mantener documentos extensos, bases de código o chats de varios turnos en un contexto coherente.

Herramientas, conexión a tierra y razonamiento
Utilice resultados pensados y estructurados con llamadas a funciones, ejecución de código, búsqueda de archivos, base de búsqueda y contexto URL. Se admiten el lote API y el almacenamiento en caché para controlar la escala y los costos.

Por qué utilizar EvoLink para Gemini 3 Vista previa de Flash
Ejecute gemini-3-flash-preview mediante el formato OpenAI SDK o el formato Google nativo API con capacidades y precios oficiales de Gemini.
Una integración, dos formatos
Llame a Gemini 3 Flash Preview en OpenAI SDK o formato nativo Gemini sin cambiar la lógica de la aplicación.
Ahorro en lotes y almacenamiento en caché
Utilice el procesamiento por lotes y el almacenamiento en caché de contexto para reducir los costos de repetición mientras escala cargas de trabajo de gran volumen de forma segura.
Listo para uso en producción
Las entradas multimodales, el contexto extenso y el soporte de herramientas cubren asistentes de producción reales, análisis y flujos de trabajo de automatización.
Cómo llamar a Gemini 3 Vista previa de Flash
Elija el formato OpenAI SDK o Google Nativo API y luego envíe su solicitud.
Paso 1: elija el formato API
OpenAI SDK formato: POST /v1/chat/completions con modelo "gemini-3-flash-preview". Formato nativo API: POST /v1beta/models/gemini-3-flash-preview:{method} con método generateContent o streamGenerateContent.
Paso 2: agregar autenticación y entradas
Incluir autorización: Portador <token>. Envía mensajes/contenidos con texto o partes multimodales (imagen, vídeo, audio, PDF).
Paso 3: transmitir o escalar
Habilite la transmisión para UX en tiempo real o use X-Async-Mode para devolver una ID de tarea. Combine el almacenamiento en caché y por lotes para realizar ejecuciones de gran volumen rentables.
Especificaciones técnicas
Capacidades oficiales del modelo para gemini-3-flash-preview
1.048.576 tokens de entrada
Hasta 1.048.576 tokens de entrada y 65.536 tokens de salida.
Entradas multimodales
Entradas de texto, imágenes, vídeo, audio y PDF con salida de texto.
Pensamiento + Resultados Estructurados
Se admiten resultados de pensamiento y estructurados para obtener resultados confiables y legibles por máquina.
Llamada a funciones + herramientas
Se admiten llamadas de funciones, ejecución de código y búsqueda de archivos.
Almacenamiento en caché + lote
El almacenamiento en caché de contexto y el lote API se admiten para cargas de trabajo repetidas o de gran escala.
Conexión a tierra de búsqueda + contexto URL
Se admiten la conexión a tierra de búsqueda y el contexto URL (la conexión a tierra de Google Maps no lo es).
Gemini 3 Vista previa de Flash API Preguntas frecuentes
Everything you need to know about the product and billing.