Gemini API Family
Compara las rutas Gemini de EvoLink para razonamiento flagship, Flash de baja latencia, contexto largo y comprension multimodal.
6 rutas
Niveles Pro, Flash y Lite para cada presupuesto
Acceso API unificado
Compatible con OpenAI, una clave para todo Gemini
Elige por workflow
Asigna Pro vs Flash vs Lite a tu tarea
Comparar rutas Gemini API
Empieza por el workload: razonamiento flagship, trafico Flash de produccion, extraccion de bajo costo o analisis multimodal de contexto largo.
| Ruta | Ideal para | Precios | Ventana de contexto | Modalidad | Estado |
|---|---|---|---|---|---|
Gemini 3.1 Pro Preview Razonamiento flagship | Maxima calidad Gemini para razonamiento, codigo, agentes y analisis de contexto largo. | $2/$12 <=200K; $4/$18 >200K | 1M input / 64K output | Texto, codigo, imagen, video, audio, PDF de entrada | Preview flagship |
Gemini 3 Flash Preview Gemini 3 rapido | Apps multimodales de baja latencia que necesitan comportamiento Gemini 3. | $0.50/$3.00 per MTok (audio in: $1.00) | 1M input / 64K output | Texto, imagen, video, audio, PDF de entrada | Preview route |
Gemini 3.1 Flash Lite Preview Gemini 3 mas barato | Traduccion, clasificacion, extraccion y procesamiento de texto por lotes a alto volumen. | $0.25/$1.50 per MTok (audio in: $0.50) | 1M input / 64K output | Texto, imagen, video, audio, PDF de entrada | Preview route |
Gemini 2.5 Pro Pro estable | Razonamiento de produccion, ayuda de codigo, analisis y tareas multimodales complejas. | $1.25/$10 <=200K; $2.50/$15 >200K | 1M input / 64K output | Texto, imagen, video, audio, PDF de entrada | Stable deep reasoning |
Gemini 2.5 Flash Flash produccion | Chat rapido, extraccion, resumenes y trafico multimodal de produccion. | $0.30/$2.50 per MTok (audio in: $1.00) | 1M input / 64K output | Texto, imagen, video, audio, PDF de entrada | Production workhorse |
Gemini 2.5 Flash Lite Menor costo | Clasificacion, extraccion, enrutamiento y flujos de chat ligeros a alto volumen. | $0.10/$0.40 per MTok (audio in: $0.30) | 1M input / 64K output | Texto y audio de entrada | Lowest-cost text route |
Como decidir que modelo Gemini usar
Sigue estas 4 reglas para acotar tu eleccion entre los niveles Pro, Flash y Lite.
Empieza por la profundidad de razonamiento
Agentes de codigo complejos, uso de herramientas multietapa, analisis profundo de documentos y salida de alta precision — empieza con Gemini 3.1 Pro o Gemini 2.5 Pro.
Luego revisa las necesidades de latencia y rendimiento
Chat de produccion, bots de soporte, extraccion en tiempo real y apps multimodales de alta frecuencia — compara Gemini 3 Flash o Gemini 2.5 Flash.
Luego revisa la sensibilidad al coste
Clasificacion de alto volumen, procesamiento de texto por lotes, enrutamiento y extraccion ligera — compara Gemini 3.1 Flash Lite o Gemini 2.5 Flash Lite.
Por ultimo, considera workflows de complejidad mixta
Si la misma pipeline mezcla clasificacion simple con pasos de razonamiento profundo, considera EvoLink Smart Router en vez de codificar un solo modelo Gemini.
Smart Router →Si ya conoces tu tipo de tarea, encuentra el punto de partida recomendado en la tabla siguiente.
Elige un modelo Gemini por workflow: razonamiento, velocidad, coste y tareas multimodales
Asigna tu tarea principal a la ruta Gemini adecuada.
| Tu tarea | Inicio recomendado | Buena opcion si… | Ten en cuenta |
|---|---|---|---|
| Razonamiento complejo y agentes de codigo | Gemini 3.1 Pro | Necesitas la mayor calidad de razonamiento Gemini, uso de herramientas multietapa o analisis profundo de codigo | Mayor coste — usa Flash para tareas mas simples |
| Deep reasoning estable con multimodal | Gemini 2.5 Pro | Necesitas razonamiento de nivel produccion con soporte multimodal amplio y estabilidad demostrada | Techo de capacidad ligeramente menor que 3.1 Pro |
| Apps multimodales de baja latencia | Gemini 3 Flash | Necesitas respuestas rapidas con capacidades de generacion Gemini 3 en texto, imagen, audio y video | Ruta preview — verifica requisitos de estabilidad |
| Chat y extraccion de produccion | Gemini 2.5 Flash | Necesitas un modelo de produccion probado para chat, resumenes y extraccion a escala | Buen punto de partida para la mayoria de workloads de produccion |
| Texto por lotes de alto volumen al menor coste | Gemini 2.5 Flash Lite | Las tareas son clasificacion, enrutamiento o respuestas cortas donde el coste es lo mas importante | Limitado a entrada de texto y audio |
| Workflows de texto de complejidad mixta | EvoLink Smart Router | La misma pipeline tiene tareas simples y complejas entre Gemini y otros proveedores | Ideal cuando no quieres logica de enrutamiento manual de modelos |
Workflows de la API Gemini: agentes, chat, documentos y procesamiento multimodal
Descubre como los modelos Gemini encajan en productos reales, agentes y pipelines de procesamiento de contenido.
Agentes de razonamiento y codigo
Para generacion de codigo, correccion de bugs, uso de herramientas multietapa y agentes de analisis complejos. Si la calidad de salida afecta directamente al comportamiento del producto, empieza con Gemini 3.1 Pro. Para estabilidad demostrada, compara Gemini 2.5 Pro.
Chat y soporte de produccion
Para bots de soporte, asistentes in-app, Q&A de base de conocimientos y conversaciones multi-turno de alta frecuencia. Prueba primero con Gemini 2.5 Flash por su rendimiento probado, luego compara Flash Lite para menor coste.
Analisis de documentos largos y multimodal
Para analisis de PDFs, comprension de video, transcripcion de audio y workflows de investigacion multi-archivo. La ventana de contexto de 1M de Gemini y su soporte multimodal nativo hacen de las rutas Pro y Flash opciones solidas.
Enrutamiento de agentes y tareas mixtas
Para workflows donde clasificacion, extraccion, razonamiento y generacion coexisten en la misma pipeline. Usa EvoLink Smart Router para enrutar automaticamente entre Gemini y otros proveedores via evolink/auto.
Ver detalles de cada modelo Gemini
Cada ruta enlaza a una pagina dedicada con precios, especificaciones y detalles de integracion.
Gemini 3.1 Pro Preview
Razonamiento flagship
- Ventana de contexto
- 1M input / 64K output
- Precios
- $2/$12 <=200K; $4/$18 >200K
Gemini 3 Flash Preview
Gemini 3 rapido
- Ventana de contexto
- 1M input / 64K output
- Precios
- $0.50/$3.00 per MTok (audio in: $1.00)
Gemini 3.1 Flash Lite Preview
Gemini 3 mas barato
- Ventana de contexto
- 1M input / 64K output
- Precios
- $0.25/$1.50 per MTok (audio in: $0.50)
Gemini 2.5 Pro
Pro estable
- Ventana de contexto
- 1M input / 64K output
- Precios
- $1.25/$10 <=200K; $2.50/$15 >200K
Gemini 2.5 Flash
Flash produccion
- Ventana de contexto
- 1M input / 64K output
- Precios
- $0.30/$2.50 per MTok (audio in: $1.00)
Gemini 2.5 Flash Lite
Menor costo
- Ventana de contexto
- 1M input / 64K output
- Precios
- $0.10/$0.40 per MTok (audio in: $0.30)
Accede a todos los modelos Gemini a traves de una sola API de EvoLink
Las 6 rutas Gemini estan disponibles con una unica clave API de EvoLink y un endpoint compatible con OpenAI. Cambia entre Pro, Flash y Lite modificando el parametro model — sin cuentas ni claves adicionales.
Cambia model="gemini-3.1-pro" a model="gemini-2.5-flash" sin reconstruir tu integracion.Como pensar en el coste de la API Gemini: Pro vs Flash vs Lite
Rutas Pro: el razonamiento justifica el premium
Gemini 3.1 Pro y 2.5 Pro cuestan mas por token, pero los agentes de codigo complejos, el analisis profundo de documentos y el uso de herramientas multietapa producen salidas de mayor valor. No uses Pro por defecto para extraccion o clasificacion simples.
Rutas Flash: mejor equilibrio para volumen de produccion
Gemini 3 Flash y 2.5 Flash ofrecen capacidades multimodales solidas a una fraccion del precio de Pro. Empieza aqui para chat, resumenes y extraccion a escala de produccion antes de considerar Pro.
Rutas Lite: minimizar costes para tareas simples de alto volumen
Gemini 3.1 Flash Lite y 2.5 Flash Lite ofrecen el menor coste por token. Usalas para clasificacion, enrutamiento, texto por lotes y respuestas cortas donde la profundidad de razonamiento no es critica.
Pricing summary
Gemini routes range from $0.10/MTok input (Flash Lite) to $4.00/MTok input (Pro >200K). All use per-token pricing via EvoLink.
Gemini 3.1 Pro
$2/$12 — $4/$18 /MTok
Context: 1M
Flagship reasoning with 1M context. Tiered pricing: $2/$12 under 200K, $4/$18 over 200K input tokens.
Gemini 3 Flash
$0.50/$3.00 /MTok
Context: 1M
Gemini 3 generation Flash route at $0.50/$3.00 per MTok with 1M context.
Gemini 3.1 Flash Lite
$0.25/$1.50 /MTok
Context: 1M
Cheapest Gemini 3 route at $0.25/$1.50 per MTok for batch text workloads.
Gemini 2.5 Pro
$1.25/$10 — $2.50/$15 /MTok
Context: 1M
Stable deep reasoning at $1.25/$10 under 200K, $2.50/$15 over 200K.
Gemini 2.5 Flash
$0.30/$2.50 /MTok
Context: 1M
Production workhorse at $0.30/$2.50 per MTok with full multimodal support.
Gemini 2.5 Flash Lite
$0.10/$0.40 /MTok
Context: 1M
Lowest-cost Gemini route at $0.10/$0.40 per MTok for text and audio.
Guias y comparativas Gemini
Consulta estas guias cuando necesites mas contexto antes de elegir una ruta.
Gemini 3.1 Pro vs GPT-5.2 vs Claude Opus
Compara modelos flagship para reasoning, codigo y workloads de agentes en produccion.
GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 Pro
Descubre como se comparan los modelos premium mas recientes en la seleccion practica de API.
Guia de migracion por deprecacion de Gemini 3 Pro
Migra el trafico antiguo de Gemini 3 Pro Preview a las rutas Gemini actuales sin afectar el comportamiento en produccion.
Integracion de OpenCode con rutas Gemini
Descubre como acceder a Gemini junto con Claude y GPT a traves de la capa API unificada de EvoLink.
FAQ de la API Gemini
Everything you need to know about the product and billing.