Compara modelos Gemini: Pro, Flash y Lite precios API

Name: EvoLink AI Model API Platform
Brand: EvoLink
Availability: InStock

Gemini API Family

Compara las rutas Gemini de EvoLink para razonamiento flagship, Flash de baja latencia, contexto largo y comprension multimodal.

Ver documentacion API Ver precios

📦

7 rutas

Niveles Pro, Flash y Lite para cada presupuesto

🔗

Acceso API unificado

Compatible con OpenAI, una clave para todo Gemini

🎯

Elige por workflow

Asigna Pro vs Flash vs Lite a tu tarea

Comparacion de modelos Como elegir Casos de uso Acceso unificado FAQ

Comparar rutas Gemini API

Empieza por el workload: razonamiento flagship, trafico Flash de produccion, extraccion de bajo costo o analisis multimodal de contexto largo.

Ruta	Ideal para	Precios	Ventana de contexto	Modalidad	Estado
Gemini 3.1 Pro Preview Razonamiento flagship	Maxima calidad Gemini para razonamiento, codigo, agentes y analisis de contexto largo.	$2/$12 <=200K; $4/$18 >200K	1M input / 64K output	Texto, codigo, imagen, video, audio, PDF de entrada	Preview flagship
Gemini 3.5 Flash Estable — GA para produccion	Workflows agentivos, agentes de codigo, despliegue de sub-agentes y tareas de produccion de largo plazo a costo Flash.	$1.50/$9.00 per MTok	1M input / 65K output	Texto, imagen, video, audio, PDF de entrada	Stable (GA)
Gemini 3 Flash Preview Gemini 3 rapido	Apps multimodales de baja latencia que necesitan comportamiento Gemini 3.	$0.50/$3.00 per MTok (audio in: $1.00)	1M input / 64K output	Texto, imagen, video, audio, PDF de entrada	Preview route
Gemini 3.1 Flash Lite Preview Gemini 3 mas barato	Traduccion, clasificacion, extraccion y procesamiento de texto por lotes a alto volumen.	$0.25/$1.50 per MTok (audio in: $0.50)	1M input / 64K output	Texto, imagen, video, audio, PDF de entrada	Preview route
Gemini 2.5 Pro Pro estable	Razonamiento de produccion, ayuda de codigo, analisis y tareas multimodales complejas.	$1.25/$10 <=200K; $2.50/$15 >200K	1M input / 64K output	Texto, imagen, video, audio, PDF de entrada	Stable deep reasoning
Gemini 2.5 Flash Flash produccion	Chat rapido, extraccion, resumenes y trafico multimodal de produccion.	$0.30/$2.50 per MTok (audio in: $1.00)	1M input / 64K output	Texto, imagen, video, audio, PDF de entrada	Production workhorse
Gemini 2.5 Flash Lite Menor costo	Clasificacion, extraccion, enrutamiento y flujos de chat ligeros a alto volumen.	$0.10/$0.40 per MTok (audio in: $0.30)	1M input / 64K output	Texto y audio de entrada	Lowest-cost text route

Como decidir que modelo Gemini usar

Sigue estas 4 reglas para acotar tu eleccion entre los niveles Pro, Flash y Lite.

Empieza por la profundidad de razonamiento

Agentes de codigo complejos, uso de herramientas multietapa, analisis profundo de documentos y salida de alta precision — empieza con Gemini 3.1 Pro o Gemini 2.5 Pro.

Luego revisa las necesidades de latencia y rendimiento

Chat de produccion, bots de soporte, extraccion en tiempo real y apps multimodales de alta frecuencia — compara Gemini 3 Flash o Gemini 2.5 Flash.

Luego revisa la sensibilidad al coste

Clasificacion de alto volumen, procesamiento de texto por lotes, enrutamiento y extraccion ligera — compara Gemini 3.1 Flash Lite o Gemini 2.5 Flash Lite.

Por ultimo, considera workflows de complejidad mixta

Si la misma pipeline mezcla clasificacion simple con pasos de razonamiento profundo, considera EvoLink Smart Router en vez de codificar un solo modelo Gemini.

Smart Router →

Si ya conoces tu tipo de tarea, encuentra el punto de partida recomendado en la tabla siguiente.

Elige un modelo Gemini por workflow: razonamiento, velocidad, coste y tareas multimodales

Asigna tu tarea principal a la ruta Gemini adecuada.

Tu tarea	Inicio recomendado	Buena opcion si…	Ten en cuenta
Razonamiento complejo y agentes de codigo	Gemini 3.1 Pro	Necesitas la mayor calidad de razonamiento Gemini, uso de herramientas multietapa o analisis profundo de codigo	Mayor coste — usa Flash para tareas mas simples
Deep reasoning estable con multimodal	Gemini 2.5 Pro	Necesitas razonamiento de nivel produccion con soporte multimodal amplio y estabilidad demostrada	Techo de capacidad ligeramente menor que 3.1 Pro
Workflows agentivos y agentes de codigo	Gemini 3.5 Flash	Necesitas inteligencia de frontera a costo Flash para agentes de codigo, bucles de sub-agentes y tareas de largo plazo	GA y estable — el Flash predeterminado para cargas de trabajo de agentes
Apps multimodales de baja latencia	Gemini 3 Flash	Necesitas respuestas rapidas con capacidades de generacion Gemini 3 en texto, imagen, audio y video	Ruta preview — verifica requisitos de estabilidad
Chat y extraccion de produccion	Gemini 2.5 Flash	Necesitas un modelo de produccion probado para chat, resumenes y extraccion a escala	Buen punto de partida para la mayoria de workloads de produccion
Texto por lotes de alto volumen al menor coste	Gemini 2.5 Flash Lite	Las tareas son clasificacion, enrutamiento o respuestas cortas donde el coste es lo mas importante	Limitado a entrada de texto y audio
Workflows de texto de complejidad mixta	EvoLink Smart Router	La misma pipeline tiene tareas simples y complejas entre Gemini y otros proveedores	Ideal cuando no quieres logica de enrutamiento manual de modelos

Workflows de la API Gemini: agentes, chat, documentos y procesamiento multimodal

Descubre como los modelos Gemini encajan en productos reales, agentes y pipelines de procesamiento de contenido.

Agentes de razonamiento y codigo

Para generacion de codigo, correccion de bugs, uso de herramientas multietapa y agentes de analisis complejos. Si la calidad de salida afecta directamente al comportamiento del producto, empieza con Gemini 3.1 Pro. Para estabilidad demostrada, compara Gemini 2.5 Pro.

Ver Gemini 3.1 Pro →

Chat y soporte de produccion

Para bots de soporte, asistentes in-app, Q&A de base de conocimientos y conversaciones multi-turno de alta frecuencia. Prueba primero con Gemini 2.5 Flash por su rendimiento probado, luego compara Flash Lite para menor coste.

Ver Gemini 2.5 Flash →

Analisis de documentos largos y multimodal

Para analisis de PDFs, comprension de video, transcripcion de audio y workflows de investigacion multi-archivo. La ventana de contexto de 1M de Gemini y su soporte multimodal nativo hacen de las rutas Pro y Flash opciones solidas.

Ver Gemini 2.5 Pro →

Enrutamiento de agentes y tareas mixtas

Para workflows donde clasificacion, extraccion, razonamiento y generacion coexisten en la misma pipeline. Usa EvoLink Smart Router para enrutar automaticamente entre Gemini y otros proveedores via evolink/auto.

Ver Smart Router →

Ver detalles de cada modelo Gemini

Cada ruta enlaza a una pagina dedicada con precios, especificaciones y detalles de integracion.

Gemini 3.1 Pro Preview

Razonamiento flagship

Ventana de contexto: 1M input / 64K output
Precios: $2/$12 <=200K; $4/$18 >200K

Ver Gemini 3.1 Pro Preview →

Gemini 3.5 Flash

Estable — GA para produccion

Ventana de contexto: 1M input / 65K output
Precios: $1.50/$9.00 per MTok

Ver Gemini 3.5 Flash →

Gemini 3 Flash Preview

Gemini 3 rapido

Ventana de contexto: 1M input / 64K output
Precios: $0.50/$3.00 per MTok (audio in: $1.00)

Ver Gemini 3 Flash Preview →

Gemini 3.1 Flash Lite Preview

Gemini 3 mas barato

Ventana de contexto: 1M input / 64K output
Precios: $0.25/$1.50 per MTok (audio in: $0.50)

Ver Gemini 3.1 Flash Lite Preview →

Gemini 2.5 Pro

Pro estable

Ventana de contexto: 1M input / 64K output
Precios: $1.25/$10 <=200K; $2.50/$15 >200K

Ver Gemini 2.5 Pro →

Gemini 2.5 Flash

Flash produccion

Ventana de contexto: 1M input / 64K output
Precios: $0.30/$2.50 per MTok (audio in: $1.00)

Ver Gemini 2.5 Flash →

Gemini 2.5 Flash Lite

Menor costo

Ventana de contexto: 1M input / 64K output
Precios: $0.10/$0.40 per MTok (audio in: $0.30)

Ver Gemini 2.5 Flash Lite →

Accede a todos los modelos Gemini a traves de una sola API de EvoLink

Las 7 rutas Gemini estan disponibles con una unica clave API de EvoLink y un endpoint compatible con OpenAI. Cambia entre Pro, Flash y Lite modificando el parametro model — sin cuentas ni claves adicionales.

Cambia model="gemini-3.1-pro" a model="gemini-2.5-flash" sin reconstruir tu integracion.

Una clave API para todos los modelos Gemini

Endpoint compatible con OpenAI

Cambia de modelo modificando el parametro model

Facturacion unificada y visibilidad de uso

Ver documentacion API Crear clave API Ver precios

Como pensar en el coste de la API Gemini: Pro vs Flash vs Lite

Rutas Pro: el razonamiento justifica el premium

Gemini 3.1 Pro y 2.5 Pro cuestan mas por token, pero los agentes de codigo complejos, el analisis profundo de documentos y el uso de herramientas multietapa producen salidas de mayor valor. No uses Pro por defecto para extraccion o clasificacion simples.

Rutas Flash: mejor equilibrio para volumen de produccion

Gemini 3 Flash y 2.5 Flash ofrecen capacidades multimodales solidas a una fraccion del precio de Pro. Empieza aqui para chat, resumenes y extraccion a escala de produccion antes de considerar Pro.

Rutas Lite: minimizar costes para tareas simples de alto volumen

Gemini 3.1 Flash Lite y 2.5 Flash Lite ofrecen el menor coste por token. Usalas para clasificacion, enrutamiento, texto por lotes y respuestas cortas donde la profundidad de razonamiento no es critica.

Ver todos los precios →

Pricing summary

Gemini routes range from $0.10/MTok input (Flash Lite) to $4.00/MTok input (Pro >200K). All use per-token pricing via EvoLink.

Gemini 3.1 Pro

$2/$12 — $4/$18 /MTok

Context: 1M

Flagship reasoning with 1M context. Tiered pricing: $2/$12 under 200K, $4/$18 over 200K input tokens.

Gemini 3.5 Flash

$1.50/$9.00 /MTok

Context: 1M

Flash GA estable para workflows agentivos y codigo a $1.50/$9.00 per MTok con 1M de contexto y razonamiento integrado.

Gemini 3 Flash

$0.50/$3.00 /MTok

Context: 1M

Gemini 3 generation Flash route at $0.50/$3.00 per MTok with 1M context.

Gemini 3.1 Flash Lite

$0.25/$1.50 /MTok

Context: 1M

Cheapest Gemini 3 route at $0.25/$1.50 per MTok for batch text workloads.

Gemini 2.5 Pro

$1.25/$10 — $2.50/$15 /MTok

Context: 1M

Stable deep reasoning at $1.25/$10 under 200K, $2.50/$15 over 200K.

Gemini 2.5 Flash

$0.30/$2.50 /MTok

Context: 1M

Production workhorse at $0.30/$2.50 per MTok with full multimodal support.

Gemini 2.5 Flash Lite

$0.10/$0.40 /MTok

Context: 1M

Lowest-cost Gemini route at $0.10/$0.40 per MTok for text and audio.

Guias y comparativas Gemini

Consulta estas guias cuando necesites mas contexto antes de elegir una ruta.

Gemini 3.1 Pro vs GPT-5.2 vs Claude Opus

Compara modelos flagship para reasoning, codigo y workloads de agentes en produccion.

GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 Pro

Descubre como se comparan los modelos premium mas recientes en la seleccion practica de API.

Guia de migracion por deprecacion de Gemini 3 Pro

Migra el trafico antiguo de Gemini 3 Pro Preview a las rutas Gemini actuales sin afectar el comportamiento en produccion.

Integracion de OpenCode con rutas Gemini

Descubre como acceder a Gemini junto con Claude y GPT a traves de la capa API unificada de EvoLink.

FAQ de la API Gemini

Everything you need to know about the product and billing.

Comienza con Gemini 3.1 Pro para maxima calidad de reasoning, Gemini 3.5 Flash para workflows agentivos y agentes de codigo, Gemini 2.5 Pro para deep reasoning estable, Gemini 2.5 Flash para workloads de produccion rapidos, y Flash Lite cuando el costo es la restriccion principal.

Si. Varias rutas Gemini admiten ventanas de contexto muy amplias, lo que las hace utiles para analisis de PDFs, revision de documentos, workflows de retrieval y reasoning con multiples archivos.

Elige Pro cuando la calidad de respuesta, el codigo y el reasoning en multiples pasos son lo mas importante. Elige Flash cuando la velocidad, el rendimiento de produccion y la previsibilidad de costos importan mas.