API Gemini 3.1 Flash Lite

Gemini 3.1 Flash Lite es un modelo Gemini de bajo coste y alto throughput para traducción, extracción, clasificación y procesamiento documental. Accede a él en EvoLink con solicitudes compatibles con OpenAI o con la API Gemini nativa; el model ID de request actual es gemini-3.1-flash-lite-preview.

¿Usas CLI de programación? Ejecuta Gemini 3.1 Flash Lite con EvoCode — una sola API para agentes de código y CLI. (Ver documentación)

Tipo de modelo:

✓Gemini 3.1 Flash Lite Preview

Precio:

$0.234(~ 15.9 credits) por 1M tokens de entrada; $1.399(~ 95.1 credits) por 1M tokens de salida

$0.028(~ 1.9 credits) por 1M tokens de lectura de caché; $0.466(~ 31.7 credits) por 1M tokens de audio

La fundamentación de Google Search se cobra por separado por consulta.

Máxima estabilidad con 99.9% de disponibilidad garantizada. Recomendado para producción.

Todas las versiones usan el mismo endpoint API. Solo cambia el parámetro model.

PRICING

PLAN	CONTEXT WINDOW	MAX OUTPUT	INPUT	OUTPUT	CACHE READ	AUDIO INPUT
Gemini 3.1 Flash Lite	1,050,000	65,536	$0.234-6% (15.9 Credits)	$1.399-7% (95.1 Credits)	$0.028-7% (1.9 Credits)	$0.467-7% (31.7 Credits)
Web Search Tool Server-side web search capability						$0.014/search (0.89 Credits)

Pricing Note: Prices show both USD and Credits. Units default to / 1M tokens unless noted separately.

Cache Hit: Price applies to cached prompt tokens.

Audio Input: Audio tokens charged at a separate rate.

Un modelo Gemini de bajo coste para traducción, extracción y flujos documentales

Name: EvoLink AI Model API Platform
Brand: EvoLink
Availability: InStock

Gemini 3.1 Flash Lite encaja en tareas de alto throughput donde el coste, la latencia y la tolerancia a reintentos importan más que la calidad de un modelo premium. Con 1M de contexto, entradas multimodales y soporte de herramientas, funciona bien como capa de procesamiento más barata dentro de una stack Gemini más amplia.

Palabra clave de la página

Gemini 3.1 Flash Lite API

Model ID de solicitud

gemini-3.1-flash-lite-preview

Casos de uso ideales para la API Gemini 3.1 Flash Lite

Procesamiento masivo a bajo costo

Flash Lite funciona bien como capa económica dentro de una stack de IA más amplia. Úsalo para backfills de traducción, colas de etiquetado, trabajos de extracción y una primera pasada de clasificación antes de escalar los casos límite a un modelo más potente.

Entradas multimodales con 1M de contexto

Envía texto, imágenes, vídeo, audio o PDF en una sola solicitud con hasta 1.050.000 tokens de entrada. Procesa documentos largos, lotes grandes o contextos de varios pasos sin fragmentar el contenido.

Subtareas agénticas y uso de herramientas

Soporta function calling, salidas estructuradas, thinking, ejecución de código, search grounding y caché. Esto lo vuelve útil para subtareas agénticas de bajo costo, limpieza de retrieval y preprocesamiento estructurado dentro de pipelines multimodelo.

Por qué usar EvoLink para la API Gemini 3.1 Flash Lite

Para equipos que ya trabajan sobre infraestructura tipo OpenAI, EvoLink hace que Gemini 3.1 Flash Lite sea más fácil de llevar a producción: una sola pasarela, menor fricción de migración y un mejor enrutamiento entre modelos económicos y premium.

Mantén flujos tipo OpenAI mientras añades Gemini

Si tu equipo ya depende del OpenAI SDK, autenticación unificada y una capa de requests existente, puedes añadir Gemini 3.1 Flash Lite sin reescribir la integración principal.

Usa Flash Lite como capa low cost en una stack multimodelo

Envía primero a Flash Lite el tráfico barato de traducción, extracción y clasificación, y reserva los modelos más potentes para solicitudes más difíciles o de mayor valor usando la misma pasarela.

Menor coste de migración que con integraciones específicas del proveedor

Una sola API key, formatos de request compatibles con OpenAI y Gemini nativo, más soporte de caché y batch, facilitan operar Gemini junto con el resto de tu catálogo de modelos.

Cómo usar la API Gemini 3.1 Flash Lite

Usa esta página como vista general de acceso: elige el formato de request, utiliza el model ID preview y deja los ejemplos detallados de request para la documentación.

Paso 1 - Elegir el formato de request

Gemini 3.1 Flash Lite puede llamarse mediante solicitudes compatibles con OpenAI o mediante la API Gemini nativa, lo que facilita encajarlo en stacks existentes sin reescribir toda la integración.

Paso 2 - Usar el model ID de request actual

Usa el model ID exacto "gemini-3.1-flash-lite-preview" cuando envíes tráfico de producción. Así mantienes el keyword de la página centrado en la API Gemini 3.1 Flash Lite y, al mismo tiempo, alineado con la ruta que realmente llamas.

Paso 3 - Escala aquí las cargas adecuadas

Usa Flash Lite para colas de traducción, trabajos de extracción, etiquetado y otras cargas de alto volumen, y envía los casos límite o las solicitudes más difíciles a modelos más potentes. Los cuerpos de request exactos, parámetros y ejemplos de endpoint deberían quedarse en la documentación.

Funciones y límites de la API Gemini 3.1 Flash Lite

Las capacidades y límites más importantes para planificar integraciones en producción

Contexto

1.050.000 tokens de entrada

Hasta 1.050.000 tokens de entrada y 65.536 tokens de salida.

Multimodal

Entradas multimodales

Entradas de texto, imagen, vídeo, audio y PDF con salida de texto.

Razonamiento

Thinking + salidas estructuradas

Thinking y salidas estructuradas permiten obtener resultados fiables y legibles por máquina.

Herramientas

Function calling + herramientas

Soporta function calling, ejecución de código y search grounding.

Escala

Caché + batch

La caché de contexto y la Batch API son útiles para cargas repetitivas o de gran escala.

Precios

Uso de muy bajo costo

Consulta la tabla de precios en vivo situada arriba para ver la tarifa pay-as-you-go actualmente visible en EvoLink.

Preguntas frecuentes sobre la API Gemini 3.1 Flash Lite

Everything you need to know about the product and billing.

Sí. Gemini 3.1 Flash Lite está posicionado como una ruta Flash de menor coste para cargas de alto volumen donde el throughput y el precio importan más que la calidad generalista superior que esperarías de un modelo Gemini Flash más grande.

Sí. EvoLink soporta solicitudes compatibles con OpenAI mediante POST /v1/chat/completions y también solicitudes nativas de Gemini mediante POST /v1beta/models/gemini-3.1-flash-lite-preview:{method}.

Gemini 3.1 Flash Lite soporta hasta 1.050.000 tokens de entrada y 65.536 tokens de salida, lo que lo hace útil para documentos largos, lotes grandes y pipelines de varios pasos.

Sí. Gemini 3.1 Flash Lite acepta texto, imagen, vídeo, audio y PDF como entrada y devuelve texto, por lo que es útil para extracción, resumen y flujos documentales multimodales.

Usa el identificador preview exacto "gemini-3.1-flash-lite-preview" en las solicitudes API. Esta página está orientada a la ruta API Gemini 3.1 Flash Lite, mientras que el model ID de la request sigue siendo el identificador preview.

Elige Flash Lite para traducción, extracción, clasificación, etiquetado y otras cargas tolerantes a reintentos que necesitan menor coste a escala. Sube a una ruta Gemini Flash más grande cuando la calidad de salida o la dificultad de la tarea importen más que mantener cada request barata.

Gemini 3.1 Flash Lite encaja mejor en tareas sensibles al coste y de alto throughput, como traducción, clasificación, extracción, etiquetado, procesamiento documental y flujos agénticos ligeros.

No soporta generación de imágenes, generación de audio ni Live API. Tampoco está disponible Google Maps grounding. Por eso encaja mejor en flujos de texto de bajo coste que en tareas en tiempo real o de generación multimedia.

Modelos Gemini API en EvoLink

Gemini 3.1 Flash Lite es la ruta más económica de la familia Gemini. Para capacidades multimodales más potentes, pase a Gemini 3 Flash Preview; para razonamiento avanzado, elija Gemini 3.1 Pro. Todos los modelos comparten el mismo formato de API.

Explorar familia Gemini Gemini 3 Flash Preview Gemini 3.1 Pro Gemini 2.5 Flash