Gemini 2.5 Flash Lite API
$0.081(~ 5.8 credits) per 1M input tokens; $0.321(~ 23.1 credits) per 1M output tokens
$0.0083(~ 0.6 credits) per 1M cache read tokens; $0.240(~ 17.3 credits) per 1M audio tokens
Google Search grounding charged separately per query.
Máxima estabilidad con 99.9% de disponibilidad garantizada. Recomendado para producción.
Todas las versiones usan el mismo endpoint API. Solo cambia el parámetro model.
Gemini 2.5 Flash Lite API
Gemini 2.5 Flash Lite es la ruta de texto Gemini más económica de Google en EvoLink. Úsala para traducción, clasificación, extracción, etiquetado y resumen a escala cuando el bajo costo por token importa más que actualizar a Gemini 2.5 Flash o Pro.
Palabra clave de la página
Gemini 2.5 Flash Lite API
ID de modelo de solicitud
gemini-2.5-flash-lite

Cargas de trabajo ideales
Pipelines de traducción y localización
Usa Flash Lite para grandes lotes de textos de productos, contenido de soporte, artículos del centro de ayuda y acumulaciones multilingües donde mantener bajo el costo por solicitud importa más que actualizar a un modelo de razonamiento más potente.

Colas de clasificación, etiquetado y extracción
Ideal para colas que etiquetan, ordenan, normalizan o extraen campos estructurados de grandes volúmenes de tickets, formularios, contenido de catálogo, notas de CRM o registros de texto internos.

Resumen y procesamiento de texto por lotes
Úsala como la capa de bajo costo para resumir textos largos, comprimir contenido repetitivo o preprocesar conjuntos de datos antes de enviar solo los casos más difíciles a Gemini 2.5 Flash o Gemini 2.5 Pro.

Cuándo elegir esta ruta
Flash Lite tiene más sentido como la capa de bajo costo en una estrategia de enrutamiento Gemini: un gateway, un patrón de autenticación y una división más clara entre procesamiento masivo económico y rutas Gemini más potentes.
Elige Flash Lite cuando el costo y el rendimiento lideran la decisión
Si la carga de trabajo es principalmente traducción, etiquetado, extracción, resumen o limpieza de texto por lotes, Flash Lite es el punto de partida práctico porque mantiene bajo el costo unitario sin crear una ruta de integración separada.
No uses Flash Lite por defecto para tareas de razonamiento complejas
Flash Lite no es la ruta para centrar tu stack cuando el umbral de calidad es más alto, la ruta de razonamiento es más compleja o esperas demasiados casos límite para pasar por una capa de primer paso económica.
Actualiza a Gemini 2.5 Flash o Pro cuando la calidad importa más que el precio
Actualiza a Gemini 2.5 Flash para una ruta de propósito general más potente, o a Gemini 2.5 Pro cuando la tarea justifica un modelo premium más capaz. EvoLink facilita esa división de enrutamiento detrás de un solo gateway.
Cómo empezar
Usa esta página como guía rápida de ruta: elige el formato de solicitud, usa el ID de modelo correcto y consulta la sintaxis detallada en la documentación.
Paso 1 – Elige el formato de solicitud
Llama a Gemini 2.5 Flash Lite a través de solicitudes compatibles con OpenAI o solicitudes nativas de Gemini, según el stack que ya uses.
Paso 2 – Usa el ID de modelo correcto
Usa el ID de modelo de solicitud "gemini-2.5-flash-lite" para esta ruta.
Paso 3 – Envía las cargas de trabajo adecuadas aquí
Usa Flash Lite para traducción, clasificación, extracción, etiquetado, resumen y procesamiento de texto por lotes. Actualiza solo cuando la tarea necesite una ruta Gemini más potente.
Capacidades principales y límites
Los principales límites y señales de producción que importan al decidir si esta ruta se adapta a tu carga de trabajo
1.048.576 Tokens de entrada
Soporta hasta 1.048.576 tokens de entrada para prompts largos, documentos grandes y procesamiento de texto por lotes.
65.536 Tokens máximos de salida
Más adecuado para salidas compactas como etiquetas, resúmenes, campos extraídos y respuestas de texto.
Texto + Audio de entrada, Texto de salida
Acepta entrada de texto y audio, con salida de texto para flujos de trabajo de transcripción y procesamiento de texto.
Caché implícito
El contexto repetido puede beneficiarse del caché implícito, lo que ayuda a reducir costos en solicitudes superpuestas.
Batch API
Soporta Batch API para patrones de procesamiento en cola, fuera de línea u otros de alto volumen.
Ruta de texto Gemini más económica
Posicionada por debajo de Gemini 2.5 Flash tanto en capacidad como en precio, lo que la convierte en la capa presupuestaria práctica para cargas de trabajo de texto masivas.
Preguntas frecuentes sobre Gemini 2.5 Flash Lite API
Everything you need to know about the product and billing.
Próximos pasos para enrutamiento Gemini
Dónde encaja Flash Lite en la familia Gemini
Usa Flash Lite para procesamiento de texto masivo, cambia a Gemini 2.5 Flash cuando necesites una ruta de propósito general más potente, y a Gemini 2.5 Pro cuando la tarea justifique una calidad de razonamiento premium.
Usa esta área para moverte a la ruta Gemini correcta o a la documentación una vez que el rol de Flash Lite en tu stack esté claro.