HappyHorse 1.0 próximamenteMás información

Gemini 2.5 Flash Lite API

Usa Gemini 2.5 Flash Lite en EvoLink a través de solicitudes compatibles con OpenAI o solicitudes nativas de Gemini. Esta ruta está diseñada para cargas de trabajo de texto de alto volumen y bajo costo, donde el control de costos importa más que usar un modelo Gemini más potente.
Precio: 

$0.081(~ 5.8 credits) per 1M input tokens; $0.321(~ 23.1 credits) per 1M output tokens

$0.0083(~ 0.6 credits) per 1M cache read tokens; $0.240(~ 17.3 credits) per 1M audio tokens

Google Search grounding charged separately per query.

Máxima estabilidad con 99.9% de disponibilidad garantizada. Recomendado para producción.

Todas las versiones usan el mismo endpoint API. Solo cambia el parámetro model.

Gemini 2.5 Flash Lite API

Gemini 2.5 Flash Lite es la ruta de texto Gemini más económica de Google en EvoLink. Úsala para traducción, clasificación, extracción, etiquetado y resumen a escala cuando el bajo costo por token importa más que actualizar a Gemini 2.5 Flash o Pro.

Palabra clave de la página

Gemini 2.5 Flash Lite API

ID de modelo de solicitud

gemini-2.5-flash-lite

Gemini 2.5 Flash Lite API

Cargas de trabajo ideales

Pipelines de traducción y localización

Usa Flash Lite para grandes lotes de textos de productos, contenido de soporte, artículos del centro de ayuda y acumulaciones multilingües donde mantener bajo el costo por solicitud importa más que actualizar a un modelo de razonamiento más potente.

Pipelines de traducción y localización

Colas de clasificación, etiquetado y extracción

Ideal para colas que etiquetan, ordenan, normalizan o extraen campos estructurados de grandes volúmenes de tickets, formularios, contenido de catálogo, notas de CRM o registros de texto internos.

Colas de clasificación, etiquetado y extracción

Resumen y procesamiento de texto por lotes

Úsala como la capa de bajo costo para resumir textos largos, comprimir contenido repetitivo o preprocesar conjuntos de datos antes de enviar solo los casos más difíciles a Gemini 2.5 Flash o Gemini 2.5 Pro.

Resumen y procesamiento de texto por lotes

Cuándo elegir esta ruta

Flash Lite tiene más sentido como la capa de bajo costo en una estrategia de enrutamiento Gemini: un gateway, un patrón de autenticación y una división más clara entre procesamiento masivo económico y rutas Gemini más potentes.

Elige Flash Lite cuando el costo y el rendimiento lideran la decisión

Si la carga de trabajo es principalmente traducción, etiquetado, extracción, resumen o limpieza de texto por lotes, Flash Lite es el punto de partida práctico porque mantiene bajo el costo unitario sin crear una ruta de integración separada.

No uses Flash Lite por defecto para tareas de razonamiento complejas

Flash Lite no es la ruta para centrar tu stack cuando el umbral de calidad es más alto, la ruta de razonamiento es más compleja o esperas demasiados casos límite para pasar por una capa de primer paso económica.

Actualiza a Gemini 2.5 Flash o Pro cuando la calidad importa más que el precio

Actualiza a Gemini 2.5 Flash para una ruta de propósito general más potente, o a Gemini 2.5 Pro cuando la tarea justifica un modelo premium más capaz. EvoLink facilita esa división de enrutamiento detrás de un solo gateway.

Cómo empezar

Usa esta página como guía rápida de ruta: elige el formato de solicitud, usa el ID de modelo correcto y consulta la sintaxis detallada en la documentación.

1

Paso 1 – Elige el formato de solicitud

Llama a Gemini 2.5 Flash Lite a través de solicitudes compatibles con OpenAI o solicitudes nativas de Gemini, según el stack que ya uses.

2

Paso 2 – Usa el ID de modelo correcto

Usa el ID de modelo de solicitud "gemini-2.5-flash-lite" para esta ruta.

3

Paso 3 – Envía las cargas de trabajo adecuadas aquí

Usa Flash Lite para traducción, clasificación, extracción, etiquetado, resumen y procesamiento de texto por lotes. Actualiza solo cuando la tarea necesite una ruta Gemini más potente.

Capacidades principales y límites

Los principales límites y señales de producción que importan al decidir si esta ruta se adapta a tu carga de trabajo

Contexto

1.048.576 Tokens de entrada

Soporta hasta 1.048.576 tokens de entrada para prompts largos, documentos grandes y procesamiento de texto por lotes.

Salida

65.536 Tokens máximos de salida

Más adecuado para salidas compactas como etiquetas, resúmenes, campos extraídos y respuestas de texto.

Entrada

Texto + Audio de entrada, Texto de salida

Acepta entrada de texto y audio, con salida de texto para flujos de trabajo de transcripción y procesamiento de texto.

Caché

Caché implícito

El contexto repetido puede beneficiarse del caché implícito, lo que ayuda a reducir costos en solicitudes superpuestas.

Escala

Batch API

Soporta Batch API para patrones de procesamiento en cola, fuera de línea u otros de alto volumen.

Precios

Ruta de texto Gemini más económica

Posicionada por debajo de Gemini 2.5 Flash tanto en capacidad como en precio, lo que la convierte en la capa presupuestaria práctica para cargas de trabajo de texto masivas.

Preguntas frecuentes sobre Gemini 2.5 Flash Lite API

Everything you need to know about the product and billing.

Sí. Flash Lite está posicionado por debajo de Gemini 2.5 Flash tanto en precio como en capacidad, y está pensado para cargas de trabajo de texto masivas de menor costo.
Sí. EvoLink soporta tanto solicitudes compatibles con OpenAI como solicitudes nativas de Gemini para esta ruta.
Usa "gemini-2.5-flash-lite" como ID de modelo de solicitud.
Gemini 2.5 Flash Lite soporta hasta 1.048.576 tokens de entrada y hasta 65.536 tokens de salida.
Sí. Esta ruta soporta entrada de texto y audio, con salida de texto.
El caché implícito puede reducir el costo de tokens repetidos cuando las solicitudes comparten contexto superpuesto, lo cual es útil para prompts recurrentes y cargas de trabajo por lotes.
Elige Flash Lite cuando la traducción, etiquetado, extracción, resumen y otras tareas de texto de alto volumen necesiten el menor costo práctico. Actualiza a Flash cuando necesites una ruta de propósito general más potente.
Es mejor para traducción, clasificación, extracción, etiquetado, resumen y otras cargas de trabajo de procesamiento de texto por lotes donde el costo y el rendimiento importan más que usar un modelo más potente por defecto.
Sí. Gemini 2.5 Flash Lite soporta function calling, pero generalmente se posiciona mejor como ruta de texto de bajo costo en lugar de la opción más potente para las tareas de razonamiento más complejas con herramientas.

Próximos pasos para enrutamiento Gemini

Dónde encaja Flash Lite en la familia Gemini

Usa Flash Lite para procesamiento de texto masivo, cambia a Gemini 2.5 Flash cuando necesites una ruta de propósito general más potente, y a Gemini 2.5 Pro cuando la tarea justifique una calidad de razonamiento premium.

Usa esta área para moverte a la ruta Gemini correcta o a la documentación una vez que el rol de Flash Lite en tu stack esté claro.