Gemini 2.5 Flash Lite API

Usa Gemini 2.5 Flash Lite en EvoLink a través de solicitudes compatibles con OpenAI o solicitudes nativas de Gemini. Esta ruta está diseñada para cargas de trabajo de texto de alto volumen y bajo costo, donde el control de costos importa más que usar un modelo Gemini más potente.

Tipo de modelo:

Precio:

$0.094(~ 6.4 credits) por 1M tokens de entrada; $0.374(~ 25.4 credits) por 1M tokens de salida

$0.0088(~ 0.6 credits) por 1M tokens de lectura de caché; $0.281(~ 19.1 credits) por 1M tokens de audio

La fundamentación de Google Search se cobra por separado por consulta.

Acceso gestionado estable para cargas de trabajo de producción. Recomendado cuando necesitas facturación en el panel, control de claves API y un comportamiento de integración predecible.

Todas las versiones usan el mismo endpoint API. Solo cambia el parámetro model.

PRICING

PLAN	CONTEXT WINDOW	MAX OUTPUT	INPUT	OUTPUT	CACHE READ	AUDIO INPUT
Gemini 2.5 Flash Lite	1,048,576	65,536	$0.095-6% (6.4 Credits)	$0.374-7% (25.4 Credits)	$0.009-12% (0.60 Credits)	$0.281-6% (19.1 Credits)
Web Search Tool Server-side web search capability						$0.033/search (2.2 Credits)

Pricing Note: Prices show both USD and Credits. Units default to / 1M tokens unless noted separately.

Cache Hit: Price applies to cached prompt tokens.

Audio Input: Audio tokens charged at a separate rate.

Gemini 2.5 Flash Lite API

Name: EvoLink AI Model API Platform
Brand: EvoLink
Availability: InStock

Gemini 2.5 Flash Lite es la ruta de texto Gemini más económica de Google en EvoLink. Úsala para traducción, clasificación, extracción, etiquetado y resumen a escala cuando el bajo costo por token importa más que actualizar a Gemini 2.5 Flash o Pro.

Palabra clave de la página

ID de modelo de solicitud

gemini-2.5-flash-lite

Cargas de trabajo ideales

Pipelines de traducción y localización

Usa Flash Lite para grandes lotes de textos de productos, contenido de soporte, artículos del centro de ayuda y acumulaciones multilingües donde mantener bajo el costo por solicitud importa más que actualizar a un modelo de razonamiento más potente.

Colas de clasificación, etiquetado y extracción

Ideal para colas que etiquetan, ordenan, normalizan o extraen campos estructurados de grandes volúmenes de tickets, formularios, contenido de catálogo, notas de CRM o registros de texto internos.

Resumen y procesamiento de texto por lotes

Úsala como la capa de bajo costo para resumir textos largos, comprimir contenido repetitivo o preprocesar conjuntos de datos antes de enviar solo los casos más difíciles a Gemini 2.5 Flash o Gemini 2.5 Pro.

Cuándo elegir esta ruta

Flash Lite tiene más sentido como la capa de bajo costo en una estrategia de enrutamiento Gemini: un gateway, un patrón de autenticación y una división más clara entre procesamiento masivo económico y rutas Gemini más potentes.

Elige Flash Lite cuando el costo y el rendimiento lideran la decisión

Si la carga de trabajo es principalmente traducción, etiquetado, extracción, resumen o limpieza de texto por lotes, Flash Lite es el punto de partida práctico porque mantiene bajo el costo unitario sin crear una ruta de integración separada.

No uses Flash Lite por defecto para tareas de razonamiento complejas

Flash Lite no es la ruta para centrar tu stack cuando el umbral de calidad es más alto, la ruta de razonamiento es más compleja o esperas demasiados casos límite para pasar por una capa de primer paso económica.

Actualiza a Gemini 2.5 Flash o Pro cuando la calidad importa más que el precio

Actualiza a Gemini 2.5 Flash para una ruta de propósito general más potente, o a Gemini 2.5 Pro cuando la tarea justifica un modelo premium más capaz. EvoLink facilita esa división de enrutamiento detrás de un solo gateway.

Cómo empezar

Usa esta página como guía rápida de ruta: elige el formato de solicitud, usa el ID de modelo correcto y consulta la sintaxis detallada en la documentación.

Paso 1 – Elige el formato de solicitud

Llama a Gemini 2.5 Flash Lite a través de solicitudes compatibles con OpenAI o solicitudes nativas de Gemini, según el stack que ya uses.

Paso 2 – Usa el ID de modelo correcto

Usa el ID de modelo de solicitud "gemini-2.5-flash-lite" para esta ruta.

Paso 3 – Envía las cargas de trabajo adecuadas aquí

Usa Flash Lite para traducción, clasificación, extracción, etiquetado, resumen y procesamiento de texto por lotes. Actualiza solo cuando la tarea necesite una ruta Gemini más potente.

Capacidades principales y límites

Los principales límites y señales de producción que importan al decidir si esta ruta se adapta a tu carga de trabajo

Contexto

1.048.576 Tokens de entrada

Soporta hasta 1.048.576 tokens de entrada para prompts largos, documentos grandes y procesamiento de texto por lotes.

Salida

65.536 Tokens máximos de salida

Más adecuado para salidas compactas como etiquetas, resúmenes, campos extraídos y respuestas de texto.

Entrada

Texto + Audio de entrada, Texto de salida

Acepta entrada de texto y audio, con salida de texto para flujos de trabajo de transcripción y procesamiento de texto.

Caché

Caché implícito

El contexto repetido puede beneficiarse del caché implícito, lo que ayuda a reducir costos en solicitudes superpuestas.

Escala

Batch API

Soporta Batch API para patrones de procesamiento en cola, fuera de línea u otros de alto volumen.

Precios

Ruta de texto Gemini más económica

Posicionada por debajo de Gemini 2.5 Flash tanto en capacidad como en precio, lo que la convierte en la capa presupuestaria práctica para cargas de trabajo de texto masivas.

Preguntas frecuentes sobre Gemini 2.5 Flash Lite API

Everything you need to know about the product and billing.

Sí. Flash Lite está posicionado por debajo de Gemini 2.5 Flash tanto en precio como en capacidad, y está pensado para cargas de trabajo de texto masivas de menor costo.

Sí. EvoLink soporta tanto solicitudes compatibles con OpenAI como solicitudes nativas de Gemini para esta ruta.

Usa "gemini-2.5-flash-lite" como ID de modelo de solicitud.

Gemini 2.5 Flash Lite soporta hasta 1.048.576 tokens de entrada y hasta 65.536 tokens de salida.

Sí. Esta ruta soporta entrada de texto y audio, con salida de texto.

El caché implícito puede reducir el costo de tokens repetidos cuando las solicitudes comparten contexto superpuesto, lo cual es útil para prompts recurrentes y cargas de trabajo por lotes.

Elige Flash Lite cuando la traducción, etiquetado, extracción, resumen y otras tareas de texto de alto volumen necesiten el menor costo práctico. Actualiza a Flash cuando necesites una ruta de propósito general más potente.

Es mejor para traducción, clasificación, extracción, etiquetado, resumen y otras cargas de trabajo de procesamiento de texto por lotes donde el costo y el rendimiento importan más que usar un modelo más potente por defecto.

Sí. Gemini 2.5 Flash Lite soporta function calling, pero generalmente se posiciona mejor como ruta de texto de bajo costo en lugar de la opción más potente para las tareas de razonamiento más complejas con herramientas.

Modelos Gemini API en EvoLink

Gemini 2.5 Flash Lite es la ruta de texto Gemini más económica de Google. Para mayor capacidad multimodal, pase a Gemini 2.5 Flash; para razonamiento avanzado, elija Gemini 3.1 Pro.

Explorar familia Gemini Gemini 2.5 Flash Gemini 2.5 Pro Gemini 3.1 Pro