Gemini Omni Flash API

Gemini Omni Flash API en EvoLink — generación y edición de vídeo con una sola API key, flujo de tareas async y soporte de callback.

Tipo de modelo:

✓Text to Video Image to Video Reference to Video Video Edit

Precio:

$1.275(~ 86.7 credits) por 1M tokens de entrada; $14.875(~ 1011.5 credits) por 1M tokens de salida de vídeo

$7.650(~ 520.2 credits) por 1M tokens de otras salidas

Facturación basada en tokens. El coste real sigue el objeto usage devuelto por la API.

Máxima estabilidad con 99.9% de disponibilidad garantizada. Recomendado para producción.

Use the same video endpoint for all modes. Only the model parameter differs.

Prompt*

Output is 720p with audio. Duration resets to Auto; drag the slider to send a fixed 3-10s duration.

131 (sugerido: 2,000)

Aspect Ratio

Choose landscape, portrait, or Auto to let the provider select the output ratio.

Duration

Auto lets the provider decide the output duration (estimated as 10s). Choose 3-10s to send a fixed duration.

Click Generate to see preview

Historial

Máx. 20 elementos

0 ejecutando · 0 completado

Tu historial de generación aparecerá aquí

Gemini Omni Flash API en EvoLink

Name: EvoLink AI Model API Platform
Brand: EvoLink
Availability: InStock

Usa Gemini Omni Flash en EvoLink para texto a vídeo, imagen a vídeo, referencias a vídeo y edición de vídeo mediante una API de vídeo unificada. La conversación pública suele presentar Gemini Omni como una contraparte de video de Nano Banana porque lleva la creación multimodal y la edición conversacional a workflows de video corto. En EvoLink, el valor práctico está en el acceso API: model IDs de EvoLink, flujo de tareas async, soporte de callback, visibilidad de uso basada en tokens y la misma API key que ya se usa para Veo, Seedance, Kling y otros modelos de video.

Flujo de video con Gemini Omni API en EvoLink

Billing Rules

•Gemini Omni Flash is billed by token usage. The task returns a credits_reserved estimate on creation and settles from the actual usage tokens once the task completes.
•Text input: counted from the prompt tokens.
•Video input: 5,792 tokens per second of input video.
•Video output: 5,792 tokens per second of 720p video (audio included).
•The output follows the input video, so video edit does not accept duration or aspect_ratio.

Pricing

Model	Mode	Meter	Price
Text to Video	Output video	Video output tokens	$0.015/ 1K tokens(1.0115 Credits)
Text to Video	Input text / image / video	Input tokens	$0.0013/ 1K tokens(0.0867 Credits)
Text to Video	Thinking / text output	Other output tokens	$0.0077/ 1K tokens(0.5202 Credits)

Text to Video

Output video

Meter:Video output tokens

Price:

$0.015/ 1K tokens

(1.0115 Credits)

Text to Video

Input text / image / video

Meter:Input tokens

Price:

$0.0013/ 1K tokens

(0.0867 Credits)

Text to Video

Thinking / text output

Meter:Other output tokens

Price:

$0.0077/ 1K tokens

(0.5202 Credits)

If it's down, we automatically use the next cheapest available—ensuring 99.9% uptime at the best possible price.

EVOLINK · PRICE EST.gemini-omni-flash

Auto estimated as 10s · real-time

Figures are pre-bill estimates. Actual charges follow the upstream usage tokens returned by the model.

Your estimate

~$0.86959.106

Official· saves ~15%

~$1.02369.537

Tokens per task

video output57,920

text input0

other output1,000

Mode

Duration

Prompt

0 chars · ~0 text tokens

¿Qué puedes construir con Gemini Omni API?

Edición de video por chat

Genera un clip con Gemini Omni y luego refínalo en conversación — "haz la iluminación más cálida", "reemplaza el auto rojo". El workflow está diseñado para edición iterativa y busca conservar la escena, la identidad del sujeto y el movimiento dentro de lo que soporte la ruta seleccionada.

Probar en playground

Edición de video por chat con Gemini Omni

Reemplazo de objetos y reescritura de escenas

Intercambia un objeto en el fotograma, elimina un elemento no deseado o reescribe una escena preservando identidad y movimiento. Útil para iteración de creatividades publicitarias y renderizado de variantes de producto sin herramientas de edición externas.

Ver flujo de trabajo

Reemplazo de objetos y reescritura de escenas con Gemini Omni

Flujo con imagen de referencia

Pasa una imagen de referencia y Gemini Omni ancla la identidad del personaje, la iluminación y el color a lo largo del video generado. Combínalo con la edición por chat para refinar tomas específicas sin perder consistencia visual.

Comenzar a usar la API

Flujo de imagen de referencia con Gemini Omni

Generación de video con soporte de audio

Las rutas Gemini Omni Flash pueden devolver salidas de video corto con audio cuando el modo seleccionado lo admite, reduciendo la necesidad de unir un pipeline separado de TTS o diseño de sonido en la primera generación.

Comenzar a usar la API

Generación de video con soporte de audio de Gemini Omni

Cómo se compara Gemini Omni — Todos los modelos con una sola API key de EvoLink

Gemini Omni destaca sobre todo por workflow: entradas multimodales, edición conversacional y una ruta práctica de EvoLink para probarlo junto a Veo, Seedance y Kling con una sola API key.

Flujo de edición nativo por chat

Gemini Omni está orientado a la edición conversacional de video, mientras que Veo 3.1 y Seedance 2.0 suelen evaluarse primero como rutas de generación. Para refinamiento multi-turno, esta es la diferencia de workflow que conviene probar.

Consistencia de personaje en contexto largo

Gemini Omni se reporta como beneficiado por el contexto y el conocimiento del mundo de Gemini para continuidad en workflows multi-input y con mucha edición. Evalúa este comportamiento con tus propios prompts de storyboard o video corto.

Sin proyecto Google Cloud — Mismo patrón async que Veo y Seedance

Sin configuración de GCP, sin facturación de Vertex, sin aprobación de región. Si ya ejecutas generación de video a través de EvoLink, agregar Gemini Omni es un cambio de un solo parámetro — misma estructura de request, mismo ciclo de vida de tareas que Veo 3.1, Seedance 2.0 y Kling.

Gemini Omni vs Veo 3.1 vs Seedance 2.0 — Comparativa lado a lado

Tres modelos frecuentemente preseleccionados para flujos de producción de video en 2026. Los tres accesibles con una sola API key de EvoLink.

Característica	Gemini Omni	Veo 3.1	Seedance 2.0
Precio en EvoLink	Basado en tokens	Desde $0.50/s	Desde $0.092/s
Calidad	720p	720p / 1080p, escalado 4K donde esté disponible	480p / 720p / 1080p
Audio nativo	Sí	Sí	Sí
Control de referencia	Texto + imagen + edición por chat	Texto + imagen	Texto + imagen + video + audio
Duración del video	3-10s / Auto	Clips cortos con Extend para escenas más largas cuando esté disponible	4–15s
Edición	Nativa por chat, multi-turno	Prioriza generación	Modo V2V
Ideal para	Flujos con edición intensiva	Línea base cinematográfica	Producción con referencia multimodal

Gemini Omni vs Veo 3.1 →

Cómo integrar Gemini Omni API

Tres pasos para tu primera tarea de video con Gemini Omni. Mismo patrón de integración que Veo 3.1, Seedance 2.0 y Kling 3.0.

Paso 1 — Obtén tu API key

Regístrate en EvoLink.ai y genera tu API key desde el panel de control. No se requiere proyecto Google Cloud.

Paso 2 — Envía la tarea de generación

Haz un POST a /v1/videos/generations con uno de los nombres de modelo de Gemini Omni Flash y tu prompt. Usa duration para modos generativos de 3-10 segundos o Auto, image_urls para imagen a vídeo o referencias a vídeo, video_urls para edición de vídeo y callback_url opcional para notificaciones de finalización. La API procesa de forma asíncrona y devuelve un task_id.

Paso 3 — Recupera el resultado del video

Usa el task_id para consultar el endpoint de estado, o espera el webhook de callback_url. Cuando el estado llegue a completado, recibirás una URL de descarga del MP4 generado. Los enlaces son válidos por 24 horas.

Capacidades de Gemini Omni API

Especificaciones técnicas para flujos de producción de video.

Edición

Edición de video por chat

Refinamiento multi-turno en un workflow conversacional, con continuidad de escena dependiente de la ruta seleccionada y la calidad de entrada.

Salida

720p, clips de 3-10s / Auto

Salida 720p con clips configurables de 3-10 segundos o Auto para modos generativos. Auto se estima como 10 segundos. La edición de vídeo acepta un MP4 de entrada de hasta 10 segundos.

Modos

Texto a video e imagen a video

T2V desde prompts e I2V con imagen de referencia. La edición por chat se aplica a las salidas de ambos modos.

Audio

Salida de video con soporte de audio

Las salidas de video corto pueden incluir audio cuando la ruta Gemini Omni Flash seleccionada lo soporta.

Consistencia

Consistencia de personaje en contexto largo

Diseñado para mayor continuidad en workflows multi-input y con mucha edición; valida la consistencia con tus propios prompts de producción.

Flujo

API async con task_id y callback

Envía una tarea, recibe un ID, consulta el estado o configura una callback_url. Mismo ciclo de vida que otros modelos de video en EvoLink.

Ejemplo de costos — Estimaciones de precios de Gemini Omni

100 × clips de 3-10s/Auto para lote de redes sociales

Usa las tarifas actuales de Pricing

1,000 × clips de 3-10s/Auto/mes a escala de producción

Usa las tarifas actuales de Pricing

1 generación + 3 ediciones en flujo multi-turno

Usa las tarifas actuales de Pricing

Consulta la pestaña Pricing para ver las tarifas tokenizadas actuales. Selecciona el flujo cambiando el parámetro model.

Explora más modelos de generación de video en EvoLink →

Preguntas frecuentes sobre Gemini Omni API

Everything you need to know about the product and billing.

Gemini Omni es la familia de modelos de video multimodales anunciada por Google en Google I/O 2026. Omni Flash se comenta como una ruta de video corto para entradas de texto, imagen, video y audio. Frente a Veo 3.1, Gemini Omni destaca sobre todo por la edición conversacional y los workflows multi-input; Veo sigue siendo una base sólida para generación cinematográfica.

La facturación sigue los usage tokens devueltos por la API, con métricas separadas para input, video output y other output. Consulta la tabla de precios para las tarifas actuales.

No. EvoLink proporciona acceso con una sola API key. Sin proyecto Google Cloud, sin facturación de Vertex, sin aprobación de región. Misma autenticación que Veo 3.1 y Seedance 2.0 en EvoLink.

Hay cuatro modos disponibles: gemini-omni-flash-text-to-video, gemini-omni-flash-image-to-video, gemini-omni-flash-reference-to-video y gemini-omni-flash-video-edit. Todos comparten el mismo endpoint asíncrono de vídeo.

Sí. Pasa una callback_url (HTTPS) al enviar la tarea y EvoLink puede enviar actualizaciones por POST cuando la tarea llegue a un estado terminal. También funciona la consulta al endpoint de estado si no proporcionas callback URL.

Las tareas fallidas devuelven un estado failed con un motivo de error. Para reintentos a nivel de aplicación, inspecciona el error, conserva los parámetros originales para depuración y reenvía solo cuando el problema de entrada o fallo temporal esté claro.

Sí — esta es una de las diferencias principales de workflow de Gemini Omni. Usa una instrucción de edición en lenguaje natural y valida qué tan bien la ruta seleccionada conserva la escena, la identidad del sujeto y el movimiento entre iteraciones.

Los modos generativos admiten clips configurables de 3-10 segundos o Auto. Auto se estima como 10 segundos para la reserva. La edición de vídeo acepta un MP4 de entrada de hasta 10 segundos. Para narrativas más largas, encadena múltiples clips usando la consistencia de personaje en contexto largo.

Sí. Pasa una URL de imagen de referencia y Gemini Omni la usa como ancla de identidad para el video generado.

Seedance 2.0 muestra señales sólidas en benchmarks y referencias multimodales, mientras que Veo 3.1 sigue siendo una base cinematográfica fuerte con workflows avanzados de Flow y Extend. Gemini Omni se diferencia por la edición conversacional, la generación multi-input y la iteración de video corto.

Sí. EvoLink expone Gemini Omni, Veo 3.1, Nano Banana 2 y el resto de la familia Gemini a través de una sola API key. Cambia modificando el parámetro model.

Todos los modelos de video Gemini API

EvoLink proporciona acceso unificado a la familia de modelos de video y medios de Google a través de una sola API key. Todos los modelos comparten el mismo endpoint de EvoLink API. Cambia de modelo con un solo parámetro.

Explorar familia Gemini Ver Veo 3.1 Ver Nano Banana 2

API Reference

Select endpoint

Endpoints

Authentication

All APIs require Bearer Token authentication.

Header

Authorization: 
Bearer YOUR_API_KEY

Get API Key

POST

/v1/videos/generations

Create Gemini Omni Flash Video Task

Text to Video uses the unified EvoLink video generation endpoint. Select the mode by changing the model parameter.

Asynchronous processing returns a task ID. Use it to , or provide callback_url for completion notifications.

Generated outputs should be stored in your own system when result URLs are time-limited.

Request Parameters

modelstringRequiredDefault: gemini-omni-flash-text-to-video

Gemini Omni Flash model name. Fixed to gemini-omni-flash-text-to-video for text-to-video generation.

Examplegemini-omni-flash-text-to-video

promptstringRequired

Natural-language instruction describing the requested video.

ExampleCreate a cinematic product video with smooth camera motion and natural audio ambience

aspect_ratiostringOptionalDefault: 16:9

Output aspect ratio. Use auto to let the provider choose.

Value	Description
16:9	Landscape video
9:16	Portrait video
auto	Let the provider choose the output ratio

Example16:9

durationinteger or stringOptionalDefault: 10 if omitted

Output video duration in seconds. The Playground sends auto by default.

Value	Description
3-10	Any integer from 3 to 10 seconds. If omitted, the API default is 10 seconds.
auto	Let the provider decide the output duration. Playground sends auto by default and estimates it as 10 seconds.

Notes

Use auto to let the model decide the duration; reservations estimate auto as 10 seconds
Affects the estimated reservation; completed tasks are billed from API usage tokens

Exampleauto

callback_urlstringOptional

Optional HTTPS callback address after task completion.

Notes

Use polling if no callback_url is provided
Store outputs promptly when result URLs are time-limited

Examplehttps://your-domain.com/webhooks/video-task-completed

Request Example

{
  "model": "gemini-omni-flash-text-to-video",
  "prompt": "Create a cinematic product video with smooth camera motion and natural audio ambience",
  "aspect_ratio": "16:9",
  "duration": "auto",
  "callback_url": "https://your-domain.com/webhooks/video-task-completed"
}

Response Example

{
  "id": "task-video-xxxxxxxx",
  "model": "gemini-omni-flash-text-to-video",
  "object": "video.generation.task",
  "status": "processing",
  "progress": 0,
  "task_info": {
    "estimated_time": 60,
    "can_cancel": false,
    "video_duration": 10
  },
  "usage": {
    "credits_reserved": 59.1089,
    "billing_rule": "per_token"
  },
  "type": "video",
  "created": 1782940800
}

Billing Rules

Gemini Omni Flash is billed by token usage. The task returns a credits_reserved estimate on creation and settles from the actual usage tokens once the task completes. Token counts per material:

Text input — counted from the prompt tokens.
Video output — 5,792 tokens per second of 720p video (audio included).
Duration only affects the reservation estimate; Auto is estimated as 10 seconds.