Seedance 2.0 Mini ya está disponibleProbar ahora

Gemini Omni Flash API

Gemini Omni Flash API en EvoLink — generación y edición de vídeo con una sola API key, flujo de tareas async y soporte de callback.
Precio: 

$1.275(~ 86.7 credits) por 1M tokens de entrada; $14.875(~ 1011.5 credits) por 1M tokens de salida de vídeo

$7.650(~ 520.2 credits) por 1M tokens de otras salidas

Facturación basada en tokens. El coste real sigue el objeto usage devuelto por la API.

Máxima estabilidad con 99.9% de disponibilidad garantizada. Recomendado para producción.

Use the same video endpoint for all modes. Only the model parameter differs.

Output is 720p with audio. Duration resets to Auto; drag the slider to send a fixed 3-10s duration.
131 (sugerido: 2,000)

Choose landscape, portrait, or Auto to let the provider select the output ratio.

Auto lets the provider decide the output duration (estimated as 10s). Choose 3-10s to send a fixed duration.

Click Generate to see preview

Historial

Máx. 20 elementos

0 ejecutando · 0 completado

Tu historial de generación aparecerá aquí

Gemini Omni Flash API en EvoLink

Usa Gemini Omni Flash en EvoLink para texto a vídeo, imagen a vídeo, referencias a vídeo y edición de vídeo mediante una API de vídeo unificada. La conversación pública suele presentar Gemini Omni como una contraparte de video de Nano Banana porque lleva la creación multimodal y la edición conversacional a workflows de video corto. En EvoLink, el valor práctico está en el acceso API: model IDs de EvoLink, flujo de tareas async, soporte de callback, visibilidad de uso basada en tokens y la misma API key que ya se usa para Veo, Seedance, Kling y otros modelos de video.

Flujo de video con Gemini Omni API en EvoLink

Billing Rules

  • Gemini Omni Flash is billed by token usage. The task returns a credits_reserved estimate on creation and settles from the actual usage tokens once the task completes.
  • Text input: counted from the prompt tokens.
  • Video input: 5,792 tokens per second of input video.
  • Video output: 5,792 tokens per second of 720p video (audio included).
  • The output follows the input video, so video edit does not accept duration or aspect_ratio.

Pricing

Text to Video
Output video
Meter:Video output tokens
Price:
$0.015/ 1K tokens
(1.0115 Credits)
Text to Video
Input text / image / video
Meter:Input tokens
Price:
$0.0013/ 1K tokens
(0.0867 Credits)
Text to Video
Thinking / text output
Meter:Other output tokens
Price:
$0.0077/ 1K tokens
(0.5202 Credits)

If it's down, we automatically use the next cheapest available—ensuring 99.9% uptime at the best possible price.

EVOLINK · PRICE EST.gemini-omni-flash
Auto estimated as 10s · real-time

Figures are pre-bill estimates. Actual charges follow the upstream usage tokens returned by the model.

Your estimate
~$0.86959.106
Official· saves ~15%
~$1.02369.537
Tokens per task
video output57,920
text input0
other output1,000
Mode
Duration
Prompt
0 chars · ~0 text tokens

¿Qué puedes construir con Gemini Omni API?

Edición de video por chat

Genera un clip con Gemini Omni y luego refínalo en conversación — "haz la iluminación más cálida", "reemplaza el auto rojo". El workflow está diseñado para edición iterativa y busca conservar la escena, la identidad del sujeto y el movimiento dentro de lo que soporte la ruta seleccionada.

Edición de video por chat con Gemini Omni

Reemplazo de objetos y reescritura de escenas

Intercambia un objeto en el fotograma, elimina un elemento no deseado o reescribe una escena preservando identidad y movimiento. Útil para iteración de creatividades publicitarias y renderizado de variantes de producto sin herramientas de edición externas.

Reemplazo de objetos y reescritura de escenas con Gemini Omni

Flujo con imagen de referencia

Pasa una imagen de referencia y Gemini Omni ancla la identidad del personaje, la iluminación y el color a lo largo del video generado. Combínalo con la edición por chat para refinar tomas específicas sin perder consistencia visual.

Flujo de imagen de referencia con Gemini Omni

Generación de video con soporte de audio

Las rutas Gemini Omni Flash pueden devolver salidas de video corto con audio cuando el modo seleccionado lo admite, reduciendo la necesidad de unir un pipeline separado de TTS o diseño de sonido en la primera generación.

Generación de video con soporte de audio de Gemini Omni

Cómo se compara Gemini Omni — Todos los modelos con una sola API key de EvoLink

Gemini Omni destaca sobre todo por workflow: entradas multimodales, edición conversacional y una ruta práctica de EvoLink para probarlo junto a Veo, Seedance y Kling con una sola API key.

Flujo de edición nativo por chat

Gemini Omni está orientado a la edición conversacional de video, mientras que Veo 3.1 y Seedance 2.0 suelen evaluarse primero como rutas de generación. Para refinamiento multi-turno, esta es la diferencia de workflow que conviene probar.

Consistencia de personaje en contexto largo

Gemini Omni se reporta como beneficiado por el contexto y el conocimiento del mundo de Gemini para continuidad en workflows multi-input y con mucha edición. Evalúa este comportamiento con tus propios prompts de storyboard o video corto.

Sin proyecto Google Cloud — Mismo patrón async que Veo y Seedance

Sin configuración de GCP, sin facturación de Vertex, sin aprobación de región. Si ya ejecutas generación de video a través de EvoLink, agregar Gemini Omni es un cambio de un solo parámetro — misma estructura de request, mismo ciclo de vida de tareas que Veo 3.1, Seedance 2.0 y Kling.

Gemini Omni vs Veo 3.1 vs Seedance 2.0 — Comparativa lado a lado

Tres modelos frecuentemente preseleccionados para flujos de producción de video en 2026. Los tres accesibles con una sola API key de EvoLink.

CaracterísticaGemini OmniVeo 3.1Seedance 2.0
Precio en EvoLinkBasado en tokensDesde $0.50/sDesde $0.092/s
Calidad720p720p / 1080p, escalado 4K donde esté disponible480p / 720p / 1080p
Audio nativo
Control de referenciaTexto + imagen + edición por chatTexto + imagenTexto + imagen + video + audio
Duración del video3-10s / AutoClips cortos con Extend para escenas más largas cuando esté disponible4–15s
EdiciónNativa por chat, multi-turnoPrioriza generaciónModo V2V
Ideal paraFlujos con edición intensivaLínea base cinematográficaProducción con referencia multimodal

Cómo integrar Gemini Omni API

Tres pasos para tu primera tarea de video con Gemini Omni. Mismo patrón de integración que Veo 3.1, Seedance 2.0 y Kling 3.0.

1

Paso 1 — Obtén tu API key

Regístrate en EvoLink.ai y genera tu API key desde el panel de control. No se requiere proyecto Google Cloud.

2

Paso 2 — Envía la tarea de generación

Haz un POST a /v1/videos/generations con uno de los nombres de modelo de Gemini Omni Flash y tu prompt. Usa duration para modos generativos de 3-10 segundos o Auto, image_urls para imagen a vídeo o referencias a vídeo, video_urls para edición de vídeo y callback_url opcional para notificaciones de finalización. La API procesa de forma asíncrona y devuelve un task_id.

3

Paso 3 — Recupera el resultado del video

Usa el task_id para consultar el endpoint de estado, o espera el webhook de callback_url. Cuando el estado llegue a completado, recibirás una URL de descarga del MP4 generado. Los enlaces son válidos por 24 horas.

Capacidades de Gemini Omni API

Especificaciones técnicas para flujos de producción de video.

Edición

Edición de video por chat

Refinamiento multi-turno en un workflow conversacional, con continuidad de escena dependiente de la ruta seleccionada y la calidad de entrada.

Salida

720p, clips de 3-10s / Auto

Salida 720p con clips configurables de 3-10 segundos o Auto para modos generativos. Auto se estima como 10 segundos. La edición de vídeo acepta un MP4 de entrada de hasta 10 segundos.

Modos

Texto a video e imagen a video

T2V desde prompts e I2V con imagen de referencia. La edición por chat se aplica a las salidas de ambos modos.

Audio

Salida de video con soporte de audio

Las salidas de video corto pueden incluir audio cuando la ruta Gemini Omni Flash seleccionada lo soporta.

Consistencia

Consistencia de personaje en contexto largo

Diseñado para mayor continuidad en workflows multi-input y con mucha edición; valida la consistencia con tus propios prompts de producción.

Flujo

API async con task_id y callback

Envía una tarea, recibe un ID, consulta el estado o configura una callback_url. Mismo ciclo de vida que otros modelos de video en EvoLink.

Ejemplo de costos — Estimaciones de precios de Gemini Omni

100 × clips de 3-10s/Auto para lote de redes sociales

Usa las tarifas actuales de Pricing

1,000 × clips de 3-10s/Auto/mes a escala de producción

Usa las tarifas actuales de Pricing

1 generación + 3 ediciones en flujo multi-turno

Usa las tarifas actuales de Pricing

Consulta la pestaña Pricing para ver las tarifas tokenizadas actuales. Selecciona el flujo cambiando el parámetro model.

Preguntas frecuentes sobre Gemini Omni API

Everything you need to know about the product and billing.

Gemini Omni es la familia de modelos de video multimodales anunciada por Google en Google I/O 2026. Omni Flash se comenta como una ruta de video corto para entradas de texto, imagen, video y audio. Frente a Veo 3.1, Gemini Omni destaca sobre todo por la edición conversacional y los workflows multi-input; Veo sigue siendo una base sólida para generación cinematográfica.
La facturación sigue los usage tokens devueltos por la API, con métricas separadas para input, video output y other output. Consulta la tabla de precios para las tarifas actuales.
No. EvoLink proporciona acceso con una sola API key. Sin proyecto Google Cloud, sin facturación de Vertex, sin aprobación de región. Misma autenticación que Veo 3.1 y Seedance 2.0 en EvoLink.
Hay cuatro modos disponibles: gemini-omni-flash-text-to-video, gemini-omni-flash-image-to-video, gemini-omni-flash-reference-to-video y gemini-omni-flash-video-edit. Todos comparten el mismo endpoint asíncrono de vídeo.
Sí. Pasa una callback_url (HTTPS) al enviar la tarea y EvoLink puede enviar actualizaciones por POST cuando la tarea llegue a un estado terminal. También funciona la consulta al endpoint de estado si no proporcionas callback URL.
Las tareas fallidas devuelven un estado failed con un motivo de error. Para reintentos a nivel de aplicación, inspecciona el error, conserva los parámetros originales para depuración y reenvía solo cuando el problema de entrada o fallo temporal esté claro.
Sí — esta es una de las diferencias principales de workflow de Gemini Omni. Usa una instrucción de edición en lenguaje natural y valida qué tan bien la ruta seleccionada conserva la escena, la identidad del sujeto y el movimiento entre iteraciones.
Los modos generativos admiten clips configurables de 3-10 segundos o Auto. Auto se estima como 10 segundos para la reserva. La edición de vídeo acepta un MP4 de entrada de hasta 10 segundos. Para narrativas más largas, encadena múltiples clips usando la consistencia de personaje en contexto largo.
Sí. Pasa una URL de imagen de referencia y Gemini Omni la usa como ancla de identidad para el video generado.
Seedance 2.0 muestra señales sólidas en benchmarks y referencias multimodales, mientras que Veo 3.1 sigue siendo una base cinematográfica fuerte con workflows avanzados de Flow y Extend. Gemini Omni se diferencia por la edición conversacional, la generación multi-input y la iteración de video corto.
Sí. EvoLink expone Gemini Omni, Veo 3.1, Nano Banana 2 y el resto de la familia Gemini a través de una sola API key. Cambia modificando el parámetro model.

Todos los modelos de video Gemini API

EvoLink proporciona acceso unificado a la familia de modelos de video y medios de Google a través de una sola API key. Todos los modelos comparten el mismo endpoint de EvoLink API. Cambia de modelo con un solo parámetro.

POST
/v1/videos/generations

Create Gemini Omni Flash Video Task

Text to Video uses the unified EvoLink video generation endpoint. Select the mode by changing the model parameter.

Asynchronous processing returns a task ID. Use it to , or provide callback_url for completion notifications.

Generated outputs should be stored in your own system when result URLs are time-limited.

Request Parameters

modelstringRequiredDefault: gemini-omni-flash-text-to-video

Gemini Omni Flash model name. Fixed to gemini-omni-flash-text-to-video for text-to-video generation.

Examplegemini-omni-flash-text-to-video
promptstringRequired

Natural-language instruction describing the requested video.

ExampleCreate a cinematic product video with smooth camera motion and natural audio ambience
aspect_ratiostringOptionalDefault: 16:9

Output aspect ratio. Use auto to let the provider choose.

ValueDescription
16:9Landscape video
9:16Portrait video
autoLet the provider choose the output ratio
Example16:9
durationinteger or stringOptionalDefault: 10 if omitted

Output video duration in seconds. The Playground sends auto by default.

ValueDescription
3-10Any integer from 3 to 10 seconds. If omitted, the API default is 10 seconds.
autoLet the provider decide the output duration. Playground sends auto by default and estimates it as 10 seconds.
Notes
  • Use auto to let the model decide the duration; reservations estimate auto as 10 seconds
  • Affects the estimated reservation; completed tasks are billed from API usage tokens
Exampleauto
callback_urlstringOptional

Optional HTTPS callback address after task completion.

Notes
  • Use polling if no callback_url is provided
  • Store outputs promptly when result URLs are time-limited
Examplehttps://your-domain.com/webhooks/video-task-completed

Request Example

{
  "model": "gemini-omni-flash-text-to-video",
  "prompt": "Create a cinematic product video with smooth camera motion and natural audio ambience",
  "aspect_ratio": "16:9",
  "duration": "auto",
  "callback_url": "https://your-domain.com/webhooks/video-task-completed"
}

Response Example

{
  "id": "task-video-xxxxxxxx",
  "model": "gemini-omni-flash-text-to-video",
  "object": "video.generation.task",
  "status": "processing",
  "progress": 0,
  "task_info": {
    "estimated_time": 60,
    "can_cancel": false,
    "video_duration": 10
  },
  "usage": {
    "credits_reserved": 59.1089,
    "billing_rule": "per_token"
  },
  "type": "video",
  "created": 1782940800
}

Billing Rules

Gemini Omni Flash is billed by token usage. The task returns a credits_reserved estimate on creation and settles from the actual usage tokens once the task completes. Token counts per material:

  • Text input — counted from the prompt tokens.
  • Video output — 5,792 tokens per second of 720p video (audio included).
  • Duration only affects the reservation estimate; Auto is estimated as 10 seconds.