Gemini Omni próximamenteMás información

Gemini Omni API

Gemini Omni API en EvoLink — generación de video y edición por chat con una sola API key, flujo de tareas async y soporte de callback.
Tipo de modelo:

Máxima estabilidad con 99.9% de disponibilidad garantizada. Recomendado para producción.

Todas las versiones usan el mismo endpoint API. Solo cambia el parámetro model.

Google Gemini Omni API y modelo de generación de video con IA

Usa la Gemini Omni API para ejecutar el modelo de video conversacional de Google: generación de texto a video, imagen a video y edición conversacional, todo con una sola API key de EvoLink. A diferencia de Veo 3.1, Gemini Omni trata la edición como capacidad principal — refina clips en conversación en lugar de regenerar desde cero. Disponible globalmente en EvoLink con flujo de tareas async, soporte de callback y sin necesidad de proyecto Google Cloud. La pestaña de Precios muestra las tarifas actuales para las rutas Pro y Flash.

Flujo de video con Gemini Omni API en EvoLink

¿Qué puedes construir con Gemini Omni API?

Edición de video por chat

Genera un clip con Gemini Omni y luego refínalo en conversación — "haz la iluminación más cálida", "reemplaza el auto rojo". El modelo reescribe solo los fotogramas afectados y mantiene el resto estable a nivel de píxel. Sin bucle de regeneración desde cero.

Edición de video por chat con Gemini Omni

Reemplazo de objetos y reescritura de escenas

Intercambia un objeto en el fotograma, elimina un elemento no deseado o reescribe una escena preservando identidad y movimiento. Útil para iteración de creatividades publicitarias y renderizado de variantes de producto sin herramientas de edición externas.

Reemplazo de objetos y reescritura de escenas con Gemini Omni

Flujo con imagen de referencia

Pasa una imagen de referencia y Gemini Omni ancla la identidad del personaje, la iluminación y el color a lo largo del video generado. Combínalo con la edición por chat para refinar tomas específicas sin perder consistencia visual.

Flujo de imagen de referencia con Gemini Omni

Generación nativa con audio sincronizado

Gemini Omni genera audio y video sincronizados en una sola pasada de inferencia — los pasos coinciden con los impactos, el diálogo coincide con el movimiento labial. Sin pipeline separado de TTS ni diseño de sonido.

Generación nativa con audio sincronizado de Gemini Omni

Cómo se compara Gemini Omni — Todos los modelos con una sola API key de EvoLink

Gemini Omni no lidera en fidelidad — Seedance 2.0 encabeza actualmente los benchmarks públicos. Donde Gemini Omni destaca es en el flujo de trabajo: edición por chat, consistencia en contexto largo y la ruta de producción más simple entre los modelos de video de Google.

Flujo de edición nativo por chat

Gemini Omni es el único modelo de video importante de Google con edición como capacidad principal. Veo 3.1 y Seedance 2.0 priorizan la generación. Para refinamiento multi-turno, esta es la diferencia estructural.

Consistencia de personaje en contexto largo

Gemini Omni hereda la ventana de contexto largo de Gemini para mantener personaje, vestuario y utilería a través de múltiples tomas en la misma tarea. Reduce el trabajo manual de gestión de referencias en producción de storyboards.

Sin proyecto Google Cloud — Mismo patrón async que Veo y Seedance

Sin configuración de GCP, sin facturación de Vertex, sin aprobación de región. Si ya ejecutas generación de video a través de EvoLink, agregar Gemini Omni es un cambio de un solo parámetro — misma estructura de request, mismo ciclo de vida de tareas que Veo 3.1, Seedance 2.0 y Kling.

Gemini Omni vs Veo 3.1 vs Seedance 2.0 — Comparativa lado a lado

Tres modelos frecuentemente preseleccionados para flujos de producción de video en 2026. Los tres accesibles con una sola API key de EvoLink.

CaracterísticaGemini OmniVeo 3.1Seedance 2.0
Precio en EvoLinkTBCDesde $0.50/sDesde $0.092/s
Calidad720p / 1080p (TBC)720p / 1080p / 4K480p / 720p / 1080p
Audio nativo
Control de referenciaTexto + imagen + edición por chatTexto + imagenTexto + imagen + video + audio
Duración del video~10s4–8s + extensión 16s4–15s
EdiciónNativa por chat, multi-turnoPrioriza generaciónModo V2V
Ideal paraFlujos con edición intensivaLínea base cinematográficaProducción con referencia multimodal

Cómo integrar Gemini Omni API

Tres pasos para tu primera tarea de video con Gemini Omni. Mismo patrón de integración que Veo 3.1, Seedance 2.0 y Kling 3.0.

1

Paso 1 — Obtén tu API key

Regístrate en EvoLink.ai y genera tu API key desde el panel de control. No se requiere proyecto Google Cloud.

2

Paso 2 — Envía la tarea de generación

Haz un POST a /v1/videos/generations con model: gemini-omni-pro (o gemini-omni-flash) y tu prompt. Opcionalmente incluye una URL de imagen de referencia para imagen a video y una callback_url para notificación de finalización. La API procesa de forma asíncrona y devuelve un task_id.

3

Paso 3 — Recupera el resultado del video

Usa el task_id para consultar el endpoint de estado, o espera el webhook de callback_url. Cuando el estado llegue a completado, recibirás una URL de descarga del MP4 generado. Los enlaces son válidos por 24 horas.

Capacidades de Gemini Omni API

Especificaciones técnicas para flujos de producción de video.

Edición

Edición de video por chat

Refinamiento multi-turno en un solo hilo de chat. Solo se re-renderizan los fotogramas afectados.

Salida

Hasta 1080p, clips de ~10s

Niveles de salida en 720p y 1080p con clips de hasta aproximadamente 10 segundos. Diseñado para contenido de formato corto y tomas de storyboard.

Modos

Texto a video e imagen a video

T2V desde prompts e I2V con imagen de referencia. La edición por chat se aplica a las salidas de ambos modos.

Audio

Audio nativo sincronizado

Imagen y audio generados de forma conjunta — diálogos, sonido ambiental y efectos de impacto sincronizados con la acción en pantalla.

Consistencia

Consistencia de personaje en contexto largo

Hereda la ventana de contexto largo de Gemini para mantener personaje y utilería a través de las tomas en la misma tarea.

Flujo

API async con task_id y callback

Envía una tarea, recibe un ID, consulta el estado o configura una callback_url. Mismo ciclo de vida que otros modelos de video en EvoLink.

Ejemplo de costos — Estimaciones de precios de Gemini Omni

100 × clips de 10s para lote de redes sociales

Precios por anunciar

1,000 × clips de 10s/mes a escala de producción

Precios por anunciar

1 generación + 3 ediciones en flujo multi-turno

Precios por anunciar

Itera con gemini-omni-flash y luego promociona los ganadores a gemini-omni-pro. Los detalles de precios se publicarán cuando la ruta esté activa.

Preguntas frecuentes sobre Gemini Omni API

Everything you need to know about the product and billing.

Gemini Omni es el modelo de generación de video conversacional de Google, anunciado en Google I/O 2026. A diferencia de Veo 3.1 — que prioriza la generación con salidas cinematográficas de texto a video e imagen a video — Gemini Omni trata la edición como capacidad principal. Veo 3.1 sigue liderando en fidelidad cinematográfica pura y salida 4K; Gemini Omni lidera en flujo de edición multi-turno.
Se factura por tarea. Dos rutas: gemini-omni-pro para salida de alta calidad y gemini-omni-flash para iteración eficiente en costos. La generación de audio está incluida. Consulta la tabla de Precios arriba para las tarifas actuales.
No. EvoLink proporciona acceso con una sola API key. Sin proyecto Google Cloud, sin facturación de Vertex, sin aprobación de región. Misma autenticación que Veo 3.1 y Seedance 2.0 en EvoLink.
Pro es la ruta de mayor calidad para salida de producción. Flash es la ruta eficiente en costos para iteración y pruebas A/B. Ambas comparten la misma API async — cambia modificando el parámetro model.
Sí. Pasa una callback_url (HTTPS) al enviar la tarea y EvoLink hará un POST del resultado a tu endpoint cuando se complete, falle o cancele. Los callbacks fallidos se reintentan hasta 3 veces con backoff de 1s/2s/4s. También funciona la consulta al endpoint de estado de la tarea.
Las tareas fallidas devuelven un estado failed con un motivo de error. Las tareas fallidas no se facturan. Para reintento a nivel de aplicación, trata la tarea como idempotente y reenvíala con los mismos parámetros.
Sí — este es el diferenciador principal de Gemini Omni. Pasa el task_id anterior junto con una instrucción de edición en lenguaje natural, y el modelo reescribe solo los fotogramas afectados. Se soporta edición multi-turno en una sola tarea.
La ruta actual genera clips de hasta aproximadamente 10 segundos. Para narrativas más largas, encadena múltiples clips usando la consistencia de personaje en contexto largo.
Sí. Pasa una URL de imagen de referencia y Gemini Omni la usa como ancla de identidad para el video generado.
Seedance 2.0 lidera en puntuaciones de benchmark de texto a video y soporta la mayor variedad de entradas de referencia multimodal. Veo 3.1 es la línea base cinematográfica con 4K y extensión de 16s. Gemini Omni se diferencia por la edición por chat y la consistencia en contexto largo.
Sí. EvoLink expone Gemini Omni, Veo 3.1, Nano Banana 2 y el resto de la familia Gemini a través de una sola API key. Cambia modificando el parámetro model.

Todos los modelos de video Gemini API

EvoLink proporciona acceso unificado a la familia de modelos de video y medios de Google a través de una sola API key. Todos los modelos comparten el mismo endpoint de EvoLink API. Cambia de modelo con un solo parámetro.

POST
/v1/videos/generations

Create Gemini Omni Video Task

Confirm live route fields before production use

Submit a Gemini Omni video task through EvoLink using the live supported request fields.

Asynchronous processing returns a task ID. Use it to , or provide callback_url when callback support is documented for the route.

Store completed outputs in your own system when result URLs are time-limited.

Core Request Parameters

modelstringRequiredDefault: gemini-omni

EvoLink model parameter for the Gemini Omni route. Confirm the live value before launch.

Examplegemini-omni
promptstringRequired

Text prompt describing the desired video workflow.

ExampleCreate a short product video with smooth camera motion and clean studio lighting
callback_urlstringOptional

Optional HTTPS callback for task completion when supported by the live route.

Notes
  • Use polling if callback_url is not enabled for the route
  • Store outputs promptly when result URLs are time-limited
Examplehttps://your-domain.com/webhooks/video-task-completed

Request Example

{
  "model": "gemini-omni",
  "prompt": "Create a short product video with smooth camera motion and clean studio lighting",
  "callback_url": "https://your-domain.com/webhooks/video-task-completed"
}

Response Example

{
  "id": "task-video-xxxxxxxx",
  "model": "gemini-omni",
  "object": "video.generation.task",
  "status": "pending",
  "progress": 0,
  "task_info": {
    "can_cancel": true
  },
  "type": "video"
}