Gemini Omni API
Máxima estabilidad con 99.9% de disponibilidad garantizada. Recomendado para producción.
Todas las versiones usan el mismo endpoint API. Solo cambia el parámetro model.
Google Gemini Omni API y modelo de generación de video con IA
Usa la Gemini Omni API para ejecutar el modelo de video conversacional de Google: generación de texto a video, imagen a video y edición conversacional, todo con una sola API key de EvoLink. A diferencia de Veo 3.1, Gemini Omni trata la edición como capacidad principal — refina clips en conversación en lugar de regenerar desde cero. Disponible globalmente en EvoLink con flujo de tareas async, soporte de callback y sin necesidad de proyecto Google Cloud. La pestaña de Precios muestra las tarifas actuales para las rutas Pro y Flash.

¿Qué puedes construir con Gemini Omni API?
Edición de video por chat
Genera un clip con Gemini Omni y luego refínalo en conversación — "haz la iluminación más cálida", "reemplaza el auto rojo". El modelo reescribe solo los fotogramas afectados y mantiene el resto estable a nivel de píxel. Sin bucle de regeneración desde cero.

Reemplazo de objetos y reescritura de escenas
Intercambia un objeto en el fotograma, elimina un elemento no deseado o reescribe una escena preservando identidad y movimiento. Útil para iteración de creatividades publicitarias y renderizado de variantes de producto sin herramientas de edición externas.

Flujo con imagen de referencia
Pasa una imagen de referencia y Gemini Omni ancla la identidad del personaje, la iluminación y el color a lo largo del video generado. Combínalo con la edición por chat para refinar tomas específicas sin perder consistencia visual.

Generación nativa con audio sincronizado
Gemini Omni genera audio y video sincronizados en una sola pasada de inferencia — los pasos coinciden con los impactos, el diálogo coincide con el movimiento labial. Sin pipeline separado de TTS ni diseño de sonido.

Cómo se compara Gemini Omni — Todos los modelos con una sola API key de EvoLink
Gemini Omni no lidera en fidelidad — Seedance 2.0 encabeza actualmente los benchmarks públicos. Donde Gemini Omni destaca es en el flujo de trabajo: edición por chat, consistencia en contexto largo y la ruta de producción más simple entre los modelos de video de Google.
Flujo de edición nativo por chat
Gemini Omni es el único modelo de video importante de Google con edición como capacidad principal. Veo 3.1 y Seedance 2.0 priorizan la generación. Para refinamiento multi-turno, esta es la diferencia estructural.
Consistencia de personaje en contexto largo
Gemini Omni hereda la ventana de contexto largo de Gemini para mantener personaje, vestuario y utilería a través de múltiples tomas en la misma tarea. Reduce el trabajo manual de gestión de referencias en producción de storyboards.
Sin proyecto Google Cloud — Mismo patrón async que Veo y Seedance
Sin configuración de GCP, sin facturación de Vertex, sin aprobación de región. Si ya ejecutas generación de video a través de EvoLink, agregar Gemini Omni es un cambio de un solo parámetro — misma estructura de request, mismo ciclo de vida de tareas que Veo 3.1, Seedance 2.0 y Kling.
Gemini Omni vs Veo 3.1 vs Seedance 2.0 — Comparativa lado a lado
Tres modelos frecuentemente preseleccionados para flujos de producción de video en 2026. Los tres accesibles con una sola API key de EvoLink.
| Característica | Gemini Omni | Veo 3.1 | Seedance 2.0 |
|---|---|---|---|
| Precio en EvoLink | TBC | Desde $0.50/s | Desde $0.092/s |
| Calidad | 720p / 1080p (TBC) | 720p / 1080p / 4K | 480p / 720p / 1080p |
| Audio nativo | Sí | Sí | Sí |
| Control de referencia | Texto + imagen + edición por chat | Texto + imagen | Texto + imagen + video + audio |
| Duración del video | ~10s | 4–8s + extensión 16s | 4–15s |
| Edición | Nativa por chat, multi-turno | Prioriza generación | Modo V2V |
| Ideal para | Flujos con edición intensiva | Línea base cinematográfica | Producción con referencia multimodal |
Cómo integrar Gemini Omni API
Tres pasos para tu primera tarea de video con Gemini Omni. Mismo patrón de integración que Veo 3.1, Seedance 2.0 y Kling 3.0.
Paso 1 — Obtén tu API key
Regístrate en EvoLink.ai y genera tu API key desde el panel de control. No se requiere proyecto Google Cloud.
Paso 2 — Envía la tarea de generación
Haz un POST a /v1/videos/generations con model: gemini-omni-pro (o gemini-omni-flash) y tu prompt. Opcionalmente incluye una URL de imagen de referencia para imagen a video y una callback_url para notificación de finalización. La API procesa de forma asíncrona y devuelve un task_id.
Paso 3 — Recupera el resultado del video
Usa el task_id para consultar el endpoint de estado, o espera el webhook de callback_url. Cuando el estado llegue a completado, recibirás una URL de descarga del MP4 generado. Los enlaces son válidos por 24 horas.
Capacidades de Gemini Omni API
Especificaciones técnicas para flujos de producción de video.
Edición de video por chat
Refinamiento multi-turno en un solo hilo de chat. Solo se re-renderizan los fotogramas afectados.
Hasta 1080p, clips de ~10s
Niveles de salida en 720p y 1080p con clips de hasta aproximadamente 10 segundos. Diseñado para contenido de formato corto y tomas de storyboard.
Texto a video e imagen a video
T2V desde prompts e I2V con imagen de referencia. La edición por chat se aplica a las salidas de ambos modos.
Audio nativo sincronizado
Imagen y audio generados de forma conjunta — diálogos, sonido ambiental y efectos de impacto sincronizados con la acción en pantalla.
Consistencia de personaje en contexto largo
Hereda la ventana de contexto largo de Gemini para mantener personaje y utilería a través de las tomas en la misma tarea.
API async con task_id y callback
Envía una tarea, recibe un ID, consulta el estado o configura una callback_url. Mismo ciclo de vida que otros modelos de video en EvoLink.
Ejemplo de costos — Estimaciones de precios de Gemini Omni
100 × clips de 10s para lote de redes sociales
Precios por anunciar
1,000 × clips de 10s/mes a escala de producción
Precios por anunciar
1 generación + 3 ediciones en flujo multi-turno
Precios por anunciar
Itera con gemini-omni-flash y luego promociona los ganadores a gemini-omni-pro. Los detalles de precios se publicarán cuando la ruta esté activa.
Preguntas frecuentes sobre Gemini Omni API
Everything you need to know about the product and billing.
Todos los modelos de video Gemini API
EvoLink proporciona acceso unificado a la familia de modelos de video y medios de Google a través de una sola API key. Todos los modelos comparten el mismo endpoint de EvoLink API. Cambia de modelo con un solo parámetro.
API Reference
Select endpoint
Authentication
All APIs require Bearer Token authentication.
Authorization:
Bearer YOUR_API_KEY/v1/videos/generationsCreate Gemini Omni Video Task
Submit a Gemini Omni video task through EvoLink using the live supported request fields.
Asynchronous processing returns a task ID. Use it to , or provide callback_url when callback support is documented for the route.
Store completed outputs in your own system when result URLs are time-limited.
Core Request Parameters
modelstringRequiredDefault: gemini-omniEvoLink model parameter for the Gemini Omni route. Confirm the live value before launch.
gemini-omnipromptstringRequiredText prompt describing the desired video workflow.
Create a short product video with smooth camera motion and clean studio lightingcallback_urlstringOptionalOptional HTTPS callback for task completion when supported by the live route.
Notes
- Use polling if callback_url is not enabled for the route
- Store outputs promptly when result URLs are time-limited
https://your-domain.com/webhooks/video-task-completed