Gemini Omni bientôt disponibleEn savoir plus

Gemini Omni API

Gemini Omni API sur EvoLink — génération vidéo et édition conversationnelle via une seule API key, workflow async par tâches et support callback.
Type de modèle:

Stabilité maximale avec une disponibilité garantie de 99,9 %. Recommandé pour la production.

Le même endpoint API est utilisé pour toutes les versions. Seul le paramètre model change.

Google Gemini Omni API et modèle de génération vidéo par IA

Utilisez Gemini Omni API pour exploiter le modèle vidéo conversationnel de Google : génération text-to-video, image-to-video et édition par dialogue, le tout via une seule API key EvoLink. Contrairement à Veo 3.1, Gemini Omni traite l'édition comme une capacité native — affinez vos clips en conversation au lieu de tout régénérer depuis zéro. Disponible mondialement sur EvoLink avec workflow async par tâches, support callback et aucun projet Google Cloud requis. L'onglet Tarifs ci-dessus indique les prix actuels pour les routes Pro et Flash.

Workflow vidéo Gemini Omni API sur EvoLink

Que pouvez-vous construire avec Gemini Omni API ?

Édition vidéo par chat

Générez un clip avec Gemini Omni, puis affinez-le en conversation — « rends l'éclairage plus chaud », « remplace la voiture rouge ». Le modèle ne réécrit que les frames concernées et conserve le reste à l'identique. Aucune boucle de régénération complète.

Édition vidéo par chat avec Gemini Omni

Remplacement d'objets et réécriture de scène

Remplacez un objet dans le cadre, supprimez un élément indésirable ou réécrivez une scène tout en préservant l'identité et le mouvement. Idéal pour l'itération de créas publicitaires et le rendu de variantes produit sans outils de montage externes.

Remplacement d'objets et réécriture de scène avec Gemini Omni

Workflow avec image de référence

Fournissez une image de référence et Gemini Omni ancre l'identité du personnage, l'éclairage et les couleurs sur l'ensemble de la vidéo générée. Combinez avec l'édition par chat pour affiner des plans spécifiques sans perdre la cohérence visuelle.

Workflow avec image de référence Gemini Omni

Génération audio synchronisée native

Gemini Omni produit audio et vidéo synchronisés en une seule passe d'inférence — les pas correspondent aux impacts, les dialogues suivent le mouvement des lèvres. Aucun pipeline TTS ou sound design séparé.

Génération audio synchronisée native Gemini Omni

Comparaison de Gemini Omni — Tous les modèles avec une seule API key EvoLink

Gemini Omni n'est pas le leader en fidélité — Seedance 2.0 domine actuellement les benchmarks publics. Là où Gemini Omni l'emporte, c'est sur le workflow : édition par chat, cohérence en contexte long et le parcours de mise en production le plus simple parmi les modèles vidéo Google.

Workflow d'édition natif par chat

Gemini Omni est le seul grand modèle vidéo Google avec l'édition comme capacité native. Veo 3.1 et Seedance 2.0 sont orientés génération. Pour l'affinement multi-tour, c'est la différence structurelle.

Cohérence des personnages en contexte long

Gemini Omni hérite de la fenêtre de contexte long de Gemini pour maintenir personnage, tenue et accessoires sur plusieurs plans dans la même tâche. Réduit le travail manuel de gestion des références dans la production de storyboards.

Pas de projet Google Cloud — Même pattern async que Veo et Seedance

Aucune configuration GCP, pas de facturation Vertex, pas d'approbation de région séparée. Si vous exécutez déjà de la génération vidéo via EvoLink, ajouter Gemini Omni se fait en changeant un seul paramètre — même format de requête, même cycle de vie des tâches que Veo 3.1, Seedance 2.0 et Kling.

Gemini Omni vs Veo 3.1 vs Seedance 2.0 — Comparaison côte à côte

Trois modèles couramment présélectionnés pour les workflows vidéo en production en 2026. Tous trois accessibles via une seule API key EvoLink.

FonctionnalitéGemini OmniVeo 3.1Seedance 2.0
Prix EvoLinkTBCÀ partir de $0.50/sÀ partir de $0.092/s
Qualité720p / 1080p (TBC)720p / 1080p / 4K480p / 720p / 1080p
Audio natifOuiOuiOui
Contrôle de référenceTexte + image + édition par chatTexte + imageTexte + image + vidéo + audio
Durée vidéo~10s4–8s + extension 16s4–15s
ÉditionNative par chat, multi-tourOrienté générationMode V2V
Idéal pourWorkflows à forte éditionBase cinématiqueProduction avec références multimodales

Comment intégrer Gemini Omni API

Trois étapes pour votre première tâche vidéo Gemini Omni. Même pattern d'intégration que Veo 3.1, Seedance 2.0 et Kling 3.0.

1

Étape 1 — Obtenez votre API key

Inscrivez-vous sur EvoLink.ai et générez votre API key depuis le tableau de bord. Aucun projet Google Cloud requis.

2

Étape 2 — Soumettez une tâche de génération

Envoyez un POST à /v1/videos/generations avec model: gemini-omni-pro (ou gemini-omni-flash) et votre prompt. Vous pouvez inclure une URL d'image de référence pour l'image-to-video et une callback_url pour la notification de complétion. L'API traite la requête de manière asynchrone et retourne un task_id.

3

Étape 3 — Récupérez le résultat vidéo

Utilisez le task_id pour interroger l'endpoint de statut, ou attendez le webhook callback_url. Quand le statut passe à completed, vous recevez une URL de téléchargement pour le MP4 généré. Les liens sont valides 24 heures.

Capacités de Gemini Omni API

Spécifications techniques pour les workflows vidéo en production.

Édition

Édition vidéo par chat

Affinement multi-tour dans un seul fil de conversation. Seules les frames modifiées sont recalculées.

Sortie

Jusqu'à 1080p, clips de ~10s

Niveaux de sortie 720p et 1080p avec des clips d'environ 10 secondes. Conçu pour le contenu court et les plans de storyboard.

Modes

Text-to-Video et Image-to-Video

T2V à partir de prompts et I2V avec image de référence en entrée. L'édition par chat s'applique aux résultats des deux modes.

Audio

Audio synchronisé natif

Image et audio générés conjointement — dialogues, sons ambiants et effets d'impact synchronisés avec l'action à l'écran.

Cohérence

Cohérence des personnages en contexte long

Hérite de la fenêtre de contexte long de Gemini pour maintenir personnage et accessoires sur plusieurs plans dans la même tâche.

Workflow

API async avec task_id et callback

Soumettez une tâche, recevez un ID, interrogez le statut ou configurez une callback_url. Même cycle de vie que les autres modèles vidéo EvoLink.

Exemple de coût — Estimations tarifaires Gemini Omni

100 × clips de 10s pour un batch réseaux sociaux

Tarification à venir

1 000 × clips de 10s/mois à l'échelle production

Tarification à venir

1 génération + 3 éditions en workflow multi-tour

Tarification à venir

Itérez avec gemini-omni-flash, puis promouvez les meilleurs résultats vers gemini-omni-pro. Les détails tarifaires seront publiés lors de la mise en ligne de la route.

Questions fréquentes sur Gemini Omni API

Everything you need to know about the product and billing.

Gemini Omni est le modèle de génération vidéo conversationnel de Google, annoncé lors de Google I/O 2026. Contrairement à Veo 3.1 — qui est orienté génération avec des sorties cinématiques text-to-video et image-to-video — Gemini Omni traite l'édition comme une capacité native. Veo 3.1 reste en tête sur la fidélité cinématique brute et la sortie 4K ; Gemini Omni domine sur le workflow d'édition multi-tour.
Facturation par tâche. Deux routes : gemini-omni-pro pour une sortie haute qualité et gemini-omni-flash pour une itération économique. La génération audio est incluse. Consultez le tableau Tarifs ci-dessus pour les prix actuels.
Non. EvoLink fournit l'accès via une seule API key. Aucun projet Google Cloud, pas de facturation Vertex, pas d'approbation de région séparée. Même authentification que Veo 3.1 et Seedance 2.0 sur EvoLink.
Pro est la route haute qualité pour la sortie en production. Flash est la route économique pour l'itération et les tests A/B. Les deux partagent la même API async — changez simplement le paramètre model.
Oui. Passez une callback_url (HTTPS) lors de la soumission de la tâche et EvoLink enverra un POST avec le résultat à votre endpoint à la complétion, en cas d'échec ou d'annulation. Les callbacks échoués sont réessayés jusqu'à 3 fois avec un backoff de 1s/2s/4s. L'interrogation de l'endpoint de statut fonctionne également.
Les tâches échouées retournent un statut failed avec un motif d'erreur. Les tâches échouées ne sont pas facturées. Pour un retry applicatif, traitez la tâche comme idempotente et resoumettez-la avec les mêmes paramètres.
Oui — c'est le principal différenciateur de Gemini Omni. Passez le task_id précédent avec une instruction d'édition en langage naturel, et le modèle ne réécrit que les frames concernées. L'édition multi-tour au sein d'une même tâche est supportée.
La route actuelle génère des clips d'environ 10 secondes maximum. Pour des narrations plus longues, enchaînez plusieurs clips en exploitant la cohérence des personnages en contexte long.
Oui. Passez une URL d'image de référence et Gemini Omni l'utilise comme ancrage d'identité pour la vidéo générée.
Seedance 2.0 domine les scores de benchmark text-to-video bruts et supporte le plus large éventail d'entrées de référence multimodales. Veo 3.1 est la base cinématique avec 4K et extension à 16s. Gemini Omni se différencie par l'édition par chat et la cohérence en contexte long.
Oui. EvoLink expose Gemini Omni, Veo 3.1, Nano Banana 2 et le reste de la famille Gemini via une seule API key. Changez simplement le paramètre model.

Tous les modèles vidéo Gemini API

EvoLink fournit un accès unifié à la famille de modèles vidéo et médias de Google via une seule API key. Tous les modèles partagent le même endpoint API EvoLink. Changez de modèle avec un seul paramètre.

POST
/v1/videos/generations

Create Gemini Omni Video Task

Confirm live route fields before production use

Submit a Gemini Omni video task through EvoLink using the live supported request fields.

Asynchronous processing returns a task ID. Use it to , or provide callback_url when callback support is documented for the route.

Store completed outputs in your own system when result URLs are time-limited.

Core Request Parameters

modelstringRequiredDefault: gemini-omni

EvoLink model parameter for the Gemini Omni route. Confirm the live value before launch.

Examplegemini-omni
promptstringRequired

Text prompt describing the desired video workflow.

ExampleCreate a short product video with smooth camera motion and clean studio lighting
callback_urlstringOptional

Optional HTTPS callback for task completion when supported by the live route.

Notes
  • Use polling if callback_url is not enabled for the route
  • Store outputs promptly when result URLs are time-limited
Examplehttps://your-domain.com/webhooks/video-task-completed

Request Example

{
  "model": "gemini-omni",
  "prompt": "Create a short product video with smooth camera motion and clean studio lighting",
  "callback_url": "https://your-domain.com/webhooks/video-task-completed"
}

Response Example

{
  "id": "task-video-xxxxxxxx",
  "model": "gemini-omni",
  "object": "video.generation.task",
  "status": "pending",
  "progress": 0,
  "task_info": {
    "can_cancel": true
  },
  "type": "video"
}