Seedance 2.0 Mini est maintenant disponibleEssayer

Gemini Omni Flash API

Gemini Omni Flash API sur EvoLink — génération et édition vidéo via une seule API key, workflow async par tâches et support callback.
Prix: 

$1.275(~ 86.7 credits) par 1M tokens d'entrée; $14.875(~ 1011.5 credits) par 1M tokens de sortie vidéo

$7.650(~ 520.2 credits) par 1M tokens d'autres sorties

Facturation basée sur les tokens. Le coût réel suit l'objet usage renvoyé par l'API.

Stabilité maximale avec une disponibilité garantie de 99,9 %. Recommandé pour la production.

Use the same video endpoint for all modes. Only the model parameter differs.

Output is 720p with audio. Duration resets to Auto; drag the slider to send a fixed 3-10s duration.
131 (suggéré : 2,000)

Choose landscape, portrait, or Auto to let the provider select the output ratio.

Auto lets the provider decide the output duration (estimated as 10s). Choose 3-10s to send a fixed duration.

Click Generate to see preview

Historique

Max 20 éléments

0 en cours · 0 terminé

Votre historique de génération apparaîtra ici

Gemini Omni Flash API sur EvoLink

Utilisez Gemini Omni Flash sur EvoLink pour le texte-vers-vidéo, l’image-vers-vidéo, les références-vers-vidéo et l’édition vidéo via une API vidéo unifiée. Les discussions publiques présentent souvent Gemini Omni comme un équivalent vidéo de Nano Banana, car il combine création vidéo multimodale et édition conversationnelle pour les workflows de vidéos courtes. Sur EvoLink, la valeur pratique est l’accès API : model IDs EvoLink, workflow async par tâches, support callback, visibilité d’usage basée sur les tokens et la même API key que pour Veo, Seedance, Kling et d’autres modèles vidéo.

Workflow vidéo Gemini Omni API sur EvoLink

Billing Rules

  • Gemini Omni Flash is billed by token usage. The task returns a credits_reserved estimate on creation and settles from the actual usage tokens once the task completes.
  • Text input: counted from the prompt tokens.
  • Video input: 5,792 tokens per second of input video.
  • Video output: 5,792 tokens per second of 720p video (audio included).
  • The output follows the input video, so video edit does not accept duration or aspect_ratio.

Pricing

Text to Video
Output video
Meter:Video output tokens
Price:
$0.015/ 1K tokens
(1.0115 Credits)
Text to Video
Input text / image / video
Meter:Input tokens
Price:
$0.0013/ 1K tokens
(0.0867 Credits)
Text to Video
Thinking / text output
Meter:Other output tokens
Price:
$0.0077/ 1K tokens
(0.5202 Credits)

If it's down, we automatically use the next cheapest available—ensuring 99.9% uptime at the best possible price.

EVOLINK · PRICE EST.gemini-omni-flash
Auto estimated as 10s · real-time

Figures are pre-bill estimates. Actual charges follow the upstream usage tokens returned by the model.

Your estimate
~$0.86959.106
Official· saves ~15%
~$1.02369.537
Tokens per task
video output57,920
text input0
other output1,000
Mode
Duration
Prompt
0 chars · ~0 text tokens

Que pouvez-vous construire avec Gemini Omni API ?

Édition vidéo par chat

Générez un clip avec Gemini Omni, puis affinez-le en conversation — « rends l'éclairage plus chaud », « remplace la voiture rouge ». Le workflow est conçu pour l’édition itérative tout en préservant la scène, l’identité du sujet et le mouvement dans la limite de ce que la route sélectionnée prend en charge.

Édition vidéo par chat avec Gemini Omni

Remplacement d'objets et réécriture de scène

Remplacez un objet dans le cadre, supprimez un élément indésirable ou réécrivez une scène tout en préservant l'identité et le mouvement. Idéal pour l'itération de créas publicitaires et le rendu de variantes produit sans outils de montage externes.

Remplacement d'objets et réécriture de scène avec Gemini Omni

Workflow avec image de référence

Fournissez une image de référence et Gemini Omni ancre l'identité du personnage, l'éclairage et les couleurs sur l'ensemble de la vidéo générée. Combinez avec l'édition par chat pour affiner des plans spécifiques sans perdre la cohérence visuelle.

Workflow avec image de référence Gemini Omni

Génération vidéo avec support audio

Les routes Gemini Omni Flash peuvent renvoyer des vidéos courtes avec audio lorsque le mode sélectionné le prend en charge, ce qui réduit le besoin d’ajouter un pipeline TTS ou sound design séparé dès la première génération.

Génération vidéo avec support audio Gemini Omni

Comparaison de Gemini Omni — Tous les modèles avec une seule API key EvoLink

Gemini Omni est surtout intéressant pour le workflow : entrées multimodales, édition conversationnelle et route EvoLink pratique pour le tester à côté de Veo, Seedance et Kling avec une seule API key.

Workflow d'édition natif par chat

Gemini Omni est orienté vers l’édition vidéo conversationnelle, tandis que Veo 3.1 et Seedance 2.0 sont généralement évalués d’abord comme routes de génération. Pour l’affinement multi-tour, c’est la différence de workflow à tester.

Cohérence des personnages en contexte long

Gemini Omni est présenté comme bénéficiant du contexte et des connaissances de Gemini pour la continuité dans les workflows multi-input et fortement édités. Évaluez ce comportement avec vos propres prompts de storyboard ou de vidéo courte.

Pas de projet Google Cloud — Même pattern async que Veo et Seedance

Aucune configuration GCP, pas de facturation Vertex, pas d'approbation de région séparée. Si vous exécutez déjà de la génération vidéo via EvoLink, ajouter Gemini Omni se fait en changeant un seul paramètre — même format de requête, même cycle de vie des tâches que Veo 3.1, Seedance 2.0 et Kling.

Gemini Omni vs Veo 3.1 vs Seedance 2.0 — Comparaison côte à côte

Trois modèles couramment présélectionnés pour les workflows vidéo en production en 2026. Tous trois accessibles via une seule API key EvoLink.

FonctionnalitéGemini OmniVeo 3.1Seedance 2.0
Prix EvoLinkBasé sur les tokensÀ partir de $0.50/sÀ partir de $0.092/s
Qualité720p720p / 1080p, upscaling 4K selon disponibilité480p / 720p / 1080p
Audio natifOuiOuiOui
Contrôle de référenceTexte + image + édition par chatTexte + imageTexte + image + vidéo + audio
Durée vidéo3-10s / AutoClips courts avec Extend pour scènes plus longues si pris en charge4–15s
ÉditionNative par chat, multi-tourOrienté générationMode V2V
Idéal pourWorkflows à forte éditionBase cinématiqueProduction avec références multimodales

Comment intégrer Gemini Omni API

Trois étapes pour votre première tâche vidéo Gemini Omni. Même pattern d'intégration que Veo 3.1, Seedance 2.0 et Kling 3.0.

1

Étape 1 — Obtenez votre API key

Inscrivez-vous sur EvoLink.ai et générez votre API key depuis le tableau de bord. Aucun projet Google Cloud requis.

2

Étape 2 — Soumettez une tâche de génération

Envoyez un POST à /v1/videos/generations avec l’un des noms de modèle Gemini Omni Flash et votre prompt. Utilisez duration pour les modes de génération de 3 à 10 secondes ou Auto, image_urls pour image-vers-vidéo ou références-vers-vidéo, video_urls pour l’édition vidéo, et éventuellement callback_url pour la notification de fin. L’API traite la requête de manière asynchrone et retourne un task_id.

3

Étape 3 — Récupérez le résultat vidéo

Utilisez le task_id pour interroger l'endpoint de statut, ou attendez le webhook callback_url. Quand le statut passe à completed, vous recevez une URL de téléchargement pour le MP4 généré. Les liens sont valides 24 heures.

Capacités de Gemini Omni API

Spécifications techniques pour les workflows vidéo en production.

Édition

Édition vidéo par chat

Affinement multi-tour dans un workflow conversationnel, avec une continuité de scène dépendante de la route sélectionnée et de la qualité des entrées.

Sortie

720p, clips de 3-10s / Auto

Sortie 720p avec des clips configurables de 3 à 10 secondes ou Auto pour les modes de génération. Auto est estimé à 10 secondes. L’édition vidéo accepte une entrée MP4 jusqu’à 10 secondes.

Modes

Text-to-Video et Image-to-Video

T2V à partir de prompts et I2V avec image de référence en entrée. L'édition par chat s'applique aux résultats des deux modes.

Audio

Sortie vidéo avec support audio

Les sorties de vidéo courte peuvent inclure de l’audio lorsque la route Gemini Omni Flash sélectionnée le prend en charge.

Cohérence

Cohérence des personnages en contexte long

Conçu pour une meilleure continuité dans les workflows multi-input et fortement édités ; validez la cohérence avec vos propres prompts de production.

Workflow

API async avec task_id et callback

Soumettez une tâche, recevez un ID, interrogez le statut ou configurez une callback_url. Même cycle de vie que les autres modèles vidéo EvoLink.

Exemple de coût — Estimations tarifaires Gemini Omni

100 × clips de 3-10s/Auto pour un batch réseaux sociaux

Utiliser les tarifs actuels du Pricing

1 000 × clips de 3-10s/Auto/mois à l'échelle production

Utiliser les tarifs actuels du Pricing

1 génération + 3 éditions en workflow multi-tour

Utiliser les tarifs actuels du Pricing

Consultez l’onglet Pricing ci-dessus pour les tarifs actuels basés sur les tokens. Sélectionnez le workflow en modifiant le paramètre model.

Questions fréquentes sur Gemini Omni API

Everything you need to know about the product and billing.

Gemini Omni est la famille de modèles vidéo multimodaux annoncée par Google lors de Google I/O 2026. Omni Flash est discuté comme une route de vidéo courte pour les entrées texte, image, vidéo et audio. Par rapport à Veo 3.1, Gemini Omni est surtout intéressant pour l'édition conversationnelle et les workflows multi-input ; Veo reste une base solide pour la génération cinématique.
La facturation suit les usage tokens retournés par l’API, avec des compteurs séparés pour input, video output et other output. Consultez le tableau des tarifs ci-dessus pour les prix actuels.
Non. EvoLink fournit l'accès via une seule API key. Aucun projet Google Cloud, pas de facturation Vertex, pas d'approbation de région séparée. Même authentification que Veo 3.1 et Seedance 2.0 sur EvoLink.
Quatre modes sont disponibles : gemini-omni-flash-text-to-video, gemini-omni-flash-image-to-video, gemini-omni-flash-reference-to-video et gemini-omni-flash-video-edit. Tous partagent le même endpoint vidéo asynchrone.
Oui. Passez une callback_url (HTTPS) lors de la soumission de la tâche et EvoLink peut envoyer des mises à jour par POST lorsque la tâche atteint un état final. L’interrogation de l’endpoint de statut fonctionne également si vous ne fournissez pas de callback URL.
Les tâches échouées retournent un statut failed avec un motif d'erreur. Pour un retry applicatif, inspectez l’erreur, conservez les paramètres d’origine pour le diagnostic et resoumettez uniquement lorsque le problème d’entrée ou le défaut temporaire est clair.
Oui — c’est l’une des principales différences de workflow de Gemini Omni. Utilisez une instruction d’édition en langage naturel et validez dans quelle mesure la route sélectionnée préserve la scène, l’identité du sujet et le mouvement entre les itérations.
Les modes de génération prennent en charge des clips configurables de 3 à 10 secondes ou Auto. Auto est estimé à 10 secondes pour la réservation. L’édition vidéo accepte une entrée MP4 jusqu’à 10 secondes. Pour des narrations plus longues, enchaînez plusieurs clips en exploitant la cohérence des personnages en contexte long.
Oui. Passez une URL d'image de référence et Gemini Omni l'utilise comme ancrage d'identité pour la vidéo générée.
Seedance 2.0 présente de solides signaux de benchmark et de références multimodales, tandis que Veo 3.1 reste une base cinématique forte avec des workflows Flow et Extend avancés. Gemini Omni se différencie par l'édition conversationnelle, la génération multi-input et l'itération de vidéos courtes.
Oui. EvoLink expose Gemini Omni, Veo 3.1, Nano Banana 2 et le reste de la famille Gemini via une seule API key. Changez simplement le paramètre model.

Tous les modèles vidéo Gemini API

EvoLink fournit un accès unifié à la famille de modèles vidéo et médias de Google via une seule API key. Tous les modèles partagent le même endpoint API EvoLink. Changez de modèle avec un seul paramètre.

POST
/v1/videos/generations

Create Gemini Omni Flash Video Task

Text to Video uses the unified EvoLink video generation endpoint. Select the mode by changing the model parameter.

Asynchronous processing returns a task ID. Use it to , or provide callback_url for completion notifications.

Generated outputs should be stored in your own system when result URLs are time-limited.

Request Parameters

modelstringRequiredDefault: gemini-omni-flash-text-to-video

Gemini Omni Flash model name. Fixed to gemini-omni-flash-text-to-video for text-to-video generation.

Examplegemini-omni-flash-text-to-video
promptstringRequired

Natural-language instruction describing the requested video.

ExampleCreate a cinematic product video with smooth camera motion and natural audio ambience
aspect_ratiostringOptionalDefault: 16:9

Output aspect ratio. Use auto to let the provider choose.

ValueDescription
16:9Landscape video
9:16Portrait video
autoLet the provider choose the output ratio
Example16:9
durationinteger or stringOptionalDefault: 10 if omitted

Output video duration in seconds. The Playground sends auto by default.

ValueDescription
3-10Any integer from 3 to 10 seconds. If omitted, the API default is 10 seconds.
autoLet the provider decide the output duration. Playground sends auto by default and estimates it as 10 seconds.
Notes
  • Use auto to let the model decide the duration; reservations estimate auto as 10 seconds
  • Affects the estimated reservation; completed tasks are billed from API usage tokens
Exampleauto
callback_urlstringOptional

Optional HTTPS callback address after task completion.

Notes
  • Use polling if no callback_url is provided
  • Store outputs promptly when result URLs are time-limited
Examplehttps://your-domain.com/webhooks/video-task-completed

Request Example

{
  "model": "gemini-omni-flash-text-to-video",
  "prompt": "Create a cinematic product video with smooth camera motion and natural audio ambience",
  "aspect_ratio": "16:9",
  "duration": "auto",
  "callback_url": "https://your-domain.com/webhooks/video-task-completed"
}

Response Example

{
  "id": "task-video-xxxxxxxx",
  "model": "gemini-omni-flash-text-to-video",
  "object": "video.generation.task",
  "status": "processing",
  "progress": 0,
  "task_info": {
    "estimated_time": 60,
    "can_cancel": false,
    "video_duration": 10
  },
  "usage": {
    "credits_reserved": 59.1089,
    "billing_rule": "per_token"
  },
  "type": "video",
  "created": 1782940800
}

Billing Rules

Gemini Omni Flash is billed by token usage. The task returns a credits_reserved estimate on creation and settles from the actual usage tokens once the task completes. Token counts per material:

  • Text input — counted from the prompt tokens.
  • Video output — 5,792 tokens per second of 720p video (audio included).
  • Duration only affects the reservation estimate; Auto is estimated as 10 seconds.