Gemini Omni Flash API

Gemini Omni Flash API sur EvoLink — génération et édition vidéo via une seule API key, workflow async par tâches et support callback.

Type de modèle:

✓Text to Video Image to Video Reference to Video Video Edit

Prix:

$1.275(~ 86.7 credits) par 1M tokens d'entrée; $14.875(~ 1011.5 credits) par 1M tokens de sortie vidéo

$7.650(~ 520.2 credits) par 1M tokens d'autres sorties

Facturation basée sur les tokens. Le coût réel suit l'objet usage renvoyé par l'API.

Stabilité maximale avec une disponibilité garantie de 99,9 %. Recommandé pour la production.

Use the same video endpoint for all modes. Only the model parameter differs.

Prompt*

Output is 720p with audio. Duration resets to Auto; drag the slider to send a fixed 3-10s duration.

131 (suggéré : 2,000)

Aspect Ratio

Choose landscape, portrait, or Auto to let the provider select the output ratio.

Duration

Auto lets the provider decide the output duration (estimated as 10s). Choose 3-10s to send a fixed duration.

Click Generate to see preview

Historique

Max 20 éléments

0 en cours · 0 terminé

Votre historique de génération apparaîtra ici

Gemini Omni Flash API sur EvoLink

Name: EvoLink AI Model API Platform
Brand: EvoLink
Availability: InStock

Utilisez Gemini Omni Flash sur EvoLink pour le texte-vers-vidéo, l’image-vers-vidéo, les références-vers-vidéo et l’édition vidéo via une API vidéo unifiée. Les discussions publiques présentent souvent Gemini Omni comme un équivalent vidéo de Nano Banana, car il combine création vidéo multimodale et édition conversationnelle pour les workflows de vidéos courtes. Sur EvoLink, la valeur pratique est l’accès API : model IDs EvoLink, workflow async par tâches, support callback, visibilité d’usage basée sur les tokens et la même API key que pour Veo, Seedance, Kling et d’autres modèles vidéo.

Workflow vidéo Gemini Omni API sur EvoLink

Billing Rules

•Gemini Omni Flash is billed by token usage. The task returns a credits_reserved estimate on creation and settles from the actual usage tokens once the task completes.
•Text input: counted from the prompt tokens.
•Video input: 5,792 tokens per second of input video.
•Video output: 5,792 tokens per second of 720p video (audio included).
•The output follows the input video, so video edit does not accept duration or aspect_ratio.

Pricing

Model	Mode	Meter	Price
Text to Video	Output video	Video output tokens	$0.015/ 1K tokens(1.0115 Credits)
Text to Video	Input text / image / video	Input tokens	$0.0013/ 1K tokens(0.0867 Credits)
Text to Video	Thinking / text output	Other output tokens	$0.0077/ 1K tokens(0.5202 Credits)

Text to Video

Output video

Meter:Video output tokens

Price:

$0.015/ 1K tokens

(1.0115 Credits)

Text to Video

Input text / image / video

Meter:Input tokens

Price:

$0.0013/ 1K tokens

(0.0867 Credits)

Text to Video

Thinking / text output

Meter:Other output tokens

Price:

$0.0077/ 1K tokens

(0.5202 Credits)

If it's down, we automatically use the next cheapest available—ensuring 99.9% uptime at the best possible price.

EVOLINK · PRICE EST.gemini-omni-flash

Auto estimated as 10s · real-time

Figures are pre-bill estimates. Actual charges follow the upstream usage tokens returned by the model.

Your estimate

~$0.86959.106

Official· saves ~15%

~$1.02369.537

Tokens per task

video output57,920

text input0

other output1,000

Mode

Duration

Prompt

0 chars · ~0 text tokens

Que pouvez-vous construire avec Gemini Omni API ?

Édition vidéo par chat

Générez un clip avec Gemini Omni, puis affinez-le en conversation — « rends l'éclairage plus chaud », « remplace la voiture rouge ». Le workflow est conçu pour l’édition itérative tout en préservant la scène, l’identité du sujet et le mouvement dans la limite de ce que la route sélectionnée prend en charge.

Essayer dans le playground

Remplacement d'objets et réécriture de scène

Remplacez un objet dans le cadre, supprimez un élément indésirable ou réécrivez une scène tout en préservant l'identité et le mouvement. Idéal pour l'itération de créas publicitaires et le rendu de variantes produit sans outils de montage externes.

Voir le workflow

Remplacement d'objets et réécriture de scène avec Gemini Omni

Workflow avec image de référence

Fournissez une image de référence et Gemini Omni ancre l'identité du personnage, l'éclairage et les couleurs sur l'ensemble de la vidéo générée. Combinez avec l'édition par chat pour affiner des plans spécifiques sans perdre la cohérence visuelle.

Commencer avec l'API

Workflow avec image de référence Gemini Omni

Génération vidéo avec support audio

Les routes Gemini Omni Flash peuvent renvoyer des vidéos courtes avec audio lorsque le mode sélectionné le prend en charge, ce qui réduit le besoin d’ajouter un pipeline TTS ou sound design séparé dès la première génération.

Commencer avec l'API

Génération vidéo avec support audio Gemini Omni

Comparaison de Gemini Omni — Tous les modèles avec une seule API key EvoLink

Gemini Omni est surtout intéressant pour le workflow : entrées multimodales, édition conversationnelle et route EvoLink pratique pour le tester à côté de Veo, Seedance et Kling avec une seule API key.

Workflow d'édition natif par chat

Gemini Omni est orienté vers l’édition vidéo conversationnelle, tandis que Veo 3.1 et Seedance 2.0 sont généralement évalués d’abord comme routes de génération. Pour l’affinement multi-tour, c’est la différence de workflow à tester.

Cohérence des personnages en contexte long

Gemini Omni est présenté comme bénéficiant du contexte et des connaissances de Gemini pour la continuité dans les workflows multi-input et fortement édités. Évaluez ce comportement avec vos propres prompts de storyboard ou de vidéo courte.

Pas de projet Google Cloud — Même pattern async que Veo et Seedance

Aucune configuration GCP, pas de facturation Vertex, pas d'approbation de région séparée. Si vous exécutez déjà de la génération vidéo via EvoLink, ajouter Gemini Omni se fait en changeant un seul paramètre — même format de requête, même cycle de vie des tâches que Veo 3.1, Seedance 2.0 et Kling.

Gemini Omni vs Veo 3.1 vs Seedance 2.0 — Comparaison côte à côte

Trois modèles couramment présélectionnés pour les workflows vidéo en production en 2026. Tous trois accessibles via une seule API key EvoLink.

Fonctionnalité	Gemini Omni	Veo 3.1	Seedance 2.0
Prix EvoLink	Basé sur les tokens	À partir de $0.50/s	À partir de $0.092/s
Qualité	720p	720p / 1080p, upscaling 4K selon disponibilité	480p / 720p / 1080p
Audio natif	Oui	Oui	Oui
Contrôle de référence	Texte + image + édition par chat	Texte + image	Texte + image + vidéo + audio
Durée vidéo	3-10s / Auto	Clips courts avec Extend pour scènes plus longues si pris en charge	4–15s
Édition	Native par chat, multi-tour	Orienté génération	Mode V2V
Idéal pour	Workflows à forte édition	Base cinématique	Production avec références multimodales

Gemini Omni vs Veo 3.1 →

Comment intégrer Gemini Omni API

Trois étapes pour votre première tâche vidéo Gemini Omni. Même pattern d'intégration que Veo 3.1, Seedance 2.0 et Kling 3.0.

Étape 1 — Obtenez votre API key

Inscrivez-vous sur EvoLink.ai et générez votre API key depuis le tableau de bord. Aucun projet Google Cloud requis.

Étape 2 — Soumettez une tâche de génération

Envoyez un POST à /v1/videos/generations avec l’un des noms de modèle Gemini Omni Flash et votre prompt. Utilisez duration pour les modes de génération de 3 à 10 secondes ou Auto, image_urls pour image-vers-vidéo ou références-vers-vidéo, video_urls pour l’édition vidéo, et éventuellement callback_url pour la notification de fin. L’API traite la requête de manière asynchrone et retourne un task_id.

Étape 3 — Récupérez le résultat vidéo

Utilisez le task_id pour interroger l'endpoint de statut, ou attendez le webhook callback_url. Quand le statut passe à completed, vous recevez une URL de téléchargement pour le MP4 généré. Les liens sont valides 24 heures.

Capacités de Gemini Omni API

Spécifications techniques pour les workflows vidéo en production.

Édition

Édition vidéo par chat

Affinement multi-tour dans un workflow conversationnel, avec une continuité de scène dépendante de la route sélectionnée et de la qualité des entrées.

Sortie

720p, clips de 3-10s / Auto

Sortie 720p avec des clips configurables de 3 à 10 secondes ou Auto pour les modes de génération. Auto est estimé à 10 secondes. L’édition vidéo accepte une entrée MP4 jusqu’à 10 secondes.

Modes

Text-to-Video et Image-to-Video

T2V à partir de prompts et I2V avec image de référence en entrée. L'édition par chat s'applique aux résultats des deux modes.

Audio

Sortie vidéo avec support audio

Les sorties de vidéo courte peuvent inclure de l’audio lorsque la route Gemini Omni Flash sélectionnée le prend en charge.

Cohérence

Cohérence des personnages en contexte long

Conçu pour une meilleure continuité dans les workflows multi-input et fortement édités ; validez la cohérence avec vos propres prompts de production.

Workflow

API async avec task_id et callback

Soumettez une tâche, recevez un ID, interrogez le statut ou configurez une callback_url. Même cycle de vie que les autres modèles vidéo EvoLink.

Exemple de coût — Estimations tarifaires Gemini Omni

100 × clips de 3-10s/Auto pour un batch réseaux sociaux

Utiliser les tarifs actuels du Pricing

1 000 × clips de 3-10s/Auto/mois à l'échelle production

Utiliser les tarifs actuels du Pricing

1 génération + 3 éditions en workflow multi-tour

Utiliser les tarifs actuels du Pricing

Consultez l’onglet Pricing ci-dessus pour les tarifs actuels basés sur les tokens. Sélectionnez le workflow en modifiant le paramètre model.

Découvrir plus de modèles de génération vidéo sur EvoLink →

Questions fréquentes sur Gemini Omni API

Everything you need to know about the product and billing.

Gemini Omni est la famille de modèles vidéo multimodaux annoncée par Google lors de Google I/O 2026. Omni Flash est discuté comme une route de vidéo courte pour les entrées texte, image, vidéo et audio. Par rapport à Veo 3.1, Gemini Omni est surtout intéressant pour l'édition conversationnelle et les workflows multi-input ; Veo reste une base solide pour la génération cinématique.

La facturation suit les usage tokens retournés par l’API, avec des compteurs séparés pour input, video output et other output. Consultez le tableau des tarifs ci-dessus pour les prix actuels.

Non. EvoLink fournit l'accès via une seule API key. Aucun projet Google Cloud, pas de facturation Vertex, pas d'approbation de région séparée. Même authentification que Veo 3.1 et Seedance 2.0 sur EvoLink.

Quatre modes sont disponibles : gemini-omni-flash-text-to-video, gemini-omni-flash-image-to-video, gemini-omni-flash-reference-to-video et gemini-omni-flash-video-edit. Tous partagent le même endpoint vidéo asynchrone.

Oui. Passez une callback_url (HTTPS) lors de la soumission de la tâche et EvoLink peut envoyer des mises à jour par POST lorsque la tâche atteint un état final. L’interrogation de l’endpoint de statut fonctionne également si vous ne fournissez pas de callback URL.

Les tâches échouées retournent un statut failed avec un motif d'erreur. Pour un retry applicatif, inspectez l’erreur, conservez les paramètres d’origine pour le diagnostic et resoumettez uniquement lorsque le problème d’entrée ou le défaut temporaire est clair.

Oui — c’est l’une des principales différences de workflow de Gemini Omni. Utilisez une instruction d’édition en langage naturel et validez dans quelle mesure la route sélectionnée préserve la scène, l’identité du sujet et le mouvement entre les itérations.

Les modes de génération prennent en charge des clips configurables de 3 à 10 secondes ou Auto. Auto est estimé à 10 secondes pour la réservation. L’édition vidéo accepte une entrée MP4 jusqu’à 10 secondes. Pour des narrations plus longues, enchaînez plusieurs clips en exploitant la cohérence des personnages en contexte long.

Oui. Passez une URL d'image de référence et Gemini Omni l'utilise comme ancrage d'identité pour la vidéo générée.

Seedance 2.0 présente de solides signaux de benchmark et de références multimodales, tandis que Veo 3.1 reste une base cinématique forte avec des workflows Flow et Extend avancés. Gemini Omni se différencie par l'édition conversationnelle, la génération multi-input et l'itération de vidéos courtes.

Oui. EvoLink expose Gemini Omni, Veo 3.1, Nano Banana 2 et le reste de la famille Gemini via une seule API key. Changez simplement le paramètre model.

Tous les modèles vidéo Gemini API

EvoLink fournit un accès unifié à la famille de modèles vidéo et médias de Google via une seule API key. Tous les modèles partagent le même endpoint API EvoLink. Changez de modèle avec un seul paramètre.

Explorer la famille Gemini Voir Veo 3.1 Voir Nano Banana 2

API Reference

Select endpoint

Endpoints

Authentication

All APIs require Bearer Token authentication.

Header

Authorization: 
Bearer YOUR_API_KEY

Get API Key

POST

/v1/videos/generations

Create Gemini Omni Flash Video Task

Text to Video uses the unified EvoLink video generation endpoint. Select the mode by changing the model parameter.

Asynchronous processing returns a task ID. Use it to , or provide callback_url for completion notifications.

Generated outputs should be stored in your own system when result URLs are time-limited.

Request Parameters

modelstringRequiredDefault: gemini-omni-flash-text-to-video

Gemini Omni Flash model name. Fixed to gemini-omni-flash-text-to-video for text-to-video generation.

Examplegemini-omni-flash-text-to-video

promptstringRequired

Natural-language instruction describing the requested video.

ExampleCreate a cinematic product video with smooth camera motion and natural audio ambience

aspect_ratiostringOptionalDefault: 16:9

Output aspect ratio. Use auto to let the provider choose.

Value	Description
16:9	Landscape video
9:16	Portrait video
auto	Let the provider choose the output ratio

Example16:9

durationinteger or stringOptionalDefault: 10 if omitted

Output video duration in seconds. The Playground sends auto by default.

Value	Description
3-10	Any integer from 3 to 10 seconds. If omitted, the API default is 10 seconds.
auto	Let the provider decide the output duration. Playground sends auto by default and estimates it as 10 seconds.

Notes

Use auto to let the model decide the duration; reservations estimate auto as 10 seconds
Affects the estimated reservation; completed tasks are billed from API usage tokens

Exampleauto

callback_urlstringOptional

Optional HTTPS callback address after task completion.

Notes

Use polling if no callback_url is provided
Store outputs promptly when result URLs are time-limited

Examplehttps://your-domain.com/webhooks/video-task-completed

Request Example

{
  "model": "gemini-omni-flash-text-to-video",
  "prompt": "Create a cinematic product video with smooth camera motion and natural audio ambience",
  "aspect_ratio": "16:9",
  "duration": "auto",
  "callback_url": "https://your-domain.com/webhooks/video-task-completed"
}

Response Example

{
  "id": "task-video-xxxxxxxx",
  "model": "gemini-omni-flash-text-to-video",
  "object": "video.generation.task",
  "status": "processing",
  "progress": 0,
  "task_info": {
    "estimated_time": 60,
    "can_cancel": false,
    "video_duration": 10
  },
  "usage": {
    "credits_reserved": 59.1089,
    "billing_rule": "per_token"
  },
  "type": "video",
  "created": 1782940800
}

Billing Rules

Gemini Omni Flash is billed by token usage. The task returns a credits_reserved estimate on creation and settles from the actual usage tokens once the task completes. Token counts per material:

Text input — counted from the prompt tokens.
Video output — 5,792 tokens per second of 720p video (audio included).
Duration only affects the reservation estimate; Auto is estimated as 10 seconds.