Seedance 2.0 API — Coming SoonGet early access

Seedance 2.0 API

Seedance 2.0 is ByteDance's second-generation video model. It generates up to 1080p, 15s video with native audio sync. The breakthrough is the @-reference system: upload video, audio, or image references, and the model extracts camera paths, motion patterns, rhythm, and style.EvoLink will enable Seedance 2.0 access as soon as the official API is live. Join Discord for launch updates, the final model ID once it's live, and day-one pricing/quota notes (or get one launch email).Key takeaway: You can integrate with EvoLink today using the same async workflow (submit → poll → fetch). See the API tab for request format. When Seedance 2.0 becomes available, you'll enable it by switching one model value — no code rewrite.

Get Early Access

Seedance 2.0 : Génération vidéo IA multimodale

Générez de la vidéo cinématographique avec audio synchronisé à partir de références texte, image, vidéo et audio — en un seul appel API. Seedance 2.0 de ByteDance introduit le système @-référence pour extraire mouvement, caméra et style des médias sources. Évolutions depuis 1.5 Pro : entrées référence vidéo et audio, jusqu'à 9 images + 3 vidéos + 3 audios par requête, mode édition vidéo-vers-vidéo, et 15 s max.

Seedance 2.0 API génération vidéo multimodale showcase

Que pouvez-vous créer avec Seedance 2.0 API ?

Seedance 2.0 Production vidéo pilotée par références

Avec Seedance 2.0 API, téléchargez une vidéo de référence et le modèle extrait le mouvement de caméra, la dynamique et le style de transition via le système @-référence. Générez des dizaines de variantes cohérentes avec votre marque à partir d'un seul clip — sans retournage. Jusqu'à 3 références vidéo par requête pour combiner caméra, mouvement et style de sources différentes.

Seedance 2.0 Contenu audio-synchronisé à partir de références

Seedance 2.0 API permet de fournir jusqu'à 3 pistes audio en référence. Seedance 2.0 aligne coupes, énergie de mouvement et transitions de scène sur le beat et le rythme. La sortie inclut un audio synchronisé nativement — lip-sync de dialogue en plusieurs langues, effets sonores en phase avec l'action, musique de fond adaptée à l'humeur de votre référence audio.

Seedance 2.0 Storyboard multi-références vers vidéo

Avec Seedance 2.0, combinez jusqu'à 9 images de référence avec des prompts texte pour contrôler composition, personnage et environnement entre les plans. Seedance 2.0 comble les lacunes entre les keyframes avec une identité, un éclairage et un style cohérents. Idéal pour les publicités, les démos produit et les storyboards animés.

Seedance 2.0 en comparaison — Tous les modèles avec une seule clé EvoLink

Seedance 2.0 se distingue par ses entrées @-référence multimodales, l'édition vidéo-vers-vidéo et le nombre le plus élevé de références image parmi les principaux modèles de génération vidéo.

Seedance 2.0 API Système @-référence multimodal

Seedance 2.0 est le seul modèle supportant des références vidéo, audio et image dans une seule requête. Téléchargez jusqu'à 9 images + 3 vidéos + 3 pistes audio pour contrôler caméra, mouvement, rythme et style — des capacités absentes de Sora 2, Kling 3.0 ou Seedance 1.5 Pro.

Seedance 2.0 API Édition vidéo-vers-vidéo

Seedance 2.0 API permet de modifier des segments, personnages ou actions spécifiques dans des vidéos existantes. Seedance 2.0 prend en charge les modifications V2V ciblées — une fonctionnalité non disponible dans Sora 2 ou Kling 3.0.

Seedance 2.0 API Tarifs compétitifs via EvoLink

Accédez à Seedance 2.0 API via l'API unifiée d'EvoLink avec une facturation compétitive à la seconde. Une clé API vous donne accès à Seedance 2.0, Sora 2, Kling 3.0, Veo 3.1 et plus — avec routage automatique vers le meilleur fournisseur.

Pricing & Specs (Quick Comparison)

A transparent benchmark across leading video APIs. Seedance 2.0 pricing will be published on launch.

MetricSeedance 2.0Sora 2Kling 3.0Veo 3.1
Price (USD / second, incl. audio)Coming soon$0.10 (720p)$0.112 (1080p)$0.40 (1080p)
Typical cost per videoComing soon$1.20 / 12s$1.12 / 10s$3.20 / 8s
Max duration15s12s15s8s
Max resolutionTBD720p (Std) / 1080p (Pro)1080p / 4K (tiered)1080p / 4K (tiered)
Inputs supportedText, Image, Video, AudioText, ImageText, Image, Video, AudioText, Image
Reference controls (Video / Audio / Image) / / / / / / / /

Notes: Prices are estimates and may vary by tier/region/provider. "Typical cost per video" examples may use different durations/resolutions as shown. Last updated: 2026-02-21.

Comment intégrer Seedance 2.0 API

Intégrez la génération vidéo multimodale dans votre application via l'API unifiée d'EvoLink. Supporte les modes T2V, I2V et V2V.

1

Étape 1 — Obtenir votre clé API

Sign up on EvoLink.ai and generate your secure API key from the dashboard. This key authenticates all your requests to the Seedance 2.0 endpoint.

2

Étape 2 — Soumettre une tâche de génération

Send a POST request to /v1/videos/generations with your text prompt, image URLs, or video/audio references. Use the references parameter to pass video, audio, and image inputs for the @-reference system. The API processes this asynchronously and returns a task id for tracking.

3

Étape 3 — Récupérer le résultat vidéo

Utilisez le `task_id` pour sonder le statut ou configurer un webhook. Une fois terminé, vous recevez une URL sécurisée pour télécharger votre fichier audio-vidéo synchronisé au format MP4+AAC.

Capacités Seedance 2.0 API

Spécifications techniques pour la production vidéo multimodale

Multimodal

Système @-référence

Téléchargez jusqu'à 9 images + 3 vidéos + 3 références audio par requête. Le modèle extrait trajectoires de caméra, motifs de mouvement, rythme et style des médias sources.

Qualité

Jusqu'à 1080p haute définition

Produit de la vidéo en résolution jusqu'à 1080p (1920×1080 en 16:9), assurant des détails nets sur tous les écrans.

Flexibilité

Durée 4–15 s

Supporte des durées vidéo variables de 4 à 15 secondes, avec cohérence multi-plans pour des séquences narratives plus longues.

Modes

Entrées texte, image, vidéo et audio

Supporte les modes T2V (texte-vers-vidéo), I2V (image-vers-vidéo) et V2V (vidéo-vers-vidéo) avec entrées multimodales combinables.

Audio

Audio natif avec lip-sync

Génère dialogue synchronisé, effets sonores et musique de fond. Lip-sync en plusieurs langues.

Licence

Droits commerciaux

Droits d'usage commercial soumis aux conditions BytePlus, activés de manière sécurisée via la plateforme EvoLink.

Seedance 2.0 API — Foire aux questions

Everything you need to know about the product and billing.

Seedance 2.0 est le modèle vidéo de seconde génération de ByteDance. Par rapport à Seedance 1.5 Pro, il introduit le système @-référence pour des entrées multimodales (références vidéo, audio et image), le mode édition vidéo-vers-vidéo, 15 s de durée max. (vs 12 s), et jusqu'à 9 images + 3 vidéos + 3 audios par requête. C'est une mise à jour majeure en capacités et flexibilité.
Seedance 2.0 est facturé à la seconde via EvoLink avec des tarifs compétitifs. Les prix varient selon la résolution (480p/720p/1080p) et l'activation de l'audio. Consultez le tableau de tarifs ci-dessus pour les taux exacts par seconde.
Oui. EvoLink fournit un accès mondial à Seedance 2.0 API sans restriction régionale. Vous pouvez intégrer de n'importe où avec une seule clé API.
Le système @-référence est l'innovation majeure de Seedance 2.0. Il vous permet de télécharger des médias de référence (vidéos, pistes audio, images) et le modèle extrait des attributs spécifiques — trajectoires de caméra depuis la vidéo, rythme et beat depuis l'audio, composition et style depuis les images. Vous pouvez combiner des références de sources différentes dans une seule requête pour contrôler précisément la sortie.
Seedance 2.0 supporte des prompts texte combinés avec jusqu'à 9 images de référence, 3 vidéos de référence et 3 pistes audio de référence — le tout combinable dans une seule requête. Les modes de génération incluent texte-vers-vidéo (T2V), image-vers-vidéo (I2V) et édition vidéo-vers-vidéo (V2V).
Seedance 2.0 est le seul modèle offrant des entrées référence vidéo et audio, le système @-référence et l'édition V2V — des fonctionnalités absentes de Sora 2 ou Kling 3.0. Il supporte jusqu'à 9 références image (vs 1 pour les concurrents). Les trois modèles sont disponibles via l'API unifiée d'EvoLink.
Oui. Seedance 2.0 génère un audio nativement synchronisé — dialogue avec lip-sync en plusieurs langues, effets sonores adaptés à l'action et musique de fond. La génération audio peut être activée/désactivée par requête, et les références audio guident le rythme et l'ambiance.
Les vidéos sont au format MP4 (H.264) avec audio AAC. Résolutions : 480p, 720p et 1080p. Durée : 4–15 secondes. Fréquence d'images : 24 fps. Ratios : 16:9, 9:16, 1:1, 4:3, 3:4, 21:9 et adaptatif.
Oui. L'API Seedance d'EvoLink fournit un endpoint unifié pour Seedance 2.0, 1.5 Pro et 1.0 Pro Fast. Utilisez le paramètre model pour basculer entre les versions.

Tous les modèles Seedance API

EvoLink fournit un accès API unifié à toute la famille de modèles Seedance :

Tous les modèles partagent le même endpoint Seedance API. Changez de modèle avec un seul paramètre.

Découvrez d'autres API vidéo sur EvoLinkSora 2|Kling 3.0|Veo 3.1
POST
/v1/videos/generations

Create Video

Seedance 2.0 (seedance-2.0) model supports multiple generation modes including text-to-video, image-to-video, and video-to-video editing with the @-reference system.

Asynchronous processing mode, use the returned task ID to .

Generated video links are valid for 24 hours, please save them promptly.

Request Parameters

modelstringRequiredDefault: seedance-2.0

Video generation model name.

Exampleseedance-2.0
promptstringRequired

Prompt describing what kind of video to generate. Use @-references to assign roles to uploaded files.

Notes
  • Limited to 2000 tokens
  • @Image1, @Image2... → images from image_urls (in order)
  • @Video1, @Video2... → videos from video_urls (in order)
  • @Audio1, @Audio2... → audios from audio_urls (in order)
  • Example: '@Image1 as first frame, replicate @Video1 camera movement, @Audio1 for BGM rhythm'
Example@Image1 as first frame, a cinematic drone shot over a coastal city at golden hour
image_urlsarrayOptional

Reference image URL list for image-to-video and multimodal generation.

Notes
  • Up to 9 images per request
  • Max size: 30MB per image
  • Formats: .jpeg, .png, .webp, .bmp, .tiff, .gif
  • Mixed input total limit: 12 files across all modalities
  • Realistic human face uploads are not supported and will be automatically rejected
  • URLs must be directly viewable by the server
Examplehttp://example.com/image1.jpg
video_urlsarrayOptional

Reference video URL list for video-to-video editing and @-reference system.

Notes
  • Up to 3 videos per request, total duration 2–15s
  • Max size: 50MB per video
  • Formats: .mp4, .mov
  • Pixel range: 409,600 (480p) – 927,408 (720p)
  • Using video references will increase cost
  • Realistic human face uploads are not supported and will be automatically rejected
  • URLs must be directly accessible by the server
Examplehttp://example.com/reference.mp4
audio_urlsarrayOptional

Reference audio URL list for audio-driven generation via @-reference system.

Notes
  • Up to 3 audio tracks per request, total duration ≤ 15s
  • Max size: 15MB per audio
  • Formats: .mp3, .wav
  • Aligns cuts, motion energy, and transitions to beat and rhythm
  • URLs must be directly accessible by the server
Examplehttp://example.com/reference.mp3
durationintegerOptionalDefault: 5

Specifies the duration of the generated video (in seconds).

ValueDescription
4-15Any integer value between 4 and 15 seconds
Notes
  • Billing is based on duration; longer durations result in higher costs
Example5
qualitystringOptionalDefault: 720p

Video resolution.

ValueDescription
480pLower resolution, lower pricing
720pStandard definition (default)
1080pHigh definition, higher pricing
Example720p
aspect_ratiostringOptionalDefault: 16:9

Video aspect ratio.

ValueDescription
16:9Landscape video (default for text-to-video)
9:16Portrait video
1:1Square video
4:3Standard video
3:4Portrait standard
21:9Ultra-wide video
adaptiveAdaptive ratio (default for image-to-video)
Example'16:9'
generate_audiobooleanOptionalDefault: true

Whether to generate audio. Enabling will increase cost.

ValueDescription
trueVideo includes synchronized audio (voice, sound effects, background music)
falseVideo is silent
Notes
  • Place dialogue within double quotes in prompt to optimize audio generation
Exampletrue
callback_urlstringOptional

HTTPS callback address after task completion.

Notes
  • Triggered on completion, failure, or cancellation
  • Sent after billing confirmation
  • HTTPS only, no internal IPs
  • Max length: 2048 chars
  • Timeout: 10s, Max 3 retries
Examplehttps://your-domain.com/webhooks/video-task-completed

Request Example

{
  "model": "seedance-2.0",
  "prompt": "A cinematic drone shot over a coastal city at golden hour",
  "image_urls": ["http://example.com/ref1.jpg", "http://example.com/ref2.jpg"],
  "video_urls": ["http://example.com/reference.mp4"],
  "audio_urls": ["http://example.com/reference.mp3"],
  "duration": 10,
  "quality": "1080p",
  "aspect_ratio": "16:9",
  "generate_audio": true
}

Response Example

{
  "created": 1761313744,
  "id": "task-unified-1761313744-vux2jw0k",
  "model": "seedance-2.0",
  "object": "video.generation.task",
  "progress": 0,
  "status": "pending",
  "task_info": {
    "can_cancel": true,
    "estimated_time": 165,
    "video_duration": 8
  },
  "type": "video",
  "usage": {
    "billing_rule": "per_call",
    "credits_reserved": 8,
    "user_group": "default"
  }
}