Seedance 2.0 API
Seedance 2.0 is ByteDance's second-generation video model. It generates up to 1080p, 15s video with native audio sync. The breakthrough is the @-reference system: upload video, audio, or image references, and the model extracts camera paths, motion patterns, rhythm, and style.EvoLink will enable Seedance 2.0 access as soon as the official API is live. Join Discord for launch updates, the final model ID once it's live, and day-one pricing/quota notes (or get one launch email).Key takeaway: You can integrate with EvoLink today using the same async workflow (submit → poll → fetch). See the API tab for request format. When Seedance 2.0 becomes available, you'll enable it by switching one model value — no code rewrite.
Seedance 2.0: Generación de vídeo IA multimodal
Genere vídeo cinematográfico con audio sincronizado usando referencias de texto, imagen, vídeo y audio — todo en una sola llamada API. Seedance 2.0 de ByteDance introduce el sistema @-referencia para extraer movimiento, cámara y estilo de medios fuente. Mejoras clave desde 1.5 Pro: entradas de referencia vídeo y audio, hasta 9 imágenes + 3 vídeos + 3 audios por solicitud, modo edición vídeo-a-vídeo, y 15 s de duración máxima.

¿Qué puedes crear con Seedance 2.0 API?
Seedance 2.0 Producción de vídeo por referencias
Con Seedance 2.0 API, suba un vídeo de referencia y el modelo extrae el movimiento de cámara, la dinámica de movimiento y el estilo de transición a través del sistema @-referencia. Genere docenas de variaciones alineadas con su marca desde un solo clip — sin regrabar. Hasta 3 referencias de vídeo por solicitud para combinar cámara, movimiento y estilo de diferentes fuentes.
Seedance 2.0 Contenido audio-sincronizado desde referencias
Seedance 2.0 API permite proporcionar hasta 3 pistas de audio como referencia. Seedance 2.0 alinea cortes, energía de movimiento y transiciones de escena con el beat y el ritmo. La salida incluye audio sincronizado nativo — lip-sync de diálogo en varios idiomas, efectos de sonido que coinciden con la acción en pantalla, y música de fondo que sigue el estado de ánimo de su referencia de audio.
Seedance 2.0 Storyboard multi-referencia a vídeo
Con Seedance 2.0, combine hasta 9 imágenes de referencia con prompts de texto para controlar composición, personaje y entorno a lo largo de los planos. Seedance 2.0 llena los vacíos entre keyframes con identidad, iluminación y estilo consistentes. Ideal para producción publicitaria, secuencias de demo de producto y storyboards animados.
Seedance 2.0 en comparación — Todos los modelos con una sola clave EvoLink
Seedance 2.0 lidera con entradas @-referencia multimodales, edición vídeo-a-vídeo y el mayor número de referencias de imagen entre los principales modelos de generación de vídeo.
Seedance 2.0 API Sistema @-referencia multimodal
Seedance 2.0 es el único modelo que soporta referencias de vídeo, audio e imagen en una sola solicitud. Suba hasta 9 imágenes + 3 vídeos + 3 pistas de audio para controlar cámara, movimiento, ritmo y estilo — capacidades no disponibles en Sora 2, Kling 3.0 o Seedance 1.5 Pro.
Seedance 2.0 API Edición vídeo-a-vídeo
Seedance 2.0 API permite editar segmentos específicos, personajes o acciones en vídeos existentes. Seedance 2.0 soporta modificaciones V2V dirigidas — una función no disponible en Sora 2 o Kling 3.0.
Seedance 2.0 API Precios competitivos a través de EvoLink
Acceda a Seedance 2.0 API a través de la API unificada de EvoLink con precios competitivos por segundo. Una clave API le da acceso a Seedance 2.0, Sora 2, Kling 3.0, Veo 3.1 y más — con enrutamiento automático al mejor proveedor.
Pricing & Specs (Quick Comparison)
A transparent benchmark across leading video APIs. Seedance 2.0 pricing will be published on launch.
| Metric | Seedance 2.0 | Sora 2 | Kling 3.0 | Veo 3.1 |
|---|---|---|---|---|
| Price (USD / second, incl. audio) | Coming soon | $0.10 (720p) | $0.112 (1080p) | $0.40 (1080p) |
| Typical cost per video | Coming soon | $1.20 / 12s | $1.12 / 10s | $3.20 / 8s |
| Max duration | 15s | 12s | 15s | 8s |
| Max resolution | TBD | 720p (Std) / 1080p (Pro) | 1080p / 4K (tiered) | 1080p / 4K (tiered) |
| Inputs supported | Text, Image, Video, Audio | Text, Image | Text, Image, Video, Audio | Text, Image |
| Reference controls (Video / Audio / Image) | ✓ / ✓ / ✓ | — / — / ✓ | ✓ / ✓ / ✓ | — / — / ✓ |
Notes: Prices are estimates and may vary by tier/region/provider. "Typical cost per video" examples may use different durations/resolutions as shown. Last updated: 2026-02-21.
Cómo integrar Seedance 2.0 API
Integre la generación de vídeo multimodal en su aplicación a través de la API unificada de EvoLink. Soporta los modos T2V, I2V y V2V.
Paso 1 — Obtener su clave API
Sign up on EvoLink.ai and generate your secure API key from the dashboard. This key authenticates all your requests to the Seedance 2.0 endpoint.
Paso 2 — Enviar tarea de generación
Send a POST request to /v1/videos/generations with your text prompt, image URLs, or video/audio references. Use the references parameter to pass video, audio, and image inputs for the @-reference system. The API processes this asynchronously and returns a task id for tracking.
Paso 3 — Obtener resultado del vídeo
Use el `task_id` para consultar el endpoint de estado o configurar un webhook. Una vez completado, recibirá una URL segura para descargar su archivo de audio-vídeo sincronizado en formato MP4+AAC.
Capacidades de Seedance 2.0 API
Especificaciones técnicas para producción de vídeo multimodal
Sistema @-referencia
Suba hasta 9 imágenes + 3 vídeos + 3 referencias de audio por solicitud. El modelo extrae trayectorias de cámara, patrones de movimiento, ritmo y estilo de los medios fuente.
Hasta 1080p alta definición
Produce vídeo en hasta 1080p de resolución (1920×1080 para 16:9), garantizando detalles nítidos en todas las pantallas.
Duración 4–15 s
Soporta duraciones variables de 4 a 15 segundos, con consistencia multi-plano para secuencias narrativas más largas.
Entrada de texto, imagen, vídeo y audio
Soporta los modos T2V (texto-a-vídeo), I2V (imagen-a-vídeo) y V2V (vídeo-a-vídeo) con entradas multimodales combinables.
Audio nativo con lip-sync
Genera diálogo sincronizado, efectos de sonido y música de fondo. Lip-sync en varios idiomas.
Derechos comerciales
Derechos de uso comercial sujetos a términos de BytePlus, habilitados de forma segura a través de la plataforma EvoLink.
Seedance 2.0 API — Preguntas frecuentes
Everything you need to know about the product and billing.
Todos los modelos Seedance API
EvoLink ofrece acceso API unificado a toda la familia de modelos Seedance:
Seedance 2.0
Última generación, calidad cinematográfica
Esta páginaSeedance 1.5 Pro
1080p con audio nativo
Ver detalles →Seedance 1.0 Pro Fast
Generación más rápida, menor costo
Ver detalles →Todos los modelos comparten el mismo endpoint Seedance API. Cambie de modelo con un solo parámetro.
API Reference
Select endpoint
Authentication
All APIs require Bearer Token authentication.
Authorization:
Bearer YOUR_API_KEY/v1/videos/generationsCreate Video
Seedance 2.0 (seedance-2.0) model supports multiple generation modes including text-to-video, image-to-video, and video-to-video editing with the @-reference system.
Asynchronous processing mode, use the returned task ID to .
Generated video links are valid for 24 hours, please save them promptly.
Request Parameters
modelstringRequiredDefault: seedance-2.0Video generation model name.
seedance-2.0promptstringRequiredPrompt describing what kind of video to generate. Use @-references to assign roles to uploaded files.
Notes
- Limited to 2000 tokens
- @Image1, @Image2... → images from image_urls (in order)
- @Video1, @Video2... → videos from video_urls (in order)
- @Audio1, @Audio2... → audios from audio_urls (in order)
- Example: '@Image1 as first frame, replicate @Video1 camera movement, @Audio1 for BGM rhythm'
@Image1 as first frame, a cinematic drone shot over a coastal city at golden hourimage_urlsarrayOptionalReference image URL list for image-to-video and multimodal generation.
Notes
- Up to 9 images per request
- Max size: 30MB per image
- Formats: .jpeg, .png, .webp, .bmp, .tiff, .gif
- Mixed input total limit: 12 files across all modalities
- Realistic human face uploads are not supported and will be automatically rejected
- URLs must be directly viewable by the server
http://example.com/image1.jpgvideo_urlsarrayOptionalReference video URL list for video-to-video editing and @-reference system.
Notes
- Up to 3 videos per request, total duration 2–15s
- Max size: 50MB per video
- Formats: .mp4, .mov
- Pixel range: 409,600 (480p) – 927,408 (720p)
- Using video references will increase cost
- Realistic human face uploads are not supported and will be automatically rejected
- URLs must be directly accessible by the server
http://example.com/reference.mp4audio_urlsarrayOptionalReference audio URL list for audio-driven generation via @-reference system.
Notes
- Up to 3 audio tracks per request, total duration ≤ 15s
- Max size: 15MB per audio
- Formats: .mp3, .wav
- Aligns cuts, motion energy, and transitions to beat and rhythm
- URLs must be directly accessible by the server
http://example.com/reference.mp3durationintegerOptionalDefault: 5Specifies the duration of the generated video (in seconds).
| Value | Description |
|---|---|
| 4-15 | Any integer value between 4 and 15 seconds |
Notes
- Billing is based on duration; longer durations result in higher costs
5qualitystringOptionalDefault: 720pVideo resolution.
| Value | Description |
|---|---|
| 480p | Lower resolution, lower pricing |
| 720p | Standard definition (default) |
| 1080p | High definition, higher pricing |
720paspect_ratiostringOptionalDefault: 16:9Video aspect ratio.
| Value | Description |
|---|---|
| 16:9 | Landscape video (default for text-to-video) |
| 9:16 | Portrait video |
| 1:1 | Square video |
| 4:3 | Standard video |
| 3:4 | Portrait standard |
| 21:9 | Ultra-wide video |
| adaptive | Adaptive ratio (default for image-to-video) |
'16:9'generate_audiobooleanOptionalDefault: trueWhether to generate audio. Enabling will increase cost.
| Value | Description |
|---|---|
| true | Video includes synchronized audio (voice, sound effects, background music) |
| false | Video is silent |
Notes
- Place dialogue within double quotes in prompt to optimize audio generation
truecallback_urlstringOptionalHTTPS callback address after task completion.
Notes
- Triggered on completion, failure, or cancellation
- Sent after billing confirmation
- HTTPS only, no internal IPs
- Max length: 2048 chars
- Timeout: 10s, Max 3 retries
https://your-domain.com/webhooks/video-task-completed