Seedance 2.0 API — Coming SoonGet early access

Seedance 2.0 API

Seedance 2.0 is ByteDance's second-generation video model. It generates up to 1080p, 15s video with native audio sync. The breakthrough is the @-reference system: upload video, audio, or image references, and the model extracts camera paths, motion patterns, rhythm, and style.EvoLink will enable Seedance 2.0 access as soon as the official API is live. Join Discord for launch updates, the final model ID once it's live, and day-one pricing/quota notes (or get one launch email).Key takeaway: You can integrate with EvoLink today using the same async workflow (submit → poll → fetch). See the API tab for request format. When Seedance 2.0 becomes available, you'll enable it by switching one model value — no code rewrite.

Get Early Access

Seedance 2.0: Generación de vídeo IA multimodal

Genere vídeo cinematográfico con audio sincronizado usando referencias de texto, imagen, vídeo y audio — todo en una sola llamada API. Seedance 2.0 de ByteDance introduce el sistema @-referencia para extraer movimiento, cámara y estilo de medios fuente. Mejoras clave desde 1.5 Pro: entradas de referencia vídeo y audio, hasta 9 imágenes + 3 vídeos + 3 audios por solicitud, modo edición vídeo-a-vídeo, y 15 s de duración máxima.

Seedance 2.0 API generación de vídeo multimodal showcase

¿Qué puedes crear con Seedance 2.0 API?

Seedance 2.0 Producción de vídeo por referencias

Con Seedance 2.0 API, suba un vídeo de referencia y el modelo extrae el movimiento de cámara, la dinámica de movimiento y el estilo de transición a través del sistema @-referencia. Genere docenas de variaciones alineadas con su marca desde un solo clip — sin regrabar. Hasta 3 referencias de vídeo por solicitud para combinar cámara, movimiento y estilo de diferentes fuentes.

Seedance 2.0 Contenido audio-sincronizado desde referencias

Seedance 2.0 API permite proporcionar hasta 3 pistas de audio como referencia. Seedance 2.0 alinea cortes, energía de movimiento y transiciones de escena con el beat y el ritmo. La salida incluye audio sincronizado nativo — lip-sync de diálogo en varios idiomas, efectos de sonido que coinciden con la acción en pantalla, y música de fondo que sigue el estado de ánimo de su referencia de audio.

Seedance 2.0 Storyboard multi-referencia a vídeo

Con Seedance 2.0, combine hasta 9 imágenes de referencia con prompts de texto para controlar composición, personaje y entorno a lo largo de los planos. Seedance 2.0 llena los vacíos entre keyframes con identidad, iluminación y estilo consistentes. Ideal para producción publicitaria, secuencias de demo de producto y storyboards animados.

Seedance 2.0 en comparación — Todos los modelos con una sola clave EvoLink

Seedance 2.0 lidera con entradas @-referencia multimodales, edición vídeo-a-vídeo y el mayor número de referencias de imagen entre los principales modelos de generación de vídeo.

Seedance 2.0 API Sistema @-referencia multimodal

Seedance 2.0 es el único modelo que soporta referencias de vídeo, audio e imagen en una sola solicitud. Suba hasta 9 imágenes + 3 vídeos + 3 pistas de audio para controlar cámara, movimiento, ritmo y estilo — capacidades no disponibles en Sora 2, Kling 3.0 o Seedance 1.5 Pro.

Seedance 2.0 API Edición vídeo-a-vídeo

Seedance 2.0 API permite editar segmentos específicos, personajes o acciones en vídeos existentes. Seedance 2.0 soporta modificaciones V2V dirigidas — una función no disponible en Sora 2 o Kling 3.0.

Seedance 2.0 API Precios competitivos a través de EvoLink

Acceda a Seedance 2.0 API a través de la API unificada de EvoLink con precios competitivos por segundo. Una clave API le da acceso a Seedance 2.0, Sora 2, Kling 3.0, Veo 3.1 y más — con enrutamiento automático al mejor proveedor.

Pricing & Specs (Quick Comparison)

A transparent benchmark across leading video APIs. Seedance 2.0 pricing will be published on launch.

MetricSeedance 2.0Sora 2Kling 3.0Veo 3.1
Price (USD / second, incl. audio)Coming soon$0.10 (720p)$0.112 (1080p)$0.40 (1080p)
Typical cost per videoComing soon$1.20 / 12s$1.12 / 10s$3.20 / 8s
Max duration15s12s15s8s
Max resolutionTBD720p (Std) / 1080p (Pro)1080p / 4K (tiered)1080p / 4K (tiered)
Inputs supportedText, Image, Video, AudioText, ImageText, Image, Video, AudioText, Image
Reference controls (Video / Audio / Image) / / / / / / / /

Notes: Prices are estimates and may vary by tier/region/provider. "Typical cost per video" examples may use different durations/resolutions as shown. Last updated: 2026-02-21.

Cómo integrar Seedance 2.0 API

Integre la generación de vídeo multimodal en su aplicación a través de la API unificada de EvoLink. Soporta los modos T2V, I2V y V2V.

1

Paso 1 — Obtener su clave API

Sign up on EvoLink.ai and generate your secure API key from the dashboard. This key authenticates all your requests to the Seedance 2.0 endpoint.

2

Paso 2 — Enviar tarea de generación

Send a POST request to /v1/videos/generations with your text prompt, image URLs, or video/audio references. Use the references parameter to pass video, audio, and image inputs for the @-reference system. The API processes this asynchronously and returns a task id for tracking.

3

Paso 3 — Obtener resultado del vídeo

Use el `task_id` para consultar el endpoint de estado o configurar un webhook. Una vez completado, recibirá una URL segura para descargar su archivo de audio-vídeo sincronizado en formato MP4+AAC.

Capacidades de Seedance 2.0 API

Especificaciones técnicas para producción de vídeo multimodal

Multimodal

Sistema @-referencia

Suba hasta 9 imágenes + 3 vídeos + 3 referencias de audio por solicitud. El modelo extrae trayectorias de cámara, patrones de movimiento, ritmo y estilo de los medios fuente.

Calidad

Hasta 1080p alta definición

Produce vídeo en hasta 1080p de resolución (1920×1080 para 16:9), garantizando detalles nítidos en todas las pantallas.

Flexibilidad

Duración 4–15 s

Soporta duraciones variables de 4 a 15 segundos, con consistencia multi-plano para secuencias narrativas más largas.

Modos

Entrada de texto, imagen, vídeo y audio

Soporta los modos T2V (texto-a-vídeo), I2V (imagen-a-vídeo) y V2V (vídeo-a-vídeo) con entradas multimodales combinables.

Audio

Audio nativo con lip-sync

Genera diálogo sincronizado, efectos de sonido y música de fondo. Lip-sync en varios idiomas.

Licencia

Derechos comerciales

Derechos de uso comercial sujetos a términos de BytePlus, habilitados de forma segura a través de la plataforma EvoLink.

Seedance 2.0 API — Preguntas frecuentes

Everything you need to know about the product and billing.

Seedance 2.0 es el modelo de vídeo de segunda generación de ByteDance. Comparado con Seedance 1.5 Pro, introduce el sistema @-referencia para entradas multimodales (referencias de vídeo, audio e imagen), modo de edición vídeo-a-vídeo, 15 s de duración máxima (antes 12 s), y hasta 9 imágenes + 3 vídeos + 3 audios por solicitud. Es una actualización importante en capacidades y flexibilidad.
Seedance 2.0 se factura por segundo con precios competitivos a través de EvoLink. Los precios varían según la resolución (480p/720p/1080p) y si el audio está habilitado. Consulte la tabla de precios arriba para las tarifas exactas por segundo.
Sí. EvoLink proporciona acceso global a Seedance 2.0 API sin restricciones regionales. Puede integrar desde cualquier lugar usando una sola clave API.
El sistema @-referencia es la innovación clave de Seedance 2.0. Le permite subir medios de referencia (vídeos, pistas de audio, imágenes) y el modelo extrae atributos específicos — trayectorias de cámara del vídeo, ritmo y beat del audio, composición y estilo de las imágenes. Puede combinar referencias de diferentes fuentes en una sola solicitud para controlar precisamente la salida.
Seedance 2.0 soporta prompts de texto combinados con hasta 9 imágenes de referencia, 3 vídeos de referencia y 3 pistas de audio de referencia — todo combinable en una sola solicitud. Los modos de generación incluyen texto-a-vídeo (T2V), imagen-a-vídeo (I2V) y edición vídeo-a-vídeo (V2V).
Seedance 2.0 es el único modelo que ofrece entradas de referencia de vídeo y audio, el sistema @-referencia y edición V2V — funciones no disponibles en Sora 2 o Kling 3.0. Soporta hasta 9 referencias de imagen (vs 1 para los competidores). Los tres modelos están disponibles a través de la API unificada de EvoLink.
Sí. Seedance 2.0 genera audio sincronizado nativo — diálogo con lip-sync en varios idiomas, efectos de sonido que coinciden con la acción en pantalla y música de fondo. La generación de audio se puede activar/desactivar por solicitud, y las referencias de audio guían el ritmo y el estado de ánimo.
Los vídeos se generan en formato MP4 (H.264) con audio AAC. Resoluciones: 480p, 720p y 1080p. Duración: 4–15 segundos. Frecuencia de cuadros: 24 fps. Relaciones de aspecto: 16:9, 9:16, 1:1, 4:3, 3:4, 21:9 y adaptativo.
Sí. La API Seedance de EvoLink proporciona un endpoint unificado para Seedance 2.0, 1.5 Pro y 1.0 Pro Fast. Use el parámetro model para cambiar entre versiones.

Todos los modelos Seedance API

EvoLink ofrece acceso API unificado a toda la familia de modelos Seedance:

Todos los modelos comparten el mismo endpoint Seedance API. Cambie de modelo con un solo parámetro.

Explore más APIs de vídeo en EvoLinkSora 2|Kling 3.0|Veo 3.1
POST
/v1/videos/generations

Create Video

Seedance 2.0 (seedance-2.0) model supports multiple generation modes including text-to-video, image-to-video, and video-to-video editing with the @-reference system.

Asynchronous processing mode, use the returned task ID to .

Generated video links are valid for 24 hours, please save them promptly.

Request Parameters

modelstringRequiredDefault: seedance-2.0

Video generation model name.

Exampleseedance-2.0
promptstringRequired

Prompt describing what kind of video to generate. Use @-references to assign roles to uploaded files.

Notes
  • Limited to 2000 tokens
  • @Image1, @Image2... → images from image_urls (in order)
  • @Video1, @Video2... → videos from video_urls (in order)
  • @Audio1, @Audio2... → audios from audio_urls (in order)
  • Example: '@Image1 as first frame, replicate @Video1 camera movement, @Audio1 for BGM rhythm'
Example@Image1 as first frame, a cinematic drone shot over a coastal city at golden hour
image_urlsarrayOptional

Reference image URL list for image-to-video and multimodal generation.

Notes
  • Up to 9 images per request
  • Max size: 30MB per image
  • Formats: .jpeg, .png, .webp, .bmp, .tiff, .gif
  • Mixed input total limit: 12 files across all modalities
  • Realistic human face uploads are not supported and will be automatically rejected
  • URLs must be directly viewable by the server
Examplehttp://example.com/image1.jpg
video_urlsarrayOptional

Reference video URL list for video-to-video editing and @-reference system.

Notes
  • Up to 3 videos per request, total duration 2–15s
  • Max size: 50MB per video
  • Formats: .mp4, .mov
  • Pixel range: 409,600 (480p) – 927,408 (720p)
  • Using video references will increase cost
  • Realistic human face uploads are not supported and will be automatically rejected
  • URLs must be directly accessible by the server
Examplehttp://example.com/reference.mp4
audio_urlsarrayOptional

Reference audio URL list for audio-driven generation via @-reference system.

Notes
  • Up to 3 audio tracks per request, total duration ≤ 15s
  • Max size: 15MB per audio
  • Formats: .mp3, .wav
  • Aligns cuts, motion energy, and transitions to beat and rhythm
  • URLs must be directly accessible by the server
Examplehttp://example.com/reference.mp3
durationintegerOptionalDefault: 5

Specifies the duration of the generated video (in seconds).

ValueDescription
4-15Any integer value between 4 and 15 seconds
Notes
  • Billing is based on duration; longer durations result in higher costs
Example5
qualitystringOptionalDefault: 720p

Video resolution.

ValueDescription
480pLower resolution, lower pricing
720pStandard definition (default)
1080pHigh definition, higher pricing
Example720p
aspect_ratiostringOptionalDefault: 16:9

Video aspect ratio.

ValueDescription
16:9Landscape video (default for text-to-video)
9:16Portrait video
1:1Square video
4:3Standard video
3:4Portrait standard
21:9Ultra-wide video
adaptiveAdaptive ratio (default for image-to-video)
Example'16:9'
generate_audiobooleanOptionalDefault: true

Whether to generate audio. Enabling will increase cost.

ValueDescription
trueVideo includes synchronized audio (voice, sound effects, background music)
falseVideo is silent
Notes
  • Place dialogue within double quotes in prompt to optimize audio generation
Exampletrue
callback_urlstringOptional

HTTPS callback address after task completion.

Notes
  • Triggered on completion, failure, or cancellation
  • Sent after billing confirmation
  • HTTPS only, no internal IPs
  • Max length: 2048 chars
  • Timeout: 10s, Max 3 retries
Examplehttps://your-domain.com/webhooks/video-task-completed

Request Example

{
  "model": "seedance-2.0",
  "prompt": "A cinematic drone shot over a coastal city at golden hour",
  "image_urls": ["http://example.com/ref1.jpg", "http://example.com/ref2.jpg"],
  "video_urls": ["http://example.com/reference.mp4"],
  "audio_urls": ["http://example.com/reference.mp3"],
  "duration": 10,
  "quality": "1080p",
  "aspect_ratio": "16:9",
  "generate_audio": true
}

Response Example

{
  "created": 1761313744,
  "id": "task-unified-1761313744-vux2jw0k",
  "model": "seedance-2.0",
  "object": "video.generation.task",
  "progress": 0,
  "status": "pending",
  "task_info": {
    "can_cancel": true,
    "estimated_time": 165,
    "video_duration": 8
  },
  "type": "video",
  "usage": {
    "billing_rule": "per_call",
    "credits_reserved": 8,
    "user_group": "default"
  }
}