
Guía de producción API Wan 2.6: trabajos asíncronos, guardarraíles de presupuesto e integración para ingenieros
TL;DR
- Trata Wan 2.6 como un flujo de trabajo de vídeo asíncrono, no como una herramienta en tiempo real.
- La división práctica de rutas es:
- texto a vídeo para generación centrada en la idea
- imagen a vídeo cuando el primer fotograma importa
- vídeo de referencia cuando importa la continuidad de identidad desde un clip existente
- En los documentos actuales del repositorio, texto a vídeo e imagen a vídeo están documentados como 2-15 segundos, mientras que vídeo de referencia está documentado como 2-10 segundos.
- Para los equipos de producción, la parte difícil normalmente no es la redacción de prompts. Es el manejo de tareas, el control del gasto y hacer suposiciones específicas de ruta solo donde los documentos actuales del endpoint realmente las respaldan.
1. Elige la ruta Wan 2.6 correcta
La forma más limpia de pensar en Wan 2.6 es como tres puntos de entrada a producción, no como un "modelo de vídeo" genérico:
| Ruta | Mejor ajuste | Qué vigilar |
|---|---|---|
| Texto a vídeo | Ideación, storyboards, generación centrada en el guion | Mantén los prompts estructurados y presupuesta la duración con cuidado |
| Imagen a vídeo | Tomas de producto, arte clave, primer fotograma seguro para la marca | La calidad del activo de entrada y la relación de aspecto importan más |
| Vídeo de referencia | Continuidad de personaje, portavoz recurrente, transferencia de identidad | Presupuesta de forma diferente porque la lógica del vídeo de referencia es su propio camino de coste |
El mayor error de producción es aplanar estas rutas en un único modelo mental. Comparten un nombre de familia, pero no se comportan como rutas idénticas.
2. Modelo de integración: asíncrono primero
- envía una solicitud de generación
- persiste el ID de tarea inmediatamente
- haz polling del estado o consume callbacks
- guarda las salidas finales sin demora porque los enlaces generados son de tiempo limitado
Eso significa que tus preocupaciones de producción son predecibles:
- idempotencia en torno a envíos repetidos
- backoff en polling
- persistencia de resultados
- estados de progreso visibles para el usuario
- controles de presupuesto antes de que el trabajo salga de tu backend
Si tu diseño interno todavía asume "el usuario hace clic en un botón y obtiene un vídeo al instante", arregla esa suposición antes de escalar el tráfico.
3. Forma actual de la ruta en Evolink
Los ejemplos actuales orientados a Evolink en este repositorio usan un endpoint unificado:
POST https://api.evolink.ai/v1/videos/generationsLos nombres de modelo representativos incluyen:
wan2.6-text-to-videowan2.6-image-to-videowan2.6-reference-video
Esa ruta unificada es la superficie a la que tu código de aplicación debe anclarse en este repositorio.
Ejemplo: texto a vídeo
curl --request POST \
--url https://api.evolink.ai/v1/videos/generations \
--header 'Authorization: Bearer YOUR_API_KEY' \
--header 'Content-Type: application/json' \
--data '{
"model": "wan2.6-text-to-video",
"prompt": "A cinematic multi-shot sequence of a runner crossing a neon-lit city bridge at night",
"aspect_ratio": "16:9",
"quality": "720p",
"duration": 10,
"prompt_extend": true
}'Ejemplo: vídeo de referencia
curl --request POST \
--url https://api.evolink.ai/v1/videos/generations \
--header 'Authorization: Bearer YOUR_API_KEY' \
--header 'Content-Type: application/json' \
--data '{
"model": "wan2.6-reference-video",
"prompt": "character1 walks into a bright cafe, orders a drink, then turns and smiles to camera",
"video_urls": [
"https://your-cdn.example.com/reference-character.mp4"
],
"duration": 5
}'4. Disciplina de duración y parámetros
Como se documenta actualmente en este repositorio:
- Wan 2.6 texto a vídeo:
2-15segundos - Wan 2.6 imagen a vídeo:
2-15segundos - Wan 2.6 vídeo de referencia:
2-10segundos
Eso importa porque las suposiciones obsoletas de "solo 5 / 10 / 15" pueden distorsionar:
- calculadoras de presupuesto
- validación del frontend
- planificación de colas
- copia visible al usuario
5. Modelo de coste y guardarraíles de presupuesto
Como mínimo:
- limita la duración máxima del lado del servidor
- limita la calidad máxima cuando el caso de uso no justifique 1080p
- separa el presupuesto del vídeo de referencia del presupuesto estándar de t2v/i2v
- sigue el gasto por usuario, funcionalidad y ruta
- haz los reintentos idempotentes para que un cliente inestable no duplique el cobro de una generación
El vídeo de referencia es especialmente importante aquí. Incluso cuando pertenece a la misma familia, debe tratarse como un camino de presupuesto diferente porque la lógica operativa de coste no es la misma que la del uso ordinario de texto a vídeo.
6. Problemas de fiabilidad que los equipos realmente encuentran
Unos cuantos problemas de ingeniería recurrentes importan más que los consejos de prompt:
Deriva de ruta
Las familias de proveedores evolucionan. Si tu app codifica suposiciones de una publicación de blog antigua en lugar de los documentos de ruta actuales, eventualmente te desincronizas en duraciones soportadas, nombres de parámetros o lógica de precios.
Manejo de activos
Las rutas de imagen a vídeo y vídeo de referencia son tan buenas como los activos que pasas. Subidas erróneas, URLs caducadas o material de origen inconsistente crean fallos que parecen problemas de "calidad del modelo", pero en realidad son problemas del pipeline.
Manejo del estado asíncrono
La mayor parte del dolor de usuario viene de un manejo débil de trabajos:
- persistencia de tarea ausente
- comportamiento deficiente de timeout
- envíos duplicados
- ningún ciclo de vida claro "pendiente / en ejecución / fallido / completado"
Si arreglas eso, Wan 2.6 se siente dramáticamente más listo para producción para los usuarios finales.
7. Patrón de ingeniería recomendado
Para una integración robusta:
- Valida la duración, calidad y elección de ruta antes del envío.
- Almacena el hash del payload de solicitud con el ID de tarea.
- Usa backoff en polling o callbacks impulsados por cola.
- Persiste los metadatos finales del medio inmediatamente después de completarse.
- Añade techos de presupuesto específicos de ruta para que los equipos de producto no puedan tratar accidentalmente el vídeo de referencia como una ruta por defecto barata.
Este patrón importa más que casi cualquier truco de prompt una vez que el tráfico real empieza a llegar al sistema.
8. FAQ
¿Alrededor de qué duraciones debería diseñar?
2-15 segundos, mientras que vídeo de referencia está documentado como 2-10 segundos.¿Puedo documentar un contrato de audio universal para Wan 2.6?
No. Mantén las afirmaciones de audio específicas de ruta a menos que hayas verificado la página de ruta exacta y el comportamiento del endpoint que expones.
¿Cuál es el valor por defecto más seguro para producción?
Usa la calidad más barata y la duración más corta que todavía satisfaga el objetivo del producto, luego sube selectivamente cuando el flujo de trabajo demuestre que necesita más.
¿Cuándo debería usar vídeo de referencia?
Úsalo cuando la continuidad desde un clip existente sea parte del requisito del producto. Si no lo es, no pagues el coste de complejidad por defecto.
Siguientes pasos
- Compara la selección de ruta en la colección de la familia API Wan
- Usa la guía de decisión Wan 2.5 vs Wan 2.6 si todavía estás eligiendo entre los niveles workhorse y cinematográfico
- Abre la página del modelo Wan 2.6 para la visión general actual y el punto de entrada de precios


