
Guide de production API Wan 2.6 : jobs asynchrones, garde-fous budgétaires et intégration pour ingénieurs
TL;DR
- Traitez Wan 2.6 comme un workflow vidéo asynchrone, pas comme un outil temps réel.
- La séparation pratique des routes est :
- texte vers vidéo pour la génération axée idée
- image vers vidéo lorsque la première image compte
- vidéo de référence lorsque la continuité d'identité depuis un clip existant compte
- Dans la documentation actuelle du dépôt, texte vers vidéo et image vers vidéo sont documentés entre 2 et 15 secondes, tandis que la vidéo de référence est documentée entre 2 et 10 secondes.
- Pour les équipes de production, la partie difficile n'est généralement pas l'écriture du prompt. C'est la gestion des tâches, le contrôle des dépenses, et ne faire des hypothèses spécifiques à chaque route que là où la documentation actuelle des endpoints les soutient réellement.
1. Choisir la bonne route Wan 2.6
La façon la plus claire de penser Wan 2.6 est de le voir comme trois points d'entrée de production, pas comme un seul "modèle vidéo" générique :
| Route | Meilleure utilisation | Points de vigilance |
|---|---|---|
| Texte vers vidéo | Idéation, storyboards, génération script-first | Garder les prompts structurés et budgétiser soigneusement la durée |
| Image vers vidéo | Photos produit, key art, première image safe pour la marque | La qualité de l'actif d'entrée et le ratio d'aspect comptent davantage |
| Vidéo de référence | Continuité de personnage, porte-parole récurrent, report d'identité | Budgéter différemment car la logique vidéo de référence a son propre chemin de coût |
La plus grande erreur de production est d'aplatir ces routes dans un seul modèle mental. Elles partagent un nom de famille, mais elles ne se comportent pas comme des routes identiques.
2. Modèle d'intégration : async d'abord
- soumettre une requête de génération
- persister immédiatement l'ID de tâche
- faire du polling sur le statut ou consommer des callbacks
- sauvegarder rapidement les sorties finales car les liens générés sont à durée limitée
Cela signifie que vos préoccupations de production sont prévisibles :
- idempotence autour des soumissions répétées
- backoff sur le polling
- persistance des résultats
- états de progression côté utilisateur
- contrôles budgétaires avant que le job ne quitte votre backend
Si votre design interne suppose encore "l'utilisateur clique sur un bouton et obtient instantanément une vidéo", corrigez cette hypothèse avant de monter en charge.
3. Forme de route actuelle sur Evolink
Les exemples Evolink actuels dans ce dépôt utilisent un endpoint unifié :
POST https://api.evolink.ai/v1/videos/generationsLes noms de modèles représentatifs incluent :
wan2.6-text-to-videowan2.6-image-to-videowan2.6-reference-video
Cette route unifiée est la surface sur laquelle le code de votre application doit s'ancrer dans cette base de code.
Exemple : texte vers vidéo
curl --request POST \
--url https://api.evolink.ai/v1/videos/generations \
--header 'Authorization: Bearer YOUR_API_KEY' \
--header 'Content-Type: application/json' \
--data '{
"model": "wan2.6-text-to-video",
"prompt": "A cinematic multi-shot sequence of a runner crossing a neon-lit city bridge at night",
"aspect_ratio": "16:9",
"quality": "720p",
"duration": 10,
"prompt_extend": true
}'Exemple : vidéo de référence
curl --request POST \
--url https://api.evolink.ai/v1/videos/generations \
--header 'Authorization: Bearer YOUR_API_KEY' \
--header 'Content-Type: application/json' \
--data '{
"model": "wan2.6-reference-video",
"prompt": "character1 walks into a bright cafe, orders a drink, then turns and smiles to camera",
"video_urls": [
"https://your-cdn.example.com/reference-character.mp4"
],
"duration": 5
}'4. Discipline sur la durée et les paramètres
Tel que documenté actuellement dans ce dépôt :
- Wan 2.6 texte vers vidéo :
2-15secondes - Wan 2.6 image vers vidéo :
2-15secondes - Wan 2.6 vidéo de référence :
2-10secondes
Cela compte car les hypothèses dépassées de type "5 / 10 / 15 uniquement" peuvent fausser :
- les calculateurs de budget
- la validation frontend
- la planification de files
- la copie côté utilisateur
5. Modèle de coût et garde-fous budgétaires
Au minimum :
- plafonner la durée maximale côté serveur
- plafonner la qualité maximale lorsque le cas d'usage ne justifie pas le 1080p
- séparer le budget de la vidéo de référence de celui du t2v/i2v standard
- suivre les dépenses par utilisateur, fonctionnalité et route
- rendre les reprises idempotentes pour qu'un client instable ne facture pas deux fois une génération
La vidéo de référence est particulièrement importante ici. Même si elle appartient à la même famille, elle doit être traitée comme un chemin budgétaire différent car la logique de coût opérationnel n'est pas la même que l'usage ordinaire de texte vers vidéo.
6. Problèmes de fiabilité que les équipes rencontrent vraiment
Quelques problèmes d'ingénierie récurrents comptent plus que les conseils sur les prompts :
Dérive des routes
Les familles de fournisseurs évoluent. Si votre application code en dur des hypothèses issues d'un vieux billet de blog plutôt que la documentation actuelle des routes, vous finissez par dériver sur les durées prises en charge, les noms de paramètres ou la logique tarifaire.
Gestion des actifs
Les routes image vers vidéo et vidéo de référence ne valent que ce que valent les actifs que vous leur fournissez. De mauvais téléversements, des URL qui expirent ou des sources incohérentes créent des échecs qui ressemblent à des problèmes de "qualité du modèle" mais sont en réalité des problèmes de pipeline.
Gestion d'état asynchrone
La majeure partie de la douleur utilisateur provient d'une faible gestion des jobs :
- persistance de tâche manquante
- mauvais comportement de timeout
- soumissions dupliquées
- pas de cycle de vie clair "en attente / en traitement / échoué / terminé"
Si vous corrigez cela, Wan 2.6 semble nettement plus prêt pour la production aux yeux des utilisateurs finaux.
7. Pattern d'ingénierie recommandé
Pour une intégration robuste :
- Validez la durée, la qualité et le choix de route avant soumission.
- Stockez le hash du payload de requête avec l'ID de tâche.
- Utilisez du backoff sur le polling ou des callbacks pilotés par file.
- Persistez les métadonnées média finales immédiatement après la complétion.
- Ajoutez des plafonds budgétaires spécifiques à chaque route pour que les équipes produit ne traitent pas accidentellement la vidéo de référence comme une route par défaut bon marché.
Ce pattern compte plus que presque n'importe quelle astuce de prompt une fois que le trafic réel commence à frapper le système.
8. FAQ
Autour de quelles durées dois-je concevoir ?
2-15 secondes, tandis que la vidéo de référence est documentée entre 2-10 secondes.Puis-je documenter un contrat audio Wan 2.6 universel ?
Non. Gardez les affirmations audio spécifiques à la route, à moins d'avoir vérifié la page de route exacte et le comportement d'endpoint que vous exposez.
Quel est le défaut de production le plus sûr ?
Utilisez la qualité la moins chère et la durée la plus courte qui satisfont encore l'objectif produit, puis montez sélectivement en gamme lorsque le workflow prouve qu'il en a besoin.
Quand dois-je utiliser la vidéo de référence ?
Utilisez-la lorsque la continuité depuis un clip existant fait partie de l'exigence produit. Si ce n'est pas le cas, ne payez pas le coût de complexité par défaut.
Prochaines étapes
- Comparez le choix de route sur la collection famille API Wan
- Utilisez le guide de décision Wan 2.5 vs Wan 2.6 si vous hésitez encore entre le niveau workhorse et le niveau cinématique
- Ouvrez la page du modèle Wan 2.6 pour la vue d'ensemble actuelle et le point d'entrée tarifaire


