
Guide API Wan 2.7 : Text-to-Video, Image-to-Video, Reference Video et Video Edit — Manuel d'intégration complet

Résumé
- Wan 2.7, c'est quatre modèles en un seul endpoint. Text-to-video, image-to-video (avec contrôle first/last frame), vidéo de référence multi-personnages (avec clonage vocal), et édition vidéo basée sur des instructions — le tout via
POST /v1/videos/generations. - Tarifs sur EvoLink : $0.086/sec en 720p, $0.144/sec en 1080p. Un clip de 10 secondes en 720p coûte $0.86. Pas d'abonnement.
- IDs de modèle :
wan2.7-text-to-video,wan2.7-image-to-video,wan2.7-reference-video,wan2.7-video-edit. - Workflow asynchrone. Chaque requête retourne immédiatement un ID de tâche. Interrogez
GET /v1/tasks/\{task_id\}pour le statut. Les URLs vidéo expirent en 24 heures. - Ce que Wan 2.7 ajoute par rapport à Wan 2.6 sur EvoLink : L'édition vidéo via la route Wan 2.7, le contrôle first-and-last-frame en I2V, et la vidéo de référence multi-personnages avec clonage vocal.
- Les tâches échouées ne sont pas facturées pour les modes reference-video et video-edit.
Table des matières
- Démarrage rapide : votre première vidéo Wan 2.7 en 60 secondes
- Choisir le bon ID de modèle
- Mode 1 : Text-to-video
- Mode 2 : Image-to-video avec contrôle de frame
- Mode 3 : Vidéo de référence avec clonage vocal
- Mode 4 : Édition vidéo
- Tarifs et calcul des coûts
- Workflow asynchrone et gestion des tâches
- Gestion des erreurs et codes de statut courants
- Patterns de production et garde-fous
- Migration de Wan 2.6 vers Wan 2.7
- Aide-mémoire des paramètres
- FAQ
1. Démarrage rapide : votre première vidéo Wan 2.7 en 60 secondes
Étape 1 : Générer une vidéo
curl -X POST https://api.evolink.ai/v1/videos/generations \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "wan2.7-text-to-video",
"prompt": "A drone shot over a misty mountain lake at sunrise, slow camera push forward, cinematic color grading",
"quality": "720p",
"aspect_ratio": "16:9",
"duration": 5
}'{
"id": "task-unified-1757169743-7cvnl5zw",
"status": "pending",
"created": 1757169743
}Étape 2 : Interroger le résultat
curl https://api.evolink.ai/v1/tasks/task-unified-1757169743-7cvnl5zw \
-H "Authorization: Bearer YOUR_API_KEY"status vaut "completed", la réponse inclut un tableau results avec l'URL de la vidéo. Téléchargez-la dans les 24 heures — le lien expire.Étape 3 : C'est tout
model pour basculer entre les quatre modes ci-dessous.2. Choisir le bon ID de modèle
| ID de modèle | Mode | Idéal pour | Durée |
|---|---|---|---|
wan2.7-text-to-video | Texte → Vidéo | Publicités, clips sociaux, génération basée sur script | 2-15 sec |
wan2.7-image-to-video | Image → Vidéo | Animations produit, storyboard-vers-vidéo, contrôle first/last frame | 2-15 sec |
wan2.7-reference-video | Référence → Vidéo | Porte-parole de marque, séries multi-personnages, clonage vocal | 2-15 sec (réfs images seules), 2-10 sec (avec réfs vidéo) |
wan2.7-video-edit | Vidéo → Vidéo éditée | Transfert de style, remplacement d'arrière-plan, changement de vêtements, colorisation | 2-10 sec |
POST /v1/videos/generations. Seul le paramètre model change.3. Mode 1 : Text-to-video
Fonctionnement
Génère une vidéo à partir d'un prompt texte. Prend en charge un audio de pilotage optionnel pour la synchronisation labiale ou une sortie synchronisée avec la musique. Génère automatiquement une musique de fond lorsqu'aucun audio n'est fourni.
Paramètres clés
| Paramètre | Requis | Défaut | Description |
|---|---|---|---|
model | Oui | — | wan2.7-text-to-video |
prompt | Oui | — | Description de scène, jusqu'à 5000 caractères |
negative_prompt | Non | — | Éléments à exclure, jusqu'à 500 caractères |
audio_urls | Non | — | Tableau avec 1 URL d'audio de pilotage (wav/mp3, 2-30 sec, max 15Mo) |
quality | Non | 720p | 720p ou 1080p |
aspect_ratio | Non | 16:9 | 16:9, 9:16, 1:1, 4:3, 3:4 |
duration | Non | 5 | 2-15 secondes (entier) |
seed | Non | aléatoire | 1-2147483647 pour une sortie reproductible |
prompt_extend | Non | false | Réécriture de prompt par LLM (mettre true pour les prompts courts) |
callback_url | Non | — | URL HTTPS pour le webhook de fin de tâche |
Narration multi-plans
Contrôlez la structure des plans directement dans le prompt :
{
"model": "wan2.7-text-to-video",
"prompt": "A tense detective story. Shot 1 [0-3s] wide angle: rainy night street, neon lights. Shot 2 [3-6s] medium: detective enters old building. Shot 3 [6-9s] close-up: detective's determined eyes. Shot 4 [9-12s] medium: cautious advance through dim corridor. Shot 5 [12-15s] close-up: discovers key clue.",
"aspect_ratio": "16:9",
"duration": 15
}Avec audio de pilotage
{
"model": "wan2.7-text-to-video",
"prompt": "A cartoon general in golden armor on a horse, reciting a classical poem",
"audio_urls": ["https://your-cdn.com/recital.mp3"],
"duration": 10
}duration, seules les N premières secondes sont utilisées. Si plus court, la portion vidéo restante est silencieuse.4. Mode 2 : Image-to-video avec contrôle de frame
Fonctionnement
Trois modes de génération
generation_mode | Entrées | Cas d'usage |
|---|---|---|
first_frame | image_start (+ audio_urls optionnel) | Animer une photo produit ou une illustration de personnage |
first_last_frame | image_start + image_end (+ audio_urls optionnel) | Définir les états de début et de fin, le modèle remplit le mouvement |
video_continuation | video_urls[0] (+ image_end optionnel) | Prolonger un clip existant, optionnellement spécifier le frame final |
generation_mode est omis, le serveur le déduit des médias fournis.Combinaisons d'entrées valides
image_startuniquementimage_start+audio_urlsimage_start+image_endimage_start+image_end+audio_urlsvideo_urls(continuation)video_urls+image_end(continuation avec frame final)
Toute autre combinaison sera rejetée.
Exemple : First-and-last-frame
curl -X POST https://api.evolink.ai/v1/videos/generations \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "wan2.7-image-to-video",
"generation_mode": "first_last_frame",
"prompt": "A product bottle rotating 360 degrees with soft studio lighting",
"image_start": "https://your-cdn.com/bottle-front.jpg",
"image_end": "https://your-cdn.com/bottle-back.jpg",
"quality": "1080p",
"duration": 5
}'Exemple : Continuation vidéo
{
"model": "wan2.7-image-to-video",
"generation_mode": "video_continuation",
"prompt": "The scene continues with the character walking toward the sunset",
"video_urls": ["https://your-cdn.com/previous-clip.mp4"],
"image_end": "https://your-cdn.com/sunset-ending.jpg",
"duration": 5
}5. Mode 3 : Vidéo de référence avec clonage vocal
Fonctionnement
Génère de nouvelles scènes vidéo tout en préservant l'apparence des personnages à partir d'images ou de vidéos de référence — et clone optionnellement leur voix à partir d'un court échantillon audio. C'est ainsi que vous construisez des séries vidéo multi-personnages où chaque personne a un aspect et une voix cohérents d'un épisode à l'autre.
Contraintes clés
image_urls+video_urlscombinés : maximum 5 éléments au totalimage_startet l'audio vocal ne comptent pas dans cette limite de 5 éléments- Durée : 2-15 sec (références images uniquement), 2-10 sec (avec références vidéo)
- Facturation : durée vidéo d'entrée + durée vidéo de sortie. Les tâches échouées sont gratuites.
Indexation des personnages dans les prompts
Référencez les personnages par leur position dans les tableaux d'entrée :
- Anglais :
Image 1,Image 2,Video 1,Video 2 - Chinois :
图1,图2,视频1,视频2
Image 1 et Video 1 peuvent coexister.Clonage vocal : deux méthodes
voice_bindings (recommandée)Mappage clé-valeur précis entre les références de personnages et l'audio vocal :
{
"model": "wan2.7-reference-video",
"prompt": "Image 1 holds Image 2 and says: 'What lovely sunshine today'",
"image_urls": [
"https://your-cdn.com/girl.jpg",
"https://your-cdn.com/toy.png"
],
"model_params": {
"voice_bindings": {
"image1": "https://your-cdn.com/girl-voice.mp3"
}
},
"duration": 10
}audio_urls (ancien, positionnel)image_urls / video_urls. Fonctionne mais moins explicite. Utilisez voice_bindings pour les nouvelles intégrations.Exemple : Vidéo de marque multi-personnages
{
"model": "wan2.7-reference-video",
"prompt": "Image 1 and Image 2 are having a conversation in a modern office. Image 1 explains the product while Image 2 takes notes. The scene is professional and well-lit.",
"image_urls": [
"https://your-cdn.com/spokesperson-a.jpg",
"https://your-cdn.com/spokesperson-b.jpg"
],
"image_start": "https://your-cdn.com/office-wide-shot.jpg",
"model_params": {
"voice_bindings": {
"image1": "https://your-cdn.com/voice-a.mp3",
"image2": "https://your-cdn.com/voice-b.mp3"
}
},
"quality": "1080p",
"duration": 10
}Storyboard multi-grille
Pour les références à image unique avec plusieurs panneaux (par ex. une grille 3×3 de poses de personnages) :
{
"model": "wan2.7-reference-video",
"prompt": "Reference image. 3D cartoon style. 1. Wide shot of fantasy forest. 2. Boy parts the vines. 3. Robot scans ahead. 4. Close-up of map. 5. Boy's excited face. 6. They leap over roots.",
"image_urls": ["https://your-cdn.com/storyboard-grid.png"],
"duration": 15
}6. Mode 4 : Édition vidéo
Fonctionnement
Paramètres clés
| Paramètre | Requis | Défaut | Description |
|---|---|---|---|
model | Oui | — | wan2.7-video-edit |
prompt | Oui | — | Instruction d'édition en langage naturel |
video_urls | Oui | — | Tableau avec exactement 1 vidéo source (mp4/mov, 2-10 sec) |
image_urls | Non | — | Jusqu'à 4 images de référence pour le guidage de style/contenu |
keep_original_sound | Non | false | true préserve l'audio original ; false laisse le modèle gérer l'audio |
duration | Non | 0 | 0 = garder la durée originale ; valeurs explicites : 2-10 sec |
quality | Non | 720p | 720p ou 1080p |
Exemple : Changement de style par instruction seule
curl -X POST https://api.evolink.ai/v1/videos/generations \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "wan2.7-video-edit",
"prompt": "Convert the entire scene to a vintage film look with warm color grading and film grain",
"video_urls": ["https://your-cdn.com/source-clip.mp4"],
"keep_original_sound": true,
"duration": 0
}'Exemple : Remplacement de vêtements guidé par référence
{
"model": "wan2.7-video-edit",
"prompt": "Replace the girl's outfit with the clothes from the reference image",
"video_urls": ["https://your-cdn.com/source.mp4"],
"image_urls": ["https://your-cdn.com/target-outfit.png"]
}Ce que vous pouvez éditer
- Transfert de style : "convertir en style anime", "appliquer un effet aquarelle"
- Changement d'arrière-plan : "changer l'arrière-plan pour une rue de Tokyo sous la pluie la nuit"
- Changement d'objet/vêtement : "passer la veste en rouge", "remplacer le chapeau par une couronne"
- Colorisation : "convertir ce métrage noir et blanc en couleur"
- Éclairage : "passer l'éclairage en heure dorée"
7. Tarifs et calcul des coûts
Tarifs EvoLink Wan 2.7
| Qualité | Coût par seconde | Clip de 10 secondes |
|---|---|---|
| 720p | $0.086 | $0.86 |
| 1080p | $0.144 (1,67× du 720p) | $1.44 |
Pas d'abonnement, pas d'engagement minimum. Vous ne payez que pour les vidéos générées avec succès.
Comparaison des coûts avec d'autres fournisseurs (selon les pages fournisseurs, mai 2026)
| Fournisseur | Tarif par seconde | Coût 10 sec 720p |
|---|---|---|
| EvoLink | $0.086/sec | $0.86 |
| Together AI | $0.10/sec | $1.00 |
| Segmind (clip 720p) | ~$0.063/sec (basé sur $0.625/10sec) | $0.625 |
| Segmind (clip 1080p) | ~$0.094/sec (basé sur $0.9375/10sec) | $0.9375 |
Facturation spéciale pour reference-video et video-edit
Formule d'estimation de budget
Coût mensuel = (durée_moyenne × coût_par_seconde × volume_quotidien × 30)
8. Workflow asynchrone et gestion des tâches
Chaque requête Wan 2.7 suit le même pattern asynchrone :
POST /v1/videos/generations → retourne l'ID de tâche + statut "pending"
GET /v1/tasks/{task_id} → interroger jusqu'à statut "completed" ou "failed"
Télécharger l'URL vidéo depuis le tableau results dans les 24 heures
Cycle de vie d'une tâche
| Statut | Signification |
|---|---|
pending | Tâche acceptée, en attente dans la file |
processing | Tâche en cours de génération |
completed | Vidéo prête, URL disponible dans le tableau results |
failed | Génération échouée (vérifier le message d'erreur) |
URL de callback (webhook)
callback_url dans votre requête. EvoLink enverra un POST à cette URL quand la tâche sera terminée, échouée ou annulée. Le callback se déclenche après confirmation de facturation.Bonnes pratiques de production
- Persistez l'ID de tâche immédiatement après la soumission. Si votre service plante, vous pouvez récupérer.
- Utilisez un backoff exponentiel pour l'interrogation. Commencez à 5 secondes, plafonnez à 30 secondes.
- Téléchargez et archivez les résultats immédiatement. Les URLs vidéo expirent en 24 heures.
- Rendez les soumissions idempotentes. Hachez les payloads de requête et dédupliquez pour éviter la double facturation lors de tempêtes de retry.
9. Gestion des erreurs et codes de statut courants
| Code HTTP | Code d'erreur | Signification | Action |
|---|---|---|---|
| 400 | invalid_request | Paramètres invalides | Vérifier l'ID de modèle, longueur du prompt, plage de durée, URLs média |
| 401 | unauthorized | Token invalide ou expiré | Renouveler votre clé API |
| 402 | insufficient_quota | Crédits insuffisants | Recharger votre compte |
| 403 | model_access_denied | Le token n'a pas accès au modèle | Vérifier les permissions de la clé API |
| 429 | rate_limit_exceeded | Trop de requêtes | Ralentir et réessayer avec délai exponentiel |
| 500 | internal_error | Erreur serveur | Réessayer après 30 secondes ; si persistant, contacter le support |
Erreurs courantes
- Mauvaise orthographe de l'ID de modèle. C'est
wan2.7-text-to-video, paswan-2.7-text-to-videoouwan27-t2v. Un ID de modèle obsolète retourne un 404 propre sans message d'erreur utile. - Envoyer des combinaisons média invalides en mode I2V. Consultez le tableau des combinaisons d'entrées valides.
- Ne pas télécharger les résultats à temps. Les URLs vidéo expirent en 24 heures. Intégrez un téléchargement automatique dans votre pipeline.
10. Patterns de production et garde-fous
Garde-fous budgétaires
1. Plafonner la durée maximale côté serveur (par ex. 10 secondes pour le contenu social)
2. Utiliser le 720p par défaut sauf si le cas d'usage requiert spécifiquement le 1080p
3. Suivre les dépenses par utilisateur, fonctionnalité et ID de modèle
4. Séparer le budget reference-video (facturation entrée+sortie) du T2V/I2V
5. Définir des limites quotidiennes par utilisateur avant de monter en charge
Patterns de fiabilité
- Retry avec clé d'idempotence. Hachez votre payload de requête et vérifiez les tâches existantes avant de resoumettre.
- Gestion des timeouts. Si une tâche n'est pas terminée après 5 minutes, marquez-la pour revue manuelle plutôt que de resoumettre à l'aveugle.
- Stratégie de repli. Envisagez un repli vers Wan 2.6 ou Wan 2.5 si Wan 2.7 retourne des erreurs persistantes sur un mode spécifique.
- Validation des assets. Validez les dimensions d'image, la durée vidéo et le format audio avant soumission. Les assets défectueux causent des échecs qui ressemblent à des problèmes de qualité du modèle.
Architecture de file d'attente
Pour les systèmes de production générant plus de 100 vidéos/jour :
Requête utilisateur → validation → file de jobs → API Wan 2.7 → gestionnaire de résultats → archivage CDN → notifier l'utilisateur
N'appelez jamais l'API directement depuis les handlers de requêtes côté utilisateur. Passez toujours par un système de jobs en arrière-plan.
11. Migration de Wan 2.6 vers Wan 2.7
Ce qui ne change pas
- Endpoint API :
POST /v1/videos/generations - Authentification : même clé API et Bearer token
- Pattern asynchrone : même ID de tâche / polling / callback
- Facturation EvoLink : même compte et système de crédits
Ce qui change
wan2.7-t2v-2026-04-25).| Aspect | Wan 2.6 | Wan 2.7 |
|---|---|---|
| IDs de modèle | wan2.6-text-to-video, wan2.6-image-to-video, wan2.6-reference-video | wan2.7-text-to-video, wan2.7-image-to-video, wan2.7-reference-video, wan2.7-video-edit |
| Contrôle frame I2V | Premier frame uniquement (image_start) | Premier ET dernier frame (image_start + image_end) |
| Modes de génération I2V | Implicite | Paramètre generation_mode explicite (first_frame, first_last_frame, video_continuation) |
| Vidéo de référence | Référence unique, pas de voix | Jusqu'à 5 réfs, clonage vocal via voice_bindings |
| Édition vidéo | Non disponible | Nouveau : wan2.7-video-edit |
| T2V multi-plans | Supporté | Supporté (même syntaxe de prompt) |
Migration étape par étape
- Changer le paramètre model. Remplacez
wan2.6-text-to-videoparwan2.7-text-to-video(idem pour les autres modes). - Tester avec les prompts existants. Wan 2.7 gère le même format de prompt. Aucune réécriture nécessaire.
- Adopter les nouvelles fonctionnalités progressivement. Ajoutez
generation_mode,image_end,voice_bindings, ou video-edit selon les besoins de votre workflow. - Garder Wan 2.6 en repli. Les deux versions fonctionnent en parallèle sur EvoLink. Vous n'avez pas à tout migrer d'un coup.
12. Aide-mémoire des paramètres
Paramètres partagés (tous les modes)
| Paramètre | Type | Description |
|---|---|---|
model | string | Requis. L'un des quatre IDs de modèle |
prompt | string | Requis. Jusqu'à 5000 caractères |
quality | string | 720p (défaut) ou 1080p |
callback_url | string | Webhook HTTPS pour la fin de tâche |
Spécifiques au text-to-video
| Paramètre | Type | Description |
|---|---|---|
negative_prompt | string | Jusqu'à 500 caractères |
audio_urls | array | 1 audio de pilotage (wav/mp3, 2-30 sec, max 15Mo) |
aspect_ratio | string | 16:9, 9:16, 1:1, 4:3, 3:4 |
duration | number | 2-15 secondes |
seed | integer | 1-2147483647 |
prompt_extend | boolean | Réécriture de prompt par LLM (défaut : false) |
Spécifiques à l'image-to-video
| Paramètre | Type | Description |
|---|---|---|
generation_mode | string | first_frame, first_last_frame, video_continuation |
image_start | string | URL de l'image du premier frame |
image_end | string | URL de l'image du dernier frame |
video_urls | array | Vidéo source pour continuation |
audio_urls | array | Audio de pilotage (pas pour video_continuation) |
duration | number | 2-15 secondes |
Spécifiques à la vidéo de référence
| Paramètre | Type | Description |
|---|---|---|
image_urls | array | Images de référence (comptées dans la limite de 5) |
video_urls | array | Vidéos de référence (comptées dans la limite de 5) |
image_start | string | Frame de départ (non compté dans la limite) |
model_params.voice_bindings | object | Mappage de clé de référence vers URL audio vocal |
audio_urls | array | Liaison vocale ancienne (positionnelle) |
duration | number | 2-15 sec (images seules) ou 2-10 sec (avec réfs vidéo) |
Spécifiques à l'édition vidéo
| Paramètre | Type | Description |
|---|---|---|
video_urls | array | Exactement 1 vidéo source |
image_urls | array | Jusqu'à 4 images de référence |
keep_original_sound | boolean | true préserve l'audio original |
duration | number | 0 = durée originale ; explicite : 2-10 sec |
13. FAQ
Combien coûte Wan 2.7 sur EvoLink ?
$0.086/sec en 720p, $0.144/sec en 1080p. Un clip de 10 secondes en 720p coûte $0.86. Pas d'abonnement ni d'engagement minimum.
Quelle est la différence entre Wan 2.7 et Wan 2.6 ?
Sur EvoLink, Wan 2.7 expose l'édition vidéo, la vidéo de référence multi-personnages avec clonage vocal, et le contrôle first-and-last-frame en mode I2V. Wan 2.6 reste utile pour la narration cinématographique et les variantes Flash pour une itération plus rapide. Les deux fonctionnent en parallèle sur EvoLink.
Wan 2.7 génère-t-il automatiquement l'audio ?
audio_urls, le modèle génère automatiquement une musique de fond ou des effets sonores correspondant au contenu visuel.Les tâches échouées sont-elles facturées ?
Pour les modes reference-video et video-edit, les tâches échouées ne sont explicitement pas facturées. Pour text-to-video et image-to-video, la facturation est basée sur la durée vidéo réellement générée.
Puis-je utiliser Wan 2.7 pour du contenu NSFW ?
invalid_content.Quels formats audio sont pris en charge pour le clonage vocal ?
wav et mp3. La durée doit être de 1-10 secondes pour le clonage vocal, 2-30 secondes pour l'audio de pilotage. Taille maximale du fichier : 15Mo.Comment gérer l'expiration des URLs vidéo ?
Les URLs vidéo expirent après 24 heures. Intégrez une étape automatique de téléchargement et archivage dans votre pipeline immédiatement après la fin de la tâche. Stockez l'asset final dans votre propre CDN ou stockage objet.
Puis-je migrer de Wan 2.6 sans interruption ?
model de wan2.6-* à wan2.7-*. L'endpoint, l'authentification et le pattern asynchrone sont identiques. Les deux versions fonctionnent en parallèle, vous pouvez donc migrer route par route.Prochaines étapes
- Essayer le playground : Page du modèle Wan 2.7
- Comparer les modèles Wan : Collection de la famille Wan API
- Détail complet des tarifs : Guide des tarifs Wan API
- Patterns de production Wan 2.6 : Guide API Wan 2.6
- Review de Wan 2.5 : Review API Wan 2.5


![Guide complet Seedream 4.0 : le générateur d'images 2K en 1,8 seconde de ByteDance [2025]](/_next/image?url=https%3A%2F%2Fcdn.evolink.ai%2Fnext%2Fnetwork-operations.jpg&w=1920&q=75)