Tutorial

Wan 2.7 API-Leitfaden: Text-to-Video, Image-to-Video, Reference Video & Video Edit — Vollständiges Integrationshandbuch

Name: EvoLink AI Model API Platform
Brand: EvoLink
Availability: InStock

EvoLink Team

Product Team

22. Mai 2026

16 Min. Lesezeit

Dies ist der definitive Wan 2.7 API-Leitfaden — er behandelt alle vier Videomodi, jeden produktionsrelevanten Parameter, Codebeispiele zum direkten Einfügen ins Terminal, echte Kostenberechnungen, Fehlerbehandlung und einen Migrationspfad von Wan 2.6. Geschrieben für Entwickler und Ingenieure, die ausliefern wollen — nicht nur experimentieren.

Für die Produktübersicht und den Playground besuchen Sie die Wan 2.7 Modellseite. Für den Vergleich auf Familienebene besuchen Sie die Wan API-Familiensammlung. Für die Preisaufschlüsselung der gesamten Wan-Reihe besuchen Sie den Wan API-Preisleitfaden.

Zusammenfassung

Wan 2.7 sind vier Modelle in einem Endpunkt. Text-to-Video, Image-to-Video (mit First/Last-Frame-Steuerung), Multi-Charakter-Referenzvideo (mit Voice Cloning) und instruktionsbasierte Videobearbeitung — alles über POST /v1/videos/generations.
Preise auf EvoLink: $0.086/Sek. bei 720p, $0.144/Sek. bei 1080p. Ein 10-Sekunden-720p-Clip kostet $0.86. Keine Abonnements.
Modell-IDs: wan2.7-text-to-video, wan2.7-image-to-video, wan2.7-reference-video, wan2.7-video-edit.
Asynchroner Workflow. Jede Anfrage gibt sofort eine Task-ID zurück. Abfrage über GET /v1/tasks/\{task_id\}. Video-URLs laufen nach 24 Stunden ab.
Was Wan 2.7 gegenüber Wan 2.6 auf EvoLink hinzufügt: Videobearbeitung über die Wan 2.7-Route, First-and-Last-Frame-Steuerung in I2V und Multi-Charakter-Referenzvideo mit Voice Cloning.
Fehlgeschlagene Tasks werden nicht berechnet für Reference-Video- und Video-Edit-Modi.

Inhaltsverzeichnis

Schnellstart: Ihr erstes Wan 2.7-Video in 60 Sekunden
Die richtige Modell-ID wählen
Modus 1: Text-to-Video
Modus 2: Image-to-Video mit Frame-Steuerung
Modus 3: Referenzvideo mit Voice Cloning
Modus 4: Videobearbeitung
Preise und Kostenberechnung
Asynchroner Workflow und Task-Management
Fehlerbehandlung und häufige Statuscodes
Produktionsmuster und Sicherheitsvorkehrungen
Migration von Wan 2.6 auf Wan 2.7
Parameter-Referenz-Spickzettel
FAQ

1. Schnellstart: Ihr erstes Wan 2.7-Video in 60 Sekunden

Voraussetzungen: Ein EvoLink-Konto und ein API-Key aus dem Dashboard.

Schritt 1: Video generieren

curl -X POST https://api.evolink.ai/v1/videos/generations \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "wan2.7-text-to-video",
    "prompt": "A drone shot over a misty mountain lake at sunrise, slow camera push forward, cinematic color grading",
    "quality": "720p",
    "aspect_ratio": "16:9",
    "duration": 5
  }'

Antwort:

{
  "id": "task-unified-1757169743-docdemo0",
  "status": "pending",
  "created": 1757169743
}

Schritt 2: Ergebnis abfragen

curl https://api.evolink.ai/v1/tasks/task-unified-1757169743-docdemo0 \
  -H "Authorization: Bearer YOUR_API_KEY"

Wenn status den Wert "completed" hat, enthält die Antwort ein results-Array mit der Video-URL. Laden Sie es innerhalb von 24 Stunden herunter — der Link läuft ab.

Schritt 3: Das war's

Sie haben gerade ein Video für ca. $0.43 generiert (5 Sekunden × $0.086/Sek.). Ändern Sie den model-Parameter, um zwischen den vier unten beschriebenen Modi zu wechseln.

2. Die richtige Modell-ID wählen

Modell-ID	Modus	Ideal für	Dauer
`wan2.7-text-to-video`	Text → Video	Werbeclips, Social-Media-Clips, skriptbasierte Generierung	2-15 Sek.
`wan2.7-image-to-video`	Bild → Video	Produktanimationen, Storyboard-zu-Video, First/Last-Frame-Steuerung	2-15 Sek.
`wan2.7-reference-video`	Referenz → Video	Markensprecher, Multi-Charakter-Serien, Voice Cloning	2-15 Sek. (nur Bildreferenzen), 2-10 Sek. (mit Videoreferenzen)
`wan2.7-video-edit`	Video → Bearbeitetes Video	Stiltransfer, Hintergrundtausch, Kleidungswechsel, Kolorierung	2-10 Sek.

Alle vier nutzen den gleichen Endpunkt: POST /v1/videos/generations. Nur der model-Parameter ändert sich.

3. Modus 1: Text-to-Video

Funktionsweise

Generiert ein Video aus einem Textprompt. Unterstützt optionales Treiberaudio für Lippensynchronisation oder musiksynchronisierte Ausgabe. Generiert automatisch Hintergrundmusik, wenn kein Audio bereitgestellt wird.

Wichtige Parameter

Parameter	Erforderlich	Standard	Beschreibung
`model`	Ja	—	`wan2.7-text-to-video`
`prompt`	Ja	—	Szenenbeschreibung, bis zu 5000 Zeichen
`negative_prompt`	Nein	—	Auszuschließende Elemente, bis zu 500 Zeichen
`audio_urls`	Nein	—	Array mit 1 Treiberaudio-URL (wav/mp3, 2-30 Sek., max. 15MB)
`quality`	Nein	`720p`	`720p` oder `1080p`
`aspect_ratio`	Nein	`16:9`	`16:9`, `9:16`, `1:1`, `4:3`, `3:4`
`duration`	Nein	`5`	2-15 Sekunden (ganzzahlig)
`seed`	Nein	zufällig	1-2147483647 für reproduzierbare Ausgabe
`prompt_extend`	Nein	`false`	LLM-gestütztes Prompt-Rewriting (auf `true` setzen bei kurzen Prompts)
`callback_url`	Nein	—	HTTPS-URL für Webhook bei Task-Abschluss

Multi-Shot-Erzählung

Steuern Sie die Aufnahmestruktur direkt im Prompt:

{
  "model": "wan2.7-text-to-video",
  "prompt": "A tense detective story. Shot 1 [0-3s] wide angle: rainy night street, neon lights. Shot 2 [3-6s] medium: detective enters old building. Shot 3 [6-9s] close-up: detective's determined eyes. Shot 4 [9-12s] medium: cautious advance through dim corridor. Shot 5 [12-15s] close-up: discovers key clue.",
  "aspect_ratio": "16:9",
  "duration": 15
}

Mit Treiberaudio

{
  "model": "wan2.7-text-to-video",
  "prompt": "A cartoon general in golden armor on a horse, reciting a classical poem",
  "audio_urls": ["https://your-cdn.com/recital.mp3"],
  "duration": 10
}

Regeln zur Audiokürzung: Ist das Audio länger als duration, werden nur die ersten N Sekunden verwendet. Ist es kürzer, bleibt der restliche Videoteil stumm.

4. Modus 2: Image-to-Video mit Frame-Steuerung

Funktionsweise

Generiert Video aus einem oder zwei Keyframe-Bildern. Dieser Modus bietet Ihnen First-and-Last-Frame-Steuerung — definieren Sie beide Endpunkte und das Modell leitet die Bewegungstrajektorie dazwischen ab.

Drei Generierungsmodi

`generation_mode`	Eingaben	Anwendungsfall
`first_frame`	`image_start` (+ optionales `audio_urls`)	Produktfoto oder Charakterillustration animieren
`first_last_frame`	`image_start` + `image_end` (+ optionales `audio_urls`)	Start- und Endzustand definieren, Modell füllt die Bewegung
`video_continuation`	`video_urls[0]` (+ optionales `image_end`)	Bestehenden Clip verlängern, optional Endframe angeben

Wenn generation_mode weggelassen wird, leitet der Server ihn aus den bereitgestellten Medien ab.

Gültige Eingabekombinationen

Nur image_start
image_start + audio_urls
image_start + image_end
image_start + image_end + audio_urls
video_urls (Fortsetzung)
video_urls + image_end (Fortsetzung mit Endframe)

Jede andere Kombination wird abgelehnt.

Beispiel: First-and-Last-Frame

curl -X POST https://api.evolink.ai/v1/videos/generations \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "wan2.7-image-to-video",
    "generation_mode": "first_last_frame",
    "prompt": "A product bottle rotating 360 degrees with soft studio lighting",
    "image_start": "https://your-cdn.com/bottle-front.jpg",
    "image_end": "https://your-cdn.com/bottle-back.jpg",
    "quality": "1080p",
    "duration": 5
  }'

Beispiel: Video-Fortsetzung

{
  "model": "wan2.7-image-to-video",
  "generation_mode": "video_continuation",
  "prompt": "The scene continues with the character walking toward the sunset",
  "video_urls": ["https://your-cdn.com/previous-clip.mp4"],
  "image_end": "https://your-cdn.com/sunset-ending.jpg",
  "duration": 5
}

5. Modus 3: Referenzvideo mit Voice Cloning

Funktionsweise

Generiert neue Videoszenen unter Beibehaltung des Erscheinungsbilds von Charakteren aus Referenzbildern oder -videos — und klont optional deren Stimme aus einer kurzen Audioaufnahme. So erstellen Sie Multi-Charakter-Videoserien, in denen jede Person über alle Episoden hinweg konsistent aussieht und klingt.

Wichtige Einschränkungen

image_urls + video_urls kombiniert: maximal 5 Elemente insgesamt
image_start und Stimmaudio zählen nicht zum 5-Elemente-Limit
Dauer: 2-15 Sek. (nur Bildreferenzen), 2-10 Sek. (mit Videoreferenzen)
Abrechnung: Eingabevideodauer + Ausgabevideodauer. Fehlgeschlagene Tasks sind kostenlos.

Charakter-Indexierung in Prompts

Verweisen Sie auf Referenzcharaktere anhand ihrer Position in den Eingabearrays:

Englisch: Image 1, Image 2, Video 1, Video 2
Chinesisch: 图1, 图2, 视频1, 视频2

Bilder und Videos werden unabhängig gezählt — Image 1 und Video 1 können koexistieren.

Voice Cloning: zwei Methoden

Methode 1: voice_bindings (empfohlen)

Präzise Key-Value-Zuordnung zwischen Charakterreferenzen und Stimmaudio:

{
  "model": "wan2.7-reference-video",
  "prompt": "Image 1 holds Image 2 and says: 'What lovely sunshine today'",
  "image_urls": [
    "https://your-cdn.com/girl.jpg",
    "https://your-cdn.com/toy.png"
  ],
  "model_params": {
    "voice_bindings": {
      "image1": "https://your-cdn.com/girl-voice.mp3"
    }
  },
  "duration": 10
}

Methode 2: audio_urls (veraltet, positionsbasiert)

Audioclips werden positionell an image_urls / video_urls ausgerichtet. Funktioniert, ist aber weniger explizit. Verwenden Sie voice_bindings für neue Integrationen.

Beispiel: Multi-Charakter-Markenvideo

{
  "model": "wan2.7-reference-video",
  "prompt": "Image 1 and Image 2 are having a conversation in a modern office. Image 1 explains the product while Image 2 takes notes. The scene is professional and well-lit.",
  "image_urls": [
    "https://your-cdn.com/spokesperson-a.jpg",
    "https://your-cdn.com/spokesperson-b.jpg"
  ],
  "image_start": "https://your-cdn.com/office-wide-shot.jpg",
  "model_params": {
    "voice_bindings": {
      "image1": "https://your-cdn.com/voice-a.mp3",
      "image2": "https://your-cdn.com/voice-b.mp3"
    }
  },
  "quality": "1080p",
  "duration": 10
}

Multi-Grid-Storyboard

Für Einzelbild-Referenzen mit mehreren Panels (z.B. ein 3×3-Raster mit Charakterposen):

{
  "model": "wan2.7-reference-video",
  "prompt": "Reference image. 3D cartoon style. 1. Wide shot of fantasy forest. 2. Boy parts the vines. 3. Robot scans ahead. 4. Close-up of map. 5. Boy's excited face. 6. They leap over roots.",
  "image_urls": ["https://your-cdn.com/storyboard-grid.png"],
  "duration": 15
}

6. Modus 4: Videobearbeitung

Funktionsweise

Nimmt ein vorhandenes Video und wendet textgesteuerte Bearbeitungen an — Stiltransfer, Hintergrundersetzung, Kleidungswechsel, Kolorierung, Restaurierung alter Aufnahmen — ohne von Grund auf neu zu generieren. Auf EvoLinks aktuellen Wan-Routen ist Videobearbeitung über Wan 2.7 verfügbar.

Wichtige Parameter

Parameter	Erforderlich	Standard	Beschreibung
`model`	Ja	—	`wan2.7-video-edit`
`prompt`	Ja	—	Bearbeitungsanweisung in natürlicher Sprache
`video_urls`	Ja	—	Array mit genau 1 Quellvideo (mp4/mov, 2-10 Sek.)
`image_urls`	Nein	—	Bis zu 4 Referenzbilder für Stil-/Inhaltsanleitung
`keep_original_sound`	Nein	`false`	`true` behält Originalaudio; `false` lässt das Modell das Audio handhaben
`duration`	Nein	`0`	`0` = Originallänge beibehalten; explizite Werte: 2-10 Sek.
`quality`	Nein	`720p`	`720p` oder `1080p`

Abrechnung: Eingabevideodauer + Ausgabevideodauer. Fehlgeschlagene Tasks sind kostenlos.

Beispiel: Rein instruktionsbasierter Stilwechsel

curl -X POST https://api.evolink.ai/v1/videos/generations \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "wan2.7-video-edit",
    "prompt": "Convert the entire scene to a vintage film look with warm color grading and film grain",
    "video_urls": ["https://your-cdn.com/source-clip.mp4"],
    "keep_original_sound": true,
    "duration": 0
  }'

Beispiel: Referenzgesteuerter Kleidungstausch

{
  "model": "wan2.7-video-edit",
  "prompt": "Replace the girl's outfit with the clothes from the reference image",
  "video_urls": ["https://your-cdn.com/source.mp4"],
  "image_urls": ["https://your-cdn.com/target-outfit.png"]
}

Was Sie bearbeiten können

Stiltransfer: "In Anime-Stil umwandeln", "Aquarellmalerei-Effekt anwenden"
Hintergrundtausch: "Hintergrund zu einer regennassen Tokioter Straße bei Nacht ändern"
Objekt-/Kleidungswechsel: "Jacke auf Rot ändern", "Hut durch Krone ersetzen"
Kolorierung: "Dieses Schwarz-Weiß-Material in Farbe umwandeln"
Beleuchtung: "Beleuchtung auf Goldene Stunde umstellen"

7. Preise und Kostenberechnung

EvoLink Wan 2.7-Preise

Qualität	Kosten pro Sekunde	10-Sekunden-Clip
720p	$0.086	$0.86
1080p	$0.144 (1,67× von 720p)	$1.44

Keine Abonnements, keine Mindestabnahmen. Sie bezahlen nur für erfolgreich generiertes Video.

Kostenvergleich mit anderen Anbietern (gemäß Anbieterseiten, Mai 2026)

Anbieter	Sekundenpreis	10-Sek.-720p-Kosten
EvoLink	$0.086/Sek.	$0.86
Together AI	$0.10/Sek.	$1.00
Segmind (720p-Clip)	~$0.063/Sek. (basierend auf $0.625/10 Sek.)	$0.625
Segmind (1080p-Clip)	~$0.094/Sek. (basierend auf $0.9375/10 Sek.)	$0.9375

Spezielle Abrechnung für Reference-Video und Video-Edit

Diese beiden Modi werden nach Eingabevideodauer + Ausgabevideodauer abgerechnet. Wenn Sie ein 5-Sekunden-Referenzvideo übergeben und eine 10-Sekunden-Ausgabe generieren, werden 15 Sekunden berechnet. Fehlgeschlagene Tasks werden nicht berechnet.

Formel zur Budgetschätzung

Monatliche Kosten = (Durchschnittsdauer × Kosten_pro_Sekunde × Tagesvolumen × 30)

Beispiel: 100 Clips/Tag × 8 Sekunden × $0.086/Sek. × 30 Tage = $2.064/Monat bei 720p.

8. Asynchroner Workflow und Task-Management

Jede Wan 2.7-Anfrage folgt dem gleichen asynchronen Muster:

POST /v1/videos/generations → gibt Task-ID + Status "pending" zurück
GET /v1/tasks/{task_id} → abfragen bis Status "completed" oder "failed"
Video-URL aus dem results-Array innerhalb von 24 Stunden herunterladen

Task-Lebenszyklus

Status	Bedeutung
`pending`	Task akzeptiert, wartet in der Warteschlange
`processing`	Task wird aktiv generiert
`completed`	Video ist fertig, URL im `results`-Array verfügbar
`failed`	Generierung fehlgeschlagen (Fehlermeldung prüfen)

Callback-URL (Webhook)

Anstatt abzufragen, geben Sie eine callback_url in Ihrer Anfrage an. EvoLink sendet einen POST an diese URL, wenn der Task abgeschlossen, fehlgeschlagen oder abgebrochen wird. Der Callback wird nach Abrechnungsbestätigung ausgelöst.

Best Practices für die Produktion

Speichern Sie die Task-ID sofort nach der Übermittlung. Bei einem Serviceausfall können Sie die Daten wiederherstellen.
Verwenden Sie exponentielles Backoff beim Abfragen. Beginnen Sie bei 5 Sekunden, Obergrenze bei 30 Sekunden.
Laden Sie Ergebnisse sofort herunter und archivieren Sie sie. Video-URLs laufen nach 24 Stunden ab.
Machen Sie Übermittlungen idempotent. Hashen Sie Anfrage-Payloads und deduplizieren Sie, um Doppelabrechnung durch Wiederholungsstürme zu vermeiden.

9. Fehlerbehandlung und häufige Statuscodes

HTTP-Code	Fehlercode	Bedeutung	Maßnahme
400	`invalid_request`	Fehlerhafte Parameter	Modell-ID, Promptlänge, Dauerbereich, Medien-URLs prüfen
401	`unauthorized`	Ungültiger oder abgelaufener Token	API-Key erneuern
402	`insufficient_quota`	Nicht genug Guthaben	Konto aufladen
403	`model_access_denied`	Token hat keinen Modellzugriff	API-Key-Berechtigungen prüfen
429	`rate_limit_exceeded`	Zu viele Anfragen	Zurückfahren und mit exponentiellem Backoff wiederholen
500	`internal_error`	Serverfehler	Nach 30 Sekunden wiederholen; bei Persistenz Support kontaktieren

Häufige Fehler

Falsche Schreibweise der Modell-ID. Es heißt wan2.7-text-to-video, nicht wan-2.7-text-to-video oder wan27-t2v. Eine veraltete Modell-ID gibt einen 404 ohne hilfreiche Fehlermeldung zurück.
Ungültige Medienkombinationen im I2V-Modus senden. Prüfen Sie die Tabelle gültiger Eingabekombinationen.
Ergebnisse nicht rechtzeitig herunterladen. Video-URLs laufen nach 24 Stunden ab. Bauen Sie automatisches Herunterladen in Ihre Pipeline ein.

10. Produktionsmuster und Sicherheitsvorkehrungen

Budget-Leitplanken

1. Maximale Dauer serverseitig begrenzen (z.B. 10 Sekunden für Social Content)
2. Standardmäßig 720p verwenden, sofern der Anwendungsfall nicht spezifisch 1080p erfordert
3. Ausgaben nach Benutzer, Feature und Modell-ID tracken
4. Reference-Video-Budget (Input+Output-Abrechnung) separat von T2V/I2V führen
5. Pro-Benutzer-Tageslimits vor dem Skalieren des Traffics festlegen

Zuverlässigkeitsmuster

Wiederholung mit Idempotenzschlüssel. Hashen Sie Ihren Anfrage-Payload und prüfen Sie auf bestehende Tasks vor dem erneuten Senden.
Timeout-Behandlung. Wenn ein Task nach 5 Minuten nicht abgeschlossen ist, markieren Sie ihn zur manuellen Überprüfung, statt blind erneut zu senden.
Fallback-Strategie. Erwägen Sie einen Fallback auf Wan 2.6 oder Wan 2.5, wenn Wan 2.7 bei einem bestimmten Modus anhaltende Fehler liefert.
Asset-Validierung. Validieren Sie Bildabmessungen, Videodauer und Audioformat vor der Übermittlung. Fehlerhafte Assets verursachen Fehler, die wie Modellqualitätsprobleme aussehen.

Warteschlangenarchitektur

Für Produktionssysteme, die mehr als 100 Videos/Tag generieren:

Benutzeranfrage → Validierung → Job-Warteschlange → Wan 2.7 API → Ergebnishandler → CDN-Archiv → Benutzer benachrichtigen

Rufen Sie die API niemals direkt aus benutzerseitigen Request-Handlern auf. Gehen Sie immer über ein Hintergrund-Job-System.

11. Migration von Wan 2.6 auf Wan 2.7

Was gleich bleibt

API-Endpunkt: POST /v1/videos/generations
Authentifizierung: gleicher API-Key und Bearer-Token
Asynchrones Muster: gleiche Task-ID / Polling / Callback-Ablauf
EvoLink-Abrechnung: gleiches Konto und Kreditsystem

Was sich ändert

Die IDs unten sind EvoLink-Route-Modell-IDs, nicht rohe DashScope-/Alibaba-Cloud-Modellnamen. Wenn Sie Alibabas API direkt verwenden, folgen die Modellnamen einer anderen Konvention (z.B. wan2.7-t2v-2026-04-25).

Aspekt	Wan 2.6	Wan 2.7
Modell-IDs	`wan2.6-text-to-video`, `wan2.6-image-to-video`, `wan2.6-reference-video`	`wan2.7-text-to-video`, `wan2.7-image-to-video`, `wan2.7-reference-video`, `wan2.7-video-edit`
I2V-Frame-Steuerung	Nur erster Frame (`image_start`)	Erster UND letzter Frame (`image_start` + `image_end`)
I2V-Generierungsmodi	Implizit	Expliziter `generation_mode`-Parameter (`first_frame`, `first_last_frame`, `video_continuation`)
Referenzvideo	Einzelreferenz, keine Stimme	Bis zu 5 Refs, Voice Cloning über `voice_bindings`
Videobearbeitung	Nicht verfügbar	Neu: `wan2.7-video-edit`
Multi-Shot T2V	Unterstützt	Unterstützt (gleiche Prompt-Syntax)

Schritt-für-Schritt-Migration

Modellparameter ändern. Ersetzen Sie wan2.6-text-to-video durch wan2.7-text-to-video (ebenso für andere Modi).
Mit bestehenden Prompts testen. Wan 2.7 verarbeitet das gleiche Promptformat. Kein Umschreiben nötig.
Neue Features schrittweise einführen. Fügen Sie generation_mode, image_end, voice_bindings oder Video-Edit hinzu, wenn Ihr Workflow es erfordert.
Wan 2.6 als Fallback behalten. Beide Versionen laufen parallel auf EvoLink. Sie müssen nicht alles auf einmal migrieren.

12. Parameter-Referenz-Spickzettel

Gemeinsame Parameter (alle Modi)

Parameter	Typ	Beschreibung
`model`	string	Erforderlich. Eine der vier Modell-IDs
`prompt`	string	Erforderlich. Bis zu 5000 Zeichen
`quality`	string	`720p` (Standard) oder `1080p`
`callback_url`	string	HTTPS-Webhook für Task-Abschluss

Text-to-Video-spezifisch

Parameter	Typ	Beschreibung
`negative_prompt`	string	Bis zu 500 Zeichen
`audio_urls`	array	1 Treiberaudio (wav/mp3, 2-30 Sek., max. 15MB)
`aspect_ratio`	string	`16:9`, `9:16`, `1:1`, `4:3`, `3:4`
`duration`	number	2-15 Sekunden
`seed`	integer	1-2147483647
`prompt_extend`	boolean	LLM-Prompt-Rewriting (Standard: false)

Image-to-Video-spezifisch

Parameter	Typ	Beschreibung
`generation_mode`	string	`first_frame`, `first_last_frame`, `video_continuation`
`image_start`	string	Bild-URL des ersten Frames
`image_end`	string	Bild-URL des letzten Frames
`video_urls`	array	Quellvideo für Fortsetzung
`audio_urls`	array	Treiberaudio (nicht für video_continuation)
`duration`	number	2-15 Sekunden

Reference-Video-spezifisch

Parameter	Typ	Beschreibung
`image_urls`	array	Referenzbilder (zählen zum 5-Elemente-Limit)
`video_urls`	array	Referenzvideos (zählen zum 5-Elemente-Limit)
`image_start`	string	Startframe (zählt nicht zum Limit)
`model_params.voice_bindings`	object	Zuordnung von Referenzschlüssel zu Stimmaudio-URL
`audio_urls`	array	Veraltete Stimmbindung (positionsbasiert)
`duration`	number	2-15 Sek. (nur Bilder) oder 2-10 Sek. (mit Videorefs)

Video-Edit-spezifisch

Parameter	Typ	Beschreibung
`video_urls`	array	Genau 1 Quellvideo
`image_urls`	array	Bis zu 4 Referenzbilder
`keep_original_sound`	boolean	`true` behält Originalaudio
`duration`	number	`0` = Originallänge; explizit: 2-10 Sek.

13. FAQ

Was kostet Wan 2.7 auf EvoLink?

$0.086/Sek. bei 720p, $0.144/Sek. bei 1080p. Ein 10-Sekunden-720p-Clip kostet $0.86. Keine Abonnements oder Mindestabnahmen.

Was ist der Unterschied zwischen Wan 2.7 und Wan 2.6?

Auf EvoLink bietet Wan 2.7 Videobearbeitung, Multi-Charakter-Referenzvideo mit Voice Cloning und First-and-Last-Frame-Steuerung im I2V-Modus. Wan 2.6 bleibt nützlich für cinematisches Storytelling und Flash-Varianten für schnellere Iteration. Beide laufen parallel auf EvoLink.

Generiert Wan 2.7 automatisch Audio?

Im Text-to-Video-Modus ja — wenn Sie keine audio_urls bereitstellen, generiert das Modell automatisch Hintergrundmusik oder Soundeffekte passend zum visuellen Inhalt.

Werden fehlgeschlagene Tasks berechnet?

Für Reference-Video- und Video-Edit-Modi werden fehlgeschlagene Tasks ausdrücklich nicht berechnet. Für Text-to-Video und Image-to-Video basiert die Abrechnung auf der tatsächlich generierten Videodauer.

Kann ich Wan 2.7 für NSFW-Inhalte verwenden?

Nein. Das Modell lehnt Prompts ab, die gegen Inhaltsrichtlinien verstoßen. Bei Ablehnung erhalten Sie einen invalid_content-Fehler.

Welche Audioformate werden für Voice Cloning unterstützt?

wav und mp3. Die Dauer sollte 1-10 Sekunden für Voice Cloning und 2-30 Sekunden für Treiberaudio betragen. Maximale Dateigröße ist 15MB.

Wie gehe ich mit dem Ablauf von Video-URLs um?

Video-URLs laufen nach 24 Stunden ab. Bauen Sie einen automatischen Download-und-Archivierungsschritt in Ihre Pipeline ein, direkt nach Task-Abschluss. Speichern Sie das finale Asset in Ihrem eigenen CDN oder Objektspeicher.

Kann ich von Wan 2.6 ohne Ausfallzeit migrieren?

Ja. Ändern Sie den model-Parameter von wan2.6-* zu wan2.7-*. Endpunkt, Authentifizierung und asynchrones Muster sind identisch. Beide Versionen laufen parallel, sodass Sie Route für Route migrieren können.

Nächste Schritte

Playground ausprobieren: Wan 2.7 Modellseite
Wan-Modelle vergleichen: Wan API-Familiensammlung
Vollständige Preisaufschlüsselung: Wan API-Preisleitfaden
Wan 2.6 Produktionsmuster: Wan 2.6 API-Leitfaden
Wan 2.5 Review: Wan 2.5 API-Review

Alle Beiträge

#Wan 2.7 #Alibaba Cloud #AI Video #Text-to-Video #Image-to-Video #Video Editing #Reference Video #API Guide

Wan 2.7 API-Leitfaden: Text-to-Video, Image-to-Video, Reference Video & Video Edit — Vollständiges Integrationshandbuch

Zusammenfassung

Inhaltsverzeichnis

1. Schnellstart: Ihr erstes Wan 2.7-Video in 60 Sekunden

Schritt 1: Video generieren

Schritt 2: Ergebnis abfragen

Schritt 3: Das war's

2. Die richtige Modell-ID wählen

3. Modus 1: Text-to-Video

Funktionsweise

Wichtige Parameter

Multi-Shot-Erzählung

Mit Treiberaudio

4. Modus 2: Image-to-Video mit Frame-Steuerung

Funktionsweise

Drei Generierungsmodi

Gültige Eingabekombinationen

Beispiel: First-and-Last-Frame

Beispiel: Video-Fortsetzung

5. Modus 3: Referenzvideo mit Voice Cloning

Funktionsweise

Wichtige Einschränkungen

Charakter-Indexierung in Prompts

Voice Cloning: zwei Methoden

Beispiel: Multi-Charakter-Markenvideo

Multi-Grid-Storyboard

6. Modus 4: Videobearbeitung

Funktionsweise

Wichtige Parameter

Beispiel: Rein instruktionsbasierter Stilwechsel

Beispiel: Referenzgesteuerter Kleidungstausch

Was Sie bearbeiten können

7. Preise und Kostenberechnung

EvoLink Wan 2.7-Preise

Kostenvergleich mit anderen Anbietern (gemäß Anbieterseiten, Mai 2026)

Spezielle Abrechnung für Reference-Video und Video-Edit

Formel zur Budgetschätzung

8. Asynchroner Workflow und Task-Management

Task-Lebenszyklus

Callback-URL (Webhook)

Best Practices für die Produktion

9. Fehlerbehandlung und häufige Statuscodes

Häufige Fehler

10. Produktionsmuster und Sicherheitsvorkehrungen

Budget-Leitplanken

Zuverlässigkeitsmuster

Warteschlangenarchitektur

11. Migration von Wan 2.6 auf Wan 2.7

Was gleich bleibt

Was sich ändert

Schritt-für-Schritt-Migration

12. Parameter-Referenz-Spickzettel

Gemeinsame Parameter (alle Modi)

Text-to-Video-spezifisch

Image-to-Video-spezifisch

Reference-Video-spezifisch

Video-Edit-spezifisch

13. FAQ

Was kostet Wan 2.7 auf EvoLink?

Was ist der Unterschied zwischen Wan 2.7 und Wan 2.6?

Generiert Wan 2.7 automatisch Audio?

Werden fehlgeschlagene Tasks berechnet?

Kann ich Wan 2.7 für NSFW-Inhalte verwenden?

Welche Audioformate werden für Voice Cloning unterstützt?

Wie gehe ich mit dem Ablauf von Video-URLs um?

Kann ich von Wan 2.6 ohne Ausfallzeit migrieren?

Nächste Schritte

Ähnliche Artikel

Wan 2.7 Video Edit API: Instruktionsbasierte Videobearbeitung für Produktions-Workflows

Wan 2.6 API Produktionsleitfaden: Async-Jobs, Budget-Guardrails und Integration für Ingenieure

Seedream 4.0 Komplett-Leitfaden: ByteDances 2K-Bildgenerator in 1,8 Sekunden [2025]

Bereit, Ihre KI-Kosten um 89 % zu senken?