Gemini Omni kommt baldMehr erfahren
Wan 2.7 API-Leitfaden: Text-to-Video, Image-to-Video, Reference Video & Video Edit — Vollständiges Integrationshandbuch
Tutorial

Wan 2.7 API-Leitfaden: Text-to-Video, Image-to-Video, Reference Video & Video Edit — Vollständiges Integrationshandbuch

EvoLink Team
EvoLink Team
Product Team
22. Mai 2026
16 Min. Lesezeit
Dies ist der definitive Wan 2.7 API-Leitfaden — er behandelt alle vier Videomodi, jeden produktionsrelevanten Parameter, Codebeispiele zum direkten Einfügen ins Terminal, echte Kostenberechnungen, Fehlerbehandlung und einen Migrationspfad von Wan 2.6. Geschrieben für Entwickler und Ingenieure, die ausliefern wollen — nicht nur experimentieren.
Für die Produktübersicht und den Playground besuchen Sie die Wan 2.7 Modellseite. Für den Vergleich auf Familienebene besuchen Sie die Wan API-Familiensammlung. Für die Preisaufschlüsselung der gesamten Wan-Reihe besuchen Sie den Wan API-Preisleitfaden.

Zusammenfassung

  • Wan 2.7 sind vier Modelle in einem Endpunkt. Text-to-Video, Image-to-Video (mit First/Last-Frame-Steuerung), Multi-Charakter-Referenzvideo (mit Voice Cloning) und instruktionsbasierte Videobearbeitung — alles über POST /v1/videos/generations.
  • Preise auf EvoLink: $0.086/Sek. bei 720p, $0.144/Sek. bei 1080p. Ein 10-Sekunden-720p-Clip kostet $0.86. Keine Abonnements.
  • Modell-IDs: wan2.7-text-to-video, wan2.7-image-to-video, wan2.7-reference-video, wan2.7-video-edit.
  • Asynchroner Workflow. Jede Anfrage gibt sofort eine Task-ID zurück. Abfrage über GET /v1/tasks/\{task_id\}. Video-URLs laufen nach 24 Stunden ab.
  • Was Wan 2.7 gegenüber Wan 2.6 auf EvoLink hinzufügt: Videobearbeitung über die Wan 2.7-Route, First-and-Last-Frame-Steuerung in I2V und Multi-Charakter-Referenzvideo mit Voice Cloning.
  • Fehlgeschlagene Tasks werden nicht berechnet für Reference-Video- und Video-Edit-Modi.

Inhaltsverzeichnis

  1. Schnellstart: Ihr erstes Wan 2.7-Video in 60 Sekunden
  2. Die richtige Modell-ID wählen
  3. Modus 1: Text-to-Video
  4. Modus 2: Image-to-Video mit Frame-Steuerung
  5. Modus 3: Referenzvideo mit Voice Cloning
  6. Modus 4: Videobearbeitung
  7. Preise und Kostenberechnung
  8. Asynchroner Workflow und Task-Management
  9. Fehlerbehandlung und häufige Statuscodes
  10. Produktionsmuster und Sicherheitsvorkehrungen
  11. Migration von Wan 2.6 auf Wan 2.7
  12. Parameter-Referenz-Spickzettel
  13. FAQ

1. Schnellstart: Ihr erstes Wan 2.7-Video in 60 Sekunden

Voraussetzungen: Ein EvoLink-Konto und ein API-Key aus dem Dashboard.

Schritt 1: Video generieren

curl -X POST https://api.evolink.ai/v1/videos/generations \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "wan2.7-text-to-video",
    "prompt": "A drone shot over a misty mountain lake at sunrise, slow camera push forward, cinematic color grading",
    "quality": "720p",
    "aspect_ratio": "16:9",
    "duration": 5
  }'
Antwort:
{
  "id": "task-unified-1757169743-7cvnl5zw",
  "status": "pending",
  "created": 1757169743
}

Schritt 2: Ergebnis abfragen

curl https://api.evolink.ai/v1/tasks/task-unified-1757169743-7cvnl5zw \
  -H "Authorization: Bearer YOUR_API_KEY"
Wenn status den Wert "completed" hat, enthält die Antwort ein results-Array mit der Video-URL. Laden Sie es innerhalb von 24 Stunden herunter — der Link läuft ab.

Schritt 3: Das war's

Sie haben gerade ein Video für ca. $0.43 generiert (5 Sekunden × $0.086/Sek.). Ändern Sie den model-Parameter, um zwischen den vier unten beschriebenen Modi zu wechseln.

2. Die richtige Modell-ID wählen

Modell-IDModusIdeal fürDauer
wan2.7-text-to-videoText → VideoWerbeclips, Social-Media-Clips, skriptbasierte Generierung2-15 Sek.
wan2.7-image-to-videoBild → VideoProduktanimationen, Storyboard-zu-Video, First/Last-Frame-Steuerung2-15 Sek.
wan2.7-reference-videoReferenz → VideoMarkensprecher, Multi-Charakter-Serien, Voice Cloning2-15 Sek. (nur Bildreferenzen), 2-10 Sek. (mit Videoreferenzen)
wan2.7-video-editVideo → Bearbeitetes VideoStiltransfer, Hintergrundtausch, Kleidungswechsel, Kolorierung2-10 Sek.
Alle vier nutzen den gleichen Endpunkt: POST /v1/videos/generations. Nur der model-Parameter ändert sich.

3. Modus 1: Text-to-Video

Funktionsweise

Generiert ein Video aus einem Textprompt. Unterstützt optionales Treiberaudio für Lippensynchronisation oder musiksynchronisierte Ausgabe. Generiert automatisch Hintergrundmusik, wenn kein Audio bereitgestellt wird.

Wichtige Parameter

ParameterErforderlichStandardBeschreibung
modelJawan2.7-text-to-video
promptJaSzenenbeschreibung, bis zu 5000 Zeichen
negative_promptNeinAuszuschließende Elemente, bis zu 500 Zeichen
audio_urlsNeinArray mit 1 Treiberaudio-URL (wav/mp3, 2-30 Sek., max. 15MB)
qualityNein720p720p oder 1080p
aspect_ratioNein16:916:9, 9:16, 1:1, 4:3, 3:4
durationNein52-15 Sekunden (ganzzahlig)
seedNeinzufällig1-2147483647 für reproduzierbare Ausgabe
prompt_extendNeinfalseLLM-gestütztes Prompt-Rewriting (auf true setzen bei kurzen Prompts)
callback_urlNeinHTTPS-URL für Webhook bei Task-Abschluss

Multi-Shot-Erzählung

Steuern Sie die Aufnahmestruktur direkt im Prompt:

{
  "model": "wan2.7-text-to-video",
  "prompt": "A tense detective story. Shot 1 [0-3s] wide angle: rainy night street, neon lights. Shot 2 [3-6s] medium: detective enters old building. Shot 3 [6-9s] close-up: detective's determined eyes. Shot 4 [9-12s] medium: cautious advance through dim corridor. Shot 5 [12-15s] close-up: discovers key clue.",
  "aspect_ratio": "16:9",
  "duration": 15
}

Mit Treiberaudio

{
  "model": "wan2.7-text-to-video",
  "prompt": "A cartoon general in golden armor on a horse, reciting a classical poem",
  "audio_urls": ["https://your-cdn.com/recital.mp3"],
  "duration": 10
}
Regeln zur Audiokürzung: Ist das Audio länger als duration, werden nur die ersten N Sekunden verwendet. Ist es kürzer, bleibt der restliche Videoteil stumm.

4. Modus 2: Image-to-Video mit Frame-Steuerung

Funktionsweise

Generiert Video aus einem oder zwei Keyframe-Bildern. Dieser Modus bietet Ihnen First-and-Last-Frame-Steuerung — definieren Sie beide Endpunkte und das Modell leitet die Bewegungstrajektorie dazwischen ab.

Drei Generierungsmodi

generation_modeEingabenAnwendungsfall
first_frameimage_start (+ optionales audio_urls)Produktfoto oder Charakterillustration animieren
first_last_frameimage_start + image_end (+ optionales audio_urls)Start- und Endzustand definieren, Modell füllt die Bewegung
video_continuationvideo_urls[0] (+ optionales image_end)Bestehenden Clip verlängern, optional Endframe angeben
Wenn generation_mode weggelassen wird, leitet der Server ihn aus den bereitgestellten Medien ab.

Gültige Eingabekombinationen

  1. Nur image_start
  2. image_start + audio_urls
  3. image_start + image_end
  4. image_start + image_end + audio_urls
  5. video_urls (Fortsetzung)
  6. video_urls + image_end (Fortsetzung mit Endframe)

Jede andere Kombination wird abgelehnt.

Beispiel: First-and-Last-Frame

curl -X POST https://api.evolink.ai/v1/videos/generations \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "wan2.7-image-to-video",
    "generation_mode": "first_last_frame",
    "prompt": "A product bottle rotating 360 degrees with soft studio lighting",
    "image_start": "https://your-cdn.com/bottle-front.jpg",
    "image_end": "https://your-cdn.com/bottle-back.jpg",
    "quality": "1080p",
    "duration": 5
  }'

Beispiel: Video-Fortsetzung

{
  "model": "wan2.7-image-to-video",
  "generation_mode": "video_continuation",
  "prompt": "The scene continues with the character walking toward the sunset",
  "video_urls": ["https://your-cdn.com/previous-clip.mp4"],
  "image_end": "https://your-cdn.com/sunset-ending.jpg",
  "duration": 5
}

5. Modus 3: Referenzvideo mit Voice Cloning

Funktionsweise

Generiert neue Videoszenen unter Beibehaltung des Erscheinungsbilds von Charakteren aus Referenzbildern oder -videos — und klont optional deren Stimme aus einer kurzen Audioaufnahme. So erstellen Sie Multi-Charakter-Videoserien, in denen jede Person über alle Episoden hinweg konsistent aussieht und klingt.

Wichtige Einschränkungen

  • image_urls + video_urls kombiniert: maximal 5 Elemente insgesamt
  • image_start und Stimmaudio zählen nicht zum 5-Elemente-Limit
  • Dauer: 2-15 Sek. (nur Bildreferenzen), 2-10 Sek. (mit Videoreferenzen)
  • Abrechnung: Eingabevideodauer + Ausgabevideodauer. Fehlgeschlagene Tasks sind kostenlos.

Charakter-Indexierung in Prompts

Verweisen Sie auf Referenzcharaktere anhand ihrer Position in den Eingabearrays:

  • Englisch: Image 1, Image 2, Video 1, Video 2
  • Chinesisch: 图1, 图2, 视频1, 视频2
Bilder und Videos werden unabhängig gezählt — Image 1 und Video 1 können koexistieren.

Voice Cloning: zwei Methoden

Methode 1: voice_bindings (empfohlen)

Präzise Key-Value-Zuordnung zwischen Charakterreferenzen und Stimmaudio:

{
  "model": "wan2.7-reference-video",
  "prompt": "Image 1 holds Image 2 and says: 'What lovely sunshine today'",
  "image_urls": [
    "https://your-cdn.com/girl.jpg",
    "https://your-cdn.com/toy.png"
  ],
  "model_params": {
    "voice_bindings": {
      "image1": "https://your-cdn.com/girl-voice.mp3"
    }
  },
  "duration": 10
}
Methode 2: audio_urls (veraltet, positionsbasiert)
Audioclips werden positionell an image_urls / video_urls ausgerichtet. Funktioniert, ist aber weniger explizit. Verwenden Sie voice_bindings für neue Integrationen.

Beispiel: Multi-Charakter-Markenvideo

{
  "model": "wan2.7-reference-video",
  "prompt": "Image 1 and Image 2 are having a conversation in a modern office. Image 1 explains the product while Image 2 takes notes. The scene is professional and well-lit.",
  "image_urls": [
    "https://your-cdn.com/spokesperson-a.jpg",
    "https://your-cdn.com/spokesperson-b.jpg"
  ],
  "image_start": "https://your-cdn.com/office-wide-shot.jpg",
  "model_params": {
    "voice_bindings": {
      "image1": "https://your-cdn.com/voice-a.mp3",
      "image2": "https://your-cdn.com/voice-b.mp3"
    }
  },
  "quality": "1080p",
  "duration": 10
}

Multi-Grid-Storyboard

Für Einzelbild-Referenzen mit mehreren Panels (z.B. ein 3×3-Raster mit Charakterposen):

{
  "model": "wan2.7-reference-video",
  "prompt": "Reference image. 3D cartoon style. 1. Wide shot of fantasy forest. 2. Boy parts the vines. 3. Robot scans ahead. 4. Close-up of map. 5. Boy's excited face. 6. They leap over roots.",
  "image_urls": ["https://your-cdn.com/storyboard-grid.png"],
  "duration": 15
}

6. Modus 4: Videobearbeitung

Funktionsweise

Nimmt ein vorhandenes Video und wendet textgesteuerte Bearbeitungen an — Stiltransfer, Hintergrundersetzung, Kleidungswechsel, Kolorierung, Restaurierung alter Aufnahmen — ohne von Grund auf neu zu generieren. Auf EvoLinks aktuellen Wan-Routen ist Videobearbeitung über Wan 2.7 verfügbar.

Wichtige Parameter

ParameterErforderlichStandardBeschreibung
modelJawan2.7-video-edit
promptJaBearbeitungsanweisung in natürlicher Sprache
video_urlsJaArray mit genau 1 Quellvideo (mp4/mov, 2-10 Sek.)
image_urlsNeinBis zu 4 Referenzbilder für Stil-/Inhaltsanleitung
keep_original_soundNeinfalsetrue behält Originalaudio; false lässt das Modell das Audio handhaben
durationNein00 = Originallänge beibehalten; explizite Werte: 2-10 Sek.
qualityNein720p720p oder 1080p
Abrechnung: Eingabevideodauer + Ausgabevideodauer. Fehlgeschlagene Tasks sind kostenlos.

Beispiel: Rein instruktionsbasierter Stilwechsel

curl -X POST https://api.evolink.ai/v1/videos/generations \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "wan2.7-video-edit",
    "prompt": "Convert the entire scene to a vintage film look with warm color grading and film grain",
    "video_urls": ["https://your-cdn.com/source-clip.mp4"],
    "keep_original_sound": true,
    "duration": 0
  }'

Beispiel: Referenzgesteuerter Kleidungstausch

{
  "model": "wan2.7-video-edit",
  "prompt": "Replace the girl's outfit with the clothes from the reference image",
  "video_urls": ["https://your-cdn.com/source.mp4"],
  "image_urls": ["https://your-cdn.com/target-outfit.png"]
}

Was Sie bearbeiten können

  • Stiltransfer: "In Anime-Stil umwandeln", "Aquarellmalerei-Effekt anwenden"
  • Hintergrundtausch: "Hintergrund zu einer regennassen Tokioter Straße bei Nacht ändern"
  • Objekt-/Kleidungswechsel: "Jacke auf Rot ändern", "Hut durch Krone ersetzen"
  • Kolorierung: "Dieses Schwarz-Weiß-Material in Farbe umwandeln"
  • Beleuchtung: "Beleuchtung auf Goldene Stunde umstellen"

7. Preise und Kostenberechnung

QualitätKosten pro Sekunde10-Sekunden-Clip
720p$0.086$0.86
1080p$0.144 (1,67× von 720p)$1.44

Keine Abonnements, keine Mindestabnahmen. Sie bezahlen nur für erfolgreich generiertes Video.

Kostenvergleich mit anderen Anbietern (gemäß Anbieterseiten, Mai 2026)

AnbieterSekundenpreis10-Sek.-720p-Kosten
EvoLink$0.086/Sek.$0.86
Together AI$0.10/Sek.$1.00
Segmind (720p-Clip)~$0.063/Sek. (basierend auf $0.625/10 Sek.)$0.625
Segmind (1080p-Clip)~$0.094/Sek. (basierend auf $0.9375/10 Sek.)$0.9375

Spezielle Abrechnung für Reference-Video und Video-Edit

Diese beiden Modi werden nach Eingabevideodauer + Ausgabevideodauer abgerechnet. Wenn Sie ein 5-Sekunden-Referenzvideo übergeben und eine 10-Sekunden-Ausgabe generieren, werden 15 Sekunden berechnet. Fehlgeschlagene Tasks werden nicht berechnet.

Formel zur Budgetschätzung

Monatliche Kosten = (Durchschnittsdauer × Kosten_pro_Sekunde × Tagesvolumen × 30)
Beispiel: 100 Clips/Tag × 8 Sekunden × $0.086/Sek. × 30 Tage = $2.064/Monat bei 720p.

8. Asynchroner Workflow und Task-Management

Jede Wan 2.7-Anfrage folgt dem gleichen asynchronen Muster:

POST /v1/videos/generations → gibt Task-ID + Status "pending" zurück GET /v1/tasks/{task_id} → abfragen bis Status "completed" oder "failed" Video-URL aus dem results-Array innerhalb von 24 Stunden herunterladen

Task-Lebenszyklus

StatusBedeutung
pendingTask akzeptiert, wartet in der Warteschlange
processingTask wird aktiv generiert
completedVideo ist fertig, URL im results-Array verfügbar
failedGenerierung fehlgeschlagen (Fehlermeldung prüfen)

Callback-URL (Webhook)

Anstatt abzufragen, geben Sie eine callback_url in Ihrer Anfrage an. EvoLink sendet einen POST an diese URL, wenn der Task abgeschlossen, fehlgeschlagen oder abgebrochen wird. Der Callback wird nach Abrechnungsbestätigung ausgelöst.

Best Practices für die Produktion

  1. Speichern Sie die Task-ID sofort nach der Übermittlung. Bei einem Serviceausfall können Sie die Daten wiederherstellen.
  2. Verwenden Sie exponentielles Backoff beim Abfragen. Beginnen Sie bei 5 Sekunden, Obergrenze bei 30 Sekunden.
  3. Laden Sie Ergebnisse sofort herunter und archivieren Sie sie. Video-URLs laufen nach 24 Stunden ab.
  4. Machen Sie Übermittlungen idempotent. Hashen Sie Anfrage-Payloads und deduplizieren Sie, um Doppelabrechnung durch Wiederholungsstürme zu vermeiden.

9. Fehlerbehandlung und häufige Statuscodes

HTTP-CodeFehlercodeBedeutungMaßnahme
400invalid_requestFehlerhafte ParameterModell-ID, Promptlänge, Dauerbereich, Medien-URLs prüfen
401unauthorizedUngültiger oder abgelaufener TokenAPI-Key erneuern
402insufficient_quotaNicht genug GuthabenKonto aufladen
403model_access_deniedToken hat keinen ModellzugriffAPI-Key-Berechtigungen prüfen
429rate_limit_exceededZu viele AnfragenZurückfahren und mit exponentiellem Backoff wiederholen
500internal_errorServerfehlerNach 30 Sekunden wiederholen; bei Persistenz Support kontaktieren

Häufige Fehler

  • Falsche Schreibweise der Modell-ID. Es heißt wan2.7-text-to-video, nicht wan-2.7-text-to-video oder wan27-t2v. Eine veraltete Modell-ID gibt einen 404 ohne hilfreiche Fehlermeldung zurück.
  • Ungültige Medienkombinationen im I2V-Modus senden. Prüfen Sie die Tabelle gültiger Eingabekombinationen.
  • Ergebnisse nicht rechtzeitig herunterladen. Video-URLs laufen nach 24 Stunden ab. Bauen Sie automatisches Herunterladen in Ihre Pipeline ein.

10. Produktionsmuster und Sicherheitsvorkehrungen

Budget-Leitplanken

1. Maximale Dauer serverseitig begrenzen (z.B. 10 Sekunden für Social Content) 2. Standardmäßig 720p verwenden, sofern der Anwendungsfall nicht spezifisch 1080p erfordert 3. Ausgaben nach Benutzer, Feature und Modell-ID tracken 4. Reference-Video-Budget (Input+Output-Abrechnung) separat von T2V/I2V führen 5. Pro-Benutzer-Tageslimits vor dem Skalieren des Traffics festlegen

Zuverlässigkeitsmuster

  • Wiederholung mit Idempotenzschlüssel. Hashen Sie Ihren Anfrage-Payload und prüfen Sie auf bestehende Tasks vor dem erneuten Senden.
  • Timeout-Behandlung. Wenn ein Task nach 5 Minuten nicht abgeschlossen ist, markieren Sie ihn zur manuellen Überprüfung, statt blind erneut zu senden.
  • Fallback-Strategie. Erwägen Sie einen Fallback auf Wan 2.6 oder Wan 2.5, wenn Wan 2.7 bei einem bestimmten Modus anhaltende Fehler liefert.
  • Asset-Validierung. Validieren Sie Bildabmessungen, Videodauer und Audioformat vor der Übermittlung. Fehlerhafte Assets verursachen Fehler, die wie Modellqualitätsprobleme aussehen.

Warteschlangenarchitektur

Für Produktionssysteme, die mehr als 100 Videos/Tag generieren:

Benutzeranfrage → Validierung → Job-Warteschlange → Wan 2.7 API → Ergebnishandler → CDN-Archiv → Benutzer benachrichtigen

Rufen Sie die API niemals direkt aus benutzerseitigen Request-Handlern auf. Gehen Sie immer über ein Hintergrund-Job-System.


11. Migration von Wan 2.6 auf Wan 2.7

Was gleich bleibt

  • API-Endpunkt: POST /v1/videos/generations
  • Authentifizierung: gleicher API-Key und Bearer-Token
  • Asynchrones Muster: gleiche Task-ID / Polling / Callback-Ablauf
  • EvoLink-Abrechnung: gleiches Konto und Kreditsystem

Was sich ändert

Die IDs unten sind EvoLink-Route-Modell-IDs, nicht rohe DashScope-/Alibaba-Cloud-Modellnamen. Wenn Sie Alibabas API direkt verwenden, folgen die Modellnamen einer anderen Konvention (z.B. wan2.7-t2v-2026-04-25).
AspektWan 2.6Wan 2.7
Modell-IDswan2.6-text-to-video, wan2.6-image-to-video, wan2.6-reference-videowan2.7-text-to-video, wan2.7-image-to-video, wan2.7-reference-video, wan2.7-video-edit
I2V-Frame-SteuerungNur erster Frame (image_start)Erster UND letzter Frame (image_start + image_end)
I2V-GenerierungsmodiImplizitExpliziter generation_mode-Parameter (first_frame, first_last_frame, video_continuation)
ReferenzvideoEinzelreferenz, keine StimmeBis zu 5 Refs, Voice Cloning über voice_bindings
VideobearbeitungNicht verfügbarNeu: wan2.7-video-edit
Multi-Shot T2VUnterstütztUnterstützt (gleiche Prompt-Syntax)

Schritt-für-Schritt-Migration

  1. Modellparameter ändern. Ersetzen Sie wan2.6-text-to-video durch wan2.7-text-to-video (ebenso für andere Modi).
  2. Mit bestehenden Prompts testen. Wan 2.7 verarbeitet das gleiche Promptformat. Kein Umschreiben nötig.
  3. Neue Features schrittweise einführen. Fügen Sie generation_mode, image_end, voice_bindings oder Video-Edit hinzu, wenn Ihr Workflow es erfordert.
  4. Wan 2.6 als Fallback behalten. Beide Versionen laufen parallel auf EvoLink. Sie müssen nicht alles auf einmal migrieren.

12. Parameter-Referenz-Spickzettel

Gemeinsame Parameter (alle Modi)

ParameterTypBeschreibung
modelstringErforderlich. Eine der vier Modell-IDs
promptstringErforderlich. Bis zu 5000 Zeichen
qualitystring720p (Standard) oder 1080p
callback_urlstringHTTPS-Webhook für Task-Abschluss

Text-to-Video-spezifisch

ParameterTypBeschreibung
negative_promptstringBis zu 500 Zeichen
audio_urlsarray1 Treiberaudio (wav/mp3, 2-30 Sek., max. 15MB)
aspect_ratiostring16:9, 9:16, 1:1, 4:3, 3:4
durationnumber2-15 Sekunden
seedinteger1-2147483647
prompt_extendbooleanLLM-Prompt-Rewriting (Standard: false)

Image-to-Video-spezifisch

ParameterTypBeschreibung
generation_modestringfirst_frame, first_last_frame, video_continuation
image_startstringBild-URL des ersten Frames
image_endstringBild-URL des letzten Frames
video_urlsarrayQuellvideo für Fortsetzung
audio_urlsarrayTreiberaudio (nicht für video_continuation)
durationnumber2-15 Sekunden

Reference-Video-spezifisch

ParameterTypBeschreibung
image_urlsarrayReferenzbilder (zählen zum 5-Elemente-Limit)
video_urlsarrayReferenzvideos (zählen zum 5-Elemente-Limit)
image_startstringStartframe (zählt nicht zum Limit)
model_params.voice_bindingsobjectZuordnung von Referenzschlüssel zu Stimmaudio-URL
audio_urlsarrayVeraltete Stimmbindung (positionsbasiert)
durationnumber2-15 Sek. (nur Bilder) oder 2-10 Sek. (mit Videorefs)

Video-Edit-spezifisch

ParameterTypBeschreibung
video_urlsarrayGenau 1 Quellvideo
image_urlsarrayBis zu 4 Referenzbilder
keep_original_soundbooleantrue behält Originalaudio
durationnumber0 = Originallänge; explizit: 2-10 Sek.

13. FAQ

$0.086/Sek. bei 720p, $0.144/Sek. bei 1080p. Ein 10-Sekunden-720p-Clip kostet $0.86. Keine Abonnements oder Mindestabnahmen.

Was ist der Unterschied zwischen Wan 2.7 und Wan 2.6?

Auf EvoLink bietet Wan 2.7 Videobearbeitung, Multi-Charakter-Referenzvideo mit Voice Cloning und First-and-Last-Frame-Steuerung im I2V-Modus. Wan 2.6 bleibt nützlich für cinematisches Storytelling und Flash-Varianten für schnellere Iteration. Beide laufen parallel auf EvoLink.

Generiert Wan 2.7 automatisch Audio?

Im Text-to-Video-Modus ja — wenn Sie keine audio_urls bereitstellen, generiert das Modell automatisch Hintergrundmusik oder Soundeffekte passend zum visuellen Inhalt.

Werden fehlgeschlagene Tasks berechnet?

Für Reference-Video- und Video-Edit-Modi werden fehlgeschlagene Tasks ausdrücklich nicht berechnet. Für Text-to-Video und Image-to-Video basiert die Abrechnung auf der tatsächlich generierten Videodauer.

Kann ich Wan 2.7 für NSFW-Inhalte verwenden?

Nein. Das Modell lehnt Prompts ab, die gegen Inhaltsrichtlinien verstoßen. Bei Ablehnung erhalten Sie einen invalid_content-Fehler.

Welche Audioformate werden für Voice Cloning unterstützt?

wav und mp3. Die Dauer sollte 1-10 Sekunden für Voice Cloning und 2-30 Sekunden für Treiberaudio betragen. Maximale Dateigröße ist 15MB.

Wie gehe ich mit dem Ablauf von Video-URLs um?

Video-URLs laufen nach 24 Stunden ab. Bauen Sie einen automatischen Download-und-Archivierungsschritt in Ihre Pipeline ein, direkt nach Task-Abschluss. Speichern Sie das finale Asset in Ihrem eigenen CDN oder Objektspeicher.

Kann ich von Wan 2.6 ohne Ausfallzeit migrieren?

Ja. Ändern Sie den model-Parameter von wan2.6-* zu wan2.7-*. Endpunkt, Authentifizierung und asynchrones Muster sind identisch. Beide Versionen laufen parallel, sodass Sie Route für Route migrieren können.

Nächste Schritte

Bereit, Ihre KI-Kosten um 89 % zu senken?

Starten Sie noch heute mit EvoLink und erleben Sie die Vorteile intelligenter API-Routing.