
Wan 2.7 API 가이드: 텍스트-투-비디오, 이미지-투-비디오, 레퍼런스 비디오 및 비디오 편집 — 완벽한 통합 핸드북

요약
- Wan 2.7은 하나의 엔드포인트에 4개 모델. 텍스트-투-비디오, 이미지-투-비디오(첫/마지막 프레임 제어), 멀티 캐릭터 레퍼런스 비디오(음성 복제), 지시 기반 비디오 편집 — 모두
POST /v1/videos/generations를 통해 사용 가능. - EvoLink 가격: 720p에서 $0.086/초, 1080p에서 $0.144/초. 10초 720p 클립 비용은 $0.86. 구독 없음.
- 모델 ID:
wan2.7-text-to-video,wan2.7-image-to-video,wan2.7-reference-video,wan2.7-video-edit. - 비동기 워크플로. 모든 요청은 즉시 태스크 ID를 반환.
GET /v1/tasks/\{task_id\}로 상태 폴링. 비디오 URL은 24시간 후 만료. - EvoLink에서 Wan 2.7이 Wan 2.6에 추가하는 것: Wan 2.7 경로를 통한 비디오 편집, I2V에서의 첫/마지막 프레임 제어, 음성 복제 멀티 캐릭터 레퍼런스 비디오.
- 실패한 태스크는 과금되지 않습니다 — 레퍼런스 비디오 및 비디오 편집 모드의 경우.
목차
- 퀵 스타트: 60초 만에 첫 Wan 2.7 비디오 생성
- 적절한 모델 ID 선택
- 모드 1: 텍스트-투-비디오
- 모드 2: 프레임 제어 이미지-투-비디오
- 모드 3: 음성 복제 레퍼런스 비디오
- 모드 4: 비디오 편집
- 가격 및 비용 계산
- 비동기 워크플로 및 태스크 관리
- 오류 처리 및 일반 상태 코드
- 프로덕션 패턴 및 가드레일
- Wan 2.6에서 Wan 2.7로 마이그레이션
- 파라미터 레퍼런스 치트시트
- 자주 묻는 질문
1. 퀵 스타트: 60초 만에 첫 Wan 2.7 비디오 생성
1단계: 비디오 생성
curl -X POST https://api.evolink.ai/v1/videos/generations \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "wan2.7-text-to-video",
"prompt": "A drone shot over a misty mountain lake at sunrise, slow camera push forward, cinematic color grading",
"quality": "720p",
"aspect_ratio": "16:9",
"duration": 5
}'{
"id": "task-unified-1757169743-7cvnl5zw",
"status": "pending",
"created": 1757169743
}2단계: 결과 폴링
curl https://api.evolink.ai/v1/tasks/task-unified-1757169743-7cvnl5zw \
-H "Authorization: Bearer YOUR_API_KEY"status가 "completed"가 되면, 응답에 비디오 URL이 포함된 results 배열이 포함됩니다. 24시간 이내에 다운로드하세요 — 링크가 만료됩니다.3단계: 완료
model 파라미터를 변경하여 아래 4가지 모드를 전환하세요.2. 적절한 모델 ID 선택
| 모델 ID | 모드 | 최적 용도 | 길이 |
|---|---|---|---|
wan2.7-text-to-video | 텍스트 → 비디오 | 광고 크리에이티브, SNS 클립, 스크립트 기반 생성 | 2-15초 |
wan2.7-image-to-video | 이미지 → 비디오 | 제품 애니메이션, 스토리보드-투-비디오, 첫/마지막 프레임 제어 | 2-15초 |
wan2.7-reference-video | 레퍼런스 → 비디오 | 브랜드 대변인, 멀티 캐릭터 시리즈, 음성 복제 | 2-15초(이미지만), 2-10초(비디오 레퍼런스 포함) |
wan2.7-video-edit | 비디오 → 편집된 비디오 | 스타일 변환, 배경 교체, 의상 변경, 컬러화 | 2-10초 |
POST /v1/videos/generations. model 파라미터만 변경됩니다.3. 모드 1: 텍스트-투-비디오
기능
텍스트 프롬프트에서 비디오를 생성합니다. 립싱크 또는 음악 동기화 출력을 위한 드라이빙 오디오를 선택적으로 지원합니다. 오디오가 제공되지 않으면 자동으로 배경 음악을 생성합니다.
주요 파라미터
| 파라미터 | 필수 | 기본값 | 설명 |
|---|---|---|---|
model | 예 | — | wan2.7-text-to-video |
prompt | 예 | — | 장면 설명, 최대 5000자 |
negative_prompt | 아니오 | — | 제외할 내용, 최대 500자 |
audio_urls | 아니오 | — | 드라이빙 오디오 URL 1개 배열 (wav/mp3, 2-30초, 최대 15MB) |
quality | 아니오 | 720p | 720p 또는 1080p |
aspect_ratio | 아니오 | 16:9 | 16:9, 9:16, 1:1, 4:3, 3:4 |
duration | 아니오 | 5 | 2-15초 (정수) |
seed | 아니오 | 랜덤 | 1-2147483647 (재현 가능한 출력용) |
prompt_extend | 아니오 | false | LLM 프롬프트 리라이팅 (짧은 프롬프트에 true 설정) |
callback_url | 아니오 | — | 태스크 완료 webhook용 HTTPS URL |
멀티 샷 내러티브
프롬프트 내에서 직접 샷 구조를 제어:
{
"model": "wan2.7-text-to-video",
"prompt": "A tense detective story. Shot 1 [0-3s] wide angle: rainy night street, neon lights. Shot 2 [3-6s] medium: detective enters old building. Shot 3 [6-9s] close-up: detective's determined eyes. Shot 4 [9-12s] medium: cautious advance through dim corridor. Shot 5 [12-15s] close-up: discovers key clue.",
"aspect_ratio": "16:9",
"duration": 15
}드라이빙 오디오 포함
{
"model": "wan2.7-text-to-video",
"prompt": "A cartoon general in golden armor on a horse, reciting a classical poem",
"audio_urls": ["https://your-cdn.com/recital.mp3"],
"duration": 10
}duration보다 길면 처음 N초만 사용됩니다. 더 짧으면 나머지 비디오 부분은 무음이 됩니다.4. 모드 2: 프레임 제어 이미지-투-비디오
기능
3가지 생성 모드
generation_mode | 입력 | 사용 사례 |
|---|---|---|
first_frame | image_start (+ 선택적 audio_urls) | 제품 사진이나 캐릭터 일러스트 애니메이션화 |
first_last_frame | image_start + image_end (+ 선택적 audio_urls) | 시작/종료 상태 정의, 모델이 모션 보완 |
video_continuation | video_urls[0] (+ 선택적 image_end) | 기존 클립 연장, 선택적으로 종료 프레임 지정 |
generation_mode를 생략하면 서버가 제공된 미디어에서 추론합니다.유효한 입력 조합
image_start만image_start+audio_urlsimage_start+image_endimage_start+image_end+audio_urlsvideo_urls(계속)video_urls+image_end(종료 프레임 포함 계속)
다른 조합은 거부됩니다.
예제: 첫/마지막 프레임
curl -X POST https://api.evolink.ai/v1/videos/generations \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "wan2.7-image-to-video",
"generation_mode": "first_last_frame",
"prompt": "A product bottle rotating 360 degrees with soft studio lighting",
"image_start": "https://your-cdn.com/bottle-front.jpg",
"image_end": "https://your-cdn.com/bottle-back.jpg",
"quality": "1080p",
"duration": 5
}'예제: 비디오 계속
{
"model": "wan2.7-image-to-video",
"generation_mode": "video_continuation",
"prompt": "The scene continues with the character walking toward the sunset",
"video_urls": ["https://your-cdn.com/previous-clip.mp4"],
"image_end": "https://your-cdn.com/sunset-ending.jpg",
"duration": 5
}5. 모드 3: 음성 복제 레퍼런스 비디오
기능
레퍼런스 이미지나 비디오의 캐릭터 외모를 유지하면서 새로운 비디오 장면을 생성 — 선택적으로 짧은 오디오 샘플에서 음성을 복제합니다. 에피소드 간 각 인물의 외모와 목소리가 일관된 멀티 캐릭터 비디오 시리즈를 구축하는 방법입니다.
주요 제약
image_urls+video_urls합계: 최대 5개 아이템image_start와 음성 오디오는 이 5개 아이템 제한에 포함되지 않음- 길이: 2-15초 (이미지만 레퍼런스), 2-10초 (비디오 레퍼런스 포함 시)
- 과금: 입력 비디오 길이 + 출력 비디오 길이. 실패한 태스크는 무료.
프롬프트 내 캐릭터 인덱싱
입력 배열의 위치로 캐릭터를 참조:
- 영어:
Image 1,Image 2,Video 1,Video 2 - 중국어:
图1,图2,视频1,视频2
Image 1과 Video 1이 공존 가능.음성 복제: 2가지 방법
voice_bindings (권장)캐릭터 레퍼런스와 음성 오디오 간의 정확한 키-값 매핑:
{
"model": "wan2.7-reference-video",
"prompt": "Image 1 holds Image 2 and says: 'What lovely sunshine today'",
"image_urls": [
"https://your-cdn.com/girl.jpg",
"https://your-cdn.com/toy.png"
],
"model_params": {
"voice_bindings": {
"image1": "https://your-cdn.com/girl-voice.mp3"
}
},
"duration": 10
}audio_urls (레거시 위치 기반)image_urls / video_urls와 위치로 정렬된 오디오 클립. 작동하지만 덜 명시적. 새 통합에는 voice_bindings를 사용하세요.예제: 멀티 캐릭터 브랜드 비디오
{
"model": "wan2.7-reference-video",
"prompt": "Image 1 and Image 2 are having a conversation in a modern office. Image 1 explains the product while Image 2 takes notes. The scene is professional and well-lit.",
"image_urls": [
"https://your-cdn.com/spokesperson-a.jpg",
"https://your-cdn.com/spokesperson-b.jpg"
],
"image_start": "https://your-cdn.com/office-wide-shot.jpg",
"model_params": {
"voice_bindings": {
"image1": "https://your-cdn.com/voice-a.mp3",
"image2": "https://your-cdn.com/voice-b.mp3"
}
},
"quality": "1080p",
"duration": 10
}멀티 그리드 스토리보드
여러 패널이 있는 단일 이미지 레퍼런스(예: 캐릭터 포즈의 3×3 그리드):
{
"model": "wan2.7-reference-video",
"prompt": "Reference image. 3D cartoon style. 1. Wide shot of fantasy forest. 2. Boy parts the vines. 3. Robot scans ahead. 4. Close-up of map. 5. Boy's excited face. 6. They leap over roots.",
"image_urls": ["https://your-cdn.com/storyboard-grid.png"],
"duration": 15
}6. 모드 4: 비디오 편집
기능
주요 파라미터
| 파라미터 | 필수 | 기본값 | 설명 |
|---|---|---|---|
model | 예 | — | wan2.7-video-edit |
prompt | 예 | — | 자연어 편집 지시 |
video_urls | 예 | — | 소스 비디오 1개 배열 (mp4/mov, 2-10초) |
image_urls | 아니오 | — | 스타일/콘텐츠 가이드용 레퍼런스 이미지 (최대 4개) |
keep_original_sound | 아니오 | false | true로 원본 오디오 보존; false로 모델이 오디오 처리 |
duration | 아니오 | 0 | 0 = 원본 길이 유지; 명시적 값: 2-10초 |
quality | 아니오 | 720p | 720p 또는 1080p |
예제: 지시만으로 스타일 변경
curl -X POST https://api.evolink.ai/v1/videos/generations \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "wan2.7-video-edit",
"prompt": "Convert the entire scene to a vintage film look with warm color grading and film grain",
"video_urls": ["https://your-cdn.com/source-clip.mp4"],
"keep_original_sound": true,
"duration": 0
}'예제: 레퍼런스 가이드 의상 교체
{
"model": "wan2.7-video-edit",
"prompt": "Replace the girl's outfit with the clothes from the reference image",
"video_urls": ["https://your-cdn.com/source.mp4"],
"image_urls": ["https://your-cdn.com/target-outfit.png"]
}편집 가능한 것들
- 스타일 변환: "애니메이션 스타일로 변환", "수채화 효과 적용"
- 배경 교체: "배경을 밤의 비 내리는 도쿄 거리로 변경"
- 오브젝트/의상 변경: "재킷을 빨간색으로 변경", "모자를 왕관으로 교체"
- 컬러화: "이 흑백 영상을 컬러로 변환"
- 라이팅: "골든 아워 라이팅으로 변경"
7. 가격 및 비용 계산
EvoLink Wan 2.7 가격
| 화질 | 초당 비용 | 10초 클립 |
|---|---|---|
| 720p | $0.086 | $0.86 |
| 1080p | $0.144 (720p의 1.67배) | $1.44 |
구독 없음, 최소 약정 없음. 성공적으로 생성된 비디오에 대해서만 과금.
타 제공업체와의 비용 비교 (제공업체 페이지 기준, 2026년 5월)
| 제공업체 | 초당 요금 | 720p 10초 비용 |
|---|---|---|
| EvoLink | $0.086/초 | $0.86 |
| Together AI | $0.10/초 | $1.00 |
| Segmind (720p 클립) | ~$0.063/초 ($0.625/10초 기준) | $0.625 |
| Segmind (1080p 클립) | ~$0.094/초 ($0.9375/10초 기준) | $0.9375 |
레퍼런스 비디오 및 비디오 편집 특별 과금
예산 추정 공식
월간 비용 = (평균_길이 × 초당_비용 × 일일_볼륨 × 30)
8. 비동기 워크플로 및 태스크 관리
모든 Wan 2.7 요청은 동일한 비동기 패턴을 따릅니다:
POST /v1/videos/generations → 태스크 id + 상태 "pending" 반환
GET /v1/tasks/{task_id} → 상태가 "completed" 또는 "failed"가 될 때까지 폴링
24시간 이내에 results 배열에서 비디오 URL 다운로드
태스크 라이프사이클
| 상태 | 의미 |
|---|---|
pending | 태스크 수락됨, 대기열에서 대기 중 |
processing | 태스크가 활발히 생성 중 |
completed | 비디오 준비 완료, results 배열에 URL 사용 가능 |
failed | 생성 실패 (오류 메시지 확인) |
콜백 URL (webhook)
callback_url을 제공하세요. 태스크가 완료, 실패 또는 취소되면 EvoLink가 이 URL로 POST합니다. 콜백은 과금 확인 후 발생합니다.프로덕션 모범 사례
- 제출 즉시 태스크 ID를 영구 저장. 서비스가 크래시해도 복구 가능.
- 폴링 시 지수 백오프 사용. 5초에서 시작, 최대 30초.
- 결과를 즉시 다운로드하고 아카이브. 비디오 URL은 24시간 후 만료.
- 제출을 멱등적으로 만들기. 요청 페이로드를 해시하고 중복 제거하여 리트라이 스톰으로 인한 이중 과금 방지.
9. 오류 처리 및 일반 상태 코드
| HTTP 코드 | 오류 코드 | 의미 | 조치 |
|---|---|---|---|
| 400 | invalid_request | 잘못된 파라미터 | 모델 ID, 프롬프트 길이, 길이 범위, 미디어 URL 확인 |
| 401 | unauthorized | 유효하지 않거나 만료된 토큰 | API 키 갱신 |
| 402 | insufficient_quota | 크레딧 부족 | 계정 충전 |
| 403 | model_access_denied | 토큰에 모델 접근 권한 없음 | API 키 권한 확인 |
| 429 | rate_limit_exceeded | 요청 과다 | 백오프 후 지수 지연으로 리트라이 |
| 500 | internal_error | 서버 오류 | 30초 후 리트라이; 지속되면 지원팀 연락 |
흔한 실수
- 모델 ID 오타.
wan2.7-text-to-video이지,wan-2.7-text-to-video나wan27-t2v가 아닙니다. 오래된 모델 ID는 유용한 오류 없이 깨끗한 404를 반환합니다. - I2V 모드에서 잘못된 미디어 조합 전송. 유효한 입력 조합 표를 확인하세요.
- 결과를 제때 다운로드하지 않기. 비디오 URL은 24시간 후 만료. 파이프라인에 자동 다운로드를 구축하세요.
10. 프로덕션 패턴 및 가드레일
예산 가드레일
1. 서버 측에서 최대 길이 제한 (예: 소셜 콘텐츠에 10초)
2. 사용 사례가 특별히 1080p를 요구하지 않는 한 기본 720p
3. 사용자, 기능, 모델 ID별로 지출 추적
4. 레퍼런스 비디오 예산(입력+출력 과금)을 T2V/I2V와 분리
5. 트래픽 확장 전 사용자별 일일 한도 설정
신뢰성 패턴
- 멱등성 키로 리트라이. 요청 페이로드를 해시하고 재제출 전에 기존 태스크 확인.
- 타임아웃 처리. 태스크가 5분 후에도 완료되지 않으면 맹목적으로 재제출하지 말고 수동 검토 대상으로 표시.
- 폴백 전략. Wan 2.7이 특정 모드에서 지속적인 오류를 반환하면 Wan 2.6 또는 Wan 2.5로의 폴백 고려.
- 에셋 검증. 제출 전에 이미지 크기, 비디오 길이, 오디오 형식 검증. 불량 에셋은 모델 품질 문제처럼 보이는 실패를 유발.
큐 아키텍처
일일 100개 이상의 비디오를 생성하는 프로덕션 시스템:
사용자 요청 → 검증 → 작업 큐 → Wan 2.7 API → 결과 핸들러 → CDN 아카이브 → 사용자 알림
사용자 대면 요청 핸들러에서 API를 직접 호출하지 마세요. 항상 백그라운드 작업 시스템을 거치세요.
11. Wan 2.6에서 Wan 2.7로 마이그레이션
동일한 것
- API 엔드포인트:
POST /v1/videos/generations - 인증: 동일한 API 키와 Bearer 토큰
- 비동기 패턴: 동일한 태스크 ID / 폴링 / 콜백 흐름
- EvoLink 과금: 동일한 계정과 크레딧 시스템
변경되는 것
wan2.7-t2v-2026-04-25).| 항목 | Wan 2.6 | Wan 2.7 |
|---|---|---|
| 모델 ID | wan2.6-text-to-video, wan2.6-image-to-video, wan2.6-reference-video | wan2.7-text-to-video, wan2.7-image-to-video, wan2.7-reference-video, wan2.7-video-edit |
| I2V 프레임 제어 | 첫 프레임만 (image_start) | 첫 그리고 마지막 프레임 (image_start + image_end) |
| I2V 생성 모드 | 암시적 | 명시적 generation_mode 파라미터 (first_frame, first_last_frame, video_continuation) |
| 레퍼런스 비디오 | 단일 레퍼런스, 음성 없음 | 최대 5개 레퍼런스, voice_bindings를 통한 음성 복제 |
| 비디오 편집 | 사용 불가 | 신규: wan2.7-video-edit |
| 멀티 샷 T2V | 지원 | 지원 (동일한 프롬프트 구문) |
단계별 마이그레이션
- model 파라미터 변경.
wan2.6-text-to-video를wan2.7-text-to-video로 교체 (다른 모드도 동일). - 기존 프롬프트로 테스트. Wan 2.7은 동일한 프롬프트 형식을 처리. 다시 작성 불필요.
- 새 기능을 점진적으로 채택. 워크플로 요구에 따라
generation_mode,image_end,voice_bindings또는 비디오 편집 추가. - Wan 2.6을 폴백으로 유지. 두 버전 모두 EvoLink에서 병렬 실행. 한꺼번에 모두 마이그레이션할 필요 없음.
12. 파라미터 레퍼런스 치트시트
공유 파라미터 (모든 모드)
| 파라미터 | 타입 | 설명 |
|---|---|---|
model | string | 필수. 4개 모델 ID 중 하나 |
prompt | string | 필수. 최대 5000자 |
quality | string | 720p (기본값) 또는 1080p |
callback_url | string | 태스크 완료용 HTTPS webhook |
텍스트-투-비디오 전용
| 파라미터 | 타입 | 설명 |
|---|---|---|
negative_prompt | string | 최대 500자 |
audio_urls | array | 드라이빙 오디오 1개 (wav/mp3, 2-30초, 최대 15MB) |
aspect_ratio | string | 16:9, 9:16, 1:1, 4:3, 3:4 |
duration | number | 2-15초 |
seed | integer | 1-2147483647 |
prompt_extend | boolean | LLM 프롬프트 리라이팅 (기본값 false) |
이미지-투-비디오 전용
| 파라미터 | 타입 | 설명 |
|---|---|---|
generation_mode | string | first_frame, first_last_frame, video_continuation |
image_start | string | 첫 프레임 이미지 URL |
image_end | string | 마지막 프레임 이미지 URL |
video_urls | array | 계속용 소스 비디오 |
audio_urls | array | 드라이빙 오디오 (video_continuation에서는 불가) |
duration | number | 2-15초 |
레퍼런스 비디오 전용
| 파라미터 | 타입 | 설명 |
|---|---|---|
image_urls | array | 레퍼런스 이미지 (5개 아이템 제한에 카운트) |
video_urls | array | 레퍼런스 비디오 (5개 아이템 제한에 카운트) |
image_start | string | 시작 프레임 (제한에 카운트되지 않음) |
model_params.voice_bindings | object | 레퍼런스 키에서 음성 오디오 URL로의 맵 |
audio_urls | array | 레거시 음성 바인딩 (위치 기반) |
duration | number | 2-15초 (이미지만) 또는 2-10초 (비디오 레퍼런스 포함) |
비디오 편집 전용
| 파라미터 | 타입 | 설명 |
|---|---|---|
video_urls | array | 소스 비디오 정확히 1개 |
image_urls | array | 레퍼런스 이미지 최대 4개 |
keep_original_sound | boolean | true로 원본 오디오 보존 |
duration | number | 0 = 원본 길이; 명시적: 2-10초 |
13. 자주 묻는 질문
EvoLink에서 Wan 2.7 비용은?
720p에서 $0.086/초, 1080p에서 $0.144/초. 10초 720p 클립 비용은 $0.86. 구독이나 최소 약정 없음.
Wan 2.7과 Wan 2.6의 차이점은?
EvoLink에서 Wan 2.7은 비디오 편집, 음성 복제 멀티 캐릭터 레퍼런스 비디오, I2V 모드에서의 첫/마지막 프레임 제어를 제공합니다. Wan 2.6은 시네마틱 스토리텔링과 빠른 이터레이션을 위한 Flash 변형에 여전히 유용합니다. 둘 다 EvoLink에서 병렬 실행됩니다.
Wan 2.7은 자동으로 오디오를 생성하나요?
audio_urls를 제공하지 않으면 모델이 시각적 콘텐츠에 맞는 배경 음악이나 효과음을 자동 생성합니다.실패한 태스크는 과금되나요?
레퍼런스 비디오 및 비디오 편집 모드에서 실패한 태스크는 명시적으로 과금되지 않습니다. 텍스트-투-비디오와 이미지-투-비디오에서는 실제 생성된 비디오 길이 기준으로 과금됩니다.
Wan 2.7을 NSFW 콘텐츠에 사용할 수 있나요?
invalid_content 오류를 받게 됩니다.음성 복제에 지원되는 오디오 형식은?
wav와 mp3. 음성 복제에는 1-10초, 드라이빙 오디오에는 2-30초가 권장됩니다. 최대 파일 크기는 15MB.비디오 URL 만료에 어떻게 대처하나요?
비디오 URL은 24시간 후 만료됩니다. 태스크 완료 즉시 파이프라인에 자동 다운로드 및 아카이브 단계를 구축하세요. 최종 에셋을 자체 CDN이나 오브젝트 스토리지에 저장하세요.
Wan 2.6에서 다운타임 없이 마이그레이션 가능한가요?
model 파라미터를 wan2.6-*에서 wan2.7-*로 변경하세요. 엔드포인트, 인증, 비동기 패턴은 동일합니다. 두 버전이 병렬 실행되므로 경로별로 마이그레이션 가능합니다.다음 단계
- 플레이그라운드 사용: Wan 2.7 모델 페이지
- Wan 모델 비교: Wan API 패밀리 컬렉션
- 전체 가격 분석: Wan API 가격 가이드
- Wan 2.6 프로덕션 패턴: Wan 2.6 API 가이드
- Wan 2.5 리뷰: Wan 2.5 API 리뷰


