옴니휴먼 1.5 API
모든 얼굴과 음성을 몇 분 만에 영화 수준의 말하는 아바타로 변환하여 TikTok, Reels, Shorts 및 인앱 환경에 사용할 수 있습니다.
Upload audio for lip-sync (max 35 seconds, MP3/WAV)
Upload a portrait image containing a human face
Upload audio file (MP3/WAV)
Click to upload or drag and drop
Supported formats: MP3, WAV
Maximum file size: 50MB; Duration: max 35s
Upload reference images
Click to upload or drag and drop
Supported formats: JPG, JPEG, PNG, WEBP
Maximum file size: 10MB; Maximum files: 10
기록
최대 20개 항목0 실행 중 · 0 완료됨
현실적인 디지털 휴먼을 위한 OmniHuman 1.5 API
단일 사진 및 오디오 트랙에서 표현력이 풍부하고 진정한 립싱크 아바타 비디오를 생성하고 소셜 콘텐츠 또는 SaaS 제품에 직접 연결하세요.

Pricing
| Model | Mode | Price |
|---|---|---|
| OmniHuman 1.5 | Video Generation | $0.1667/ second(12 Credits) |
If it's down, we automatically use the next cheapest available—ensuring 99.9% uptime at the best possible price.
OmniHuman 1.5 API이란 무엇입니까?
한 장의 사진으로 만든 영화급 말하는 아바타
OmniHuman 1.5 API을 사용하면 인물 사진 한 장과 오디오 트랙을 업로드한 다음 스크립트 및 브랜드 톤에 맞는 자연스러운 표정, 제스처, 카메라 동작을 사용하여 영화 수준의 말하는 아바타 비디오를 자동으로 생성할 수 있습니다. 배우, 스튜디오 또는 반복적인 재촬영이 필요하지 않으므로 소셜 미디어, 랜딩 페이지 및 제품 내 교육을 위한 일관된 디지털 휴먼 콘텐츠를 생성하는 동시에 모든 게시물과 채널에서 시각적 아이덴티티를 완전히 일치시킬 수 있습니다.

소셜 피드를 위한 감정 표현이 풍부한 디지털 휴먼
OmniHuman 1.5 API은 입술의 움직임뿐만 아니라 성능에 중점을 두므로 모든 비디오가 오디오의 메시지와 분위기에 반응하는 실제 사람처럼 느껴집니다. 이 모델은 신체 언어, 얼굴 표정, 타이밍을 연설의 리듬과 의미에 맞춰 조정하여 매일 카메라에 등장하지 않고도 TikTok 후크를 더 날카롭게 만들고, YouTube 인트로를 더 매력적으로 만들고, Instagram 릴을 더 폭식하게 만듭니다.

앱 및 SaaS를 위한 개발자 친화적인 API
OmniHuman 1.5 API은 비디오 모델을 처음부터 구축하지 않고도 고품질 AI 디지털 휴먼을 제품에 추가하려는 개발자를 위해 설계되었습니다. 간단한 API 호출을 통해 이미지와 오디오를 보내고 생성된 비디오 파일이나 링크를 수신한 다음 이를 온보딩 흐름, 튜토리얼 허브, 학습 플랫폼 또는 제작자 도구에 포함시켜 정적 인터페이스를 모든 최종 사용자에게 고급스럽고 개인화된 느낌을 주는 살아있는 말하기 경험으로 바꿀 수 있습니다.

OmniHuman 1.5 API을 선택하는 이유
말하기 성능, 감정, 카메라 신뢰에 가장 관심이 있다면 OmniHuman 1.5 API을 선택하세요.
인간 스타일의 말하는 콘텐츠를 위해 제작됨
Wan2.2-Animate는 광범위한 캐릭터 애니메이션과 모션이 많은 장면에 강력하지만 대부분의 소셜 및 제품 콘텐츠는 여전히 사람이 카메라에 말하는 것으로 시작됩니다. OmniHuman 1.5 API은 이 사용 사례에 맞게 조정되었으므로 더 강력한 립싱크, 더 믿을 수 있는 눈맞춤, 스크립트와 일치하는 감정을 얻을 수 있으며 이는 판매 비디오, 튜토리얼 및 브랜드 발표에 매우 중요합니다.
스크립트에서 포스트까지 더 빠른 경로
Wan2.2-Animate를 사용하면 참조 비디오, 템플릿 모션 및 창의적인 카메라 움직임에 대해 자주 생각해야 합니다. 이는 복잡한 장면에 적합하지만 일상 콘텐츠에는 더 무겁습니다. OmniHuman 1.5 API는 파이프라인을 단순하게 유지합니다. 스크립트를 작성하고, 오디오를 녹음하고, 사진 한 장과 파일 한 장을 보낸 다음, 완성된 말하는 아바타 클립을 게시하여 TikTok, 릴, Shorts에 일관되게 게시하는 것이 더 쉬워졌습니다.
브랜드 및 교육 사용에 대한 신뢰도 향상
기능 설명, 새로운 사용자 온보딩, 반복 쇼 주최 등 신뢰 구축이 목표인 경우, 실제 진행자처럼 느껴지는 안정적인 디지털 휴먼은 일반적으로 끊임없이 변화하는 애니메이션 캐릭터보다 더 나은 성능을 발휘합니다. OmniHuman 1.5 API은 청중이 기억하는 하나의 아바타를 고정하여 일회성 시각적 실험이 아닌 장기적인 브랜드 자산으로 전환하는 데 도움이 됩니다.
OmniHuman 1.5 API이 작업 흐름에서 작동하는 방식
몇 가지 간단한 단계를 통해 아이디어를 즉시 게시 가능한 디지털 휴먼 비디오로 만들 수 있습니다.
아바타와 스크립트를 준비하세요
디지털 휴먼을 위한 선명한 인물 이미지를 선택하고 전달하려는 메시지와 일치하는 깨끗한 오디오 트랙이나 음성 해설을 녹음하세요.
OmniHuman 1.5 API에 요청 보내기
앱, 자동화 또는 콘텐츠 도구에서 원하는 설정을 사용하여 간단한 API 호출을 통해 이미지와 오디오를 OmniHuman 1.5 API로 보냅니다.
비디오 수신, 검토 및 게시
생성된 말하는 아바타 비디오를 다운로드하고 성능을 검토한 다음 TikTok, Reels, Shorts 또는 제품으로 직접 내보내거나 예약하세요.
OmniHuman 1.5 API 기능
확장이 용이하고 사실적인 말하는 아바타에 중점을 둡니다.
단일 사진, 스튜디오 스타일 호스트
하나의 인물 사진을 스크립트를 반복해서 전달할 수 있는 재사용 가능한 디지털 휴먼으로 전환하면 사진이나 비디오를 반복적으로 촬영하지 않고도 콘텐츠가 일관성을 느낄 수 있습니다.
진정한 립싱크와 감정
오디오를 밀접하게 따라가는 입 모양, 표정 및 속도를 확보하여 시청자가 딱딱한 애니메이션 마스크가 아닌 실제 사람이 직접 말하는 것처럼 느낄 수 있습니다.
API-앱 및 SaaS의 경우 첫 번째
제품, 자동화 또는 내부 도구에서 OmniHuman 1.5 API을 호출하여 온보딩, 업데이트 및 지원 흐름에 대해 주문형 말하는 아바타 클립을 생성하세요.
소셜 비디오에 최적화됨
TikTok, 릴, Shorts에 맞춤화된 짧은 수직 동영상을 만들어 디지털 휴먼이 기본 피드에 딱 맞도록 하고 시청 시간을 높게 유지하세요.
일관된 브랜드 존재감
여러 사람이 스크립트를 작성하는 경우에도 광고, 튜토리얼 및 도움말 콘텐츠 전반에서 동일한 아바타를 사용하여 브랜드에 대한 인식 가능한 얼굴을 구축하세요.
콘텐츠 달력에 맞춰 확장
아바타와 오디오 워크플로가 설정되면 수십 개의 말하는 비디오를 일괄 생성하여 팀이 제안, 관심, 배포에 집중할 수 있습니다.
OmniHuman 1.5 API FAQ
Everything you need to know about the product and billing.
API Reference
Select endpoint
Authentication
All APIs require Bearer Token authentication.
Authorization:
Bearer YOUR_API_KEY/v1/videos/generationsCreate Digital Human Video
OmniHuman 1.5 (omnihuman-1.5) generates realistic digital human videos with audio-driven lip-sync.
Asynchronous processing mode, use the returned task ID to .
Generated video links are valid for 24 hours, please save them promptly.
Important Notes
- Maximum audio duration is 35 seconds.
- Billing is based on audio duration (rounded up to the nearest second).
- Tasks cannot be cancelled once started.
- Supported audio formats: MP3, WAV.
Request Parameters
modelstringRequiredDefault: omnihuman-1.5Model name for digital human video generation.
omnihuman-1.5audio_urlstringRequiredAudio URL for driving lip-sync and body movements.
Notes
- Maximum duration: 35 seconds
- Supported formats: MP3, WAV
- URL must be directly accessible by the server
https://example.com/audio.mp3image_urlsstring[]RequiredReference image URL array containing the person to animate. OmniHuman uses only the first image.
Notes
- Should contain a clear human figure
- Max size: 10MB
- Formats: .jpg, .jpeg, .png, .webp
- URL must be directly accessible by the server
https://example.com/person.jpgmask_urlstringOptionalMask image URL for specifying animation regions. White areas indicate regions to animate.
Notes
- Optional - use with auto_mask=false for custom control
- Same dimensions as input image recommended
https://example.com/mask.pngsubject_checkbooleanOptionalDefault: falseEnable subject detection to verify human presence in the image.
| Value | Description |
|---|---|
| true | Verify human subject exists |
| false | Skip subject verification |
trueauto_maskbooleanOptionalDefault: falseEnable automatic mask generation for the human subject.
| Value | Description |
|---|---|
| true | Auto-generate mask for animation |
| false | Use provided mask_url or full image |
truepe_fast_modebooleanOptionalDefault: falseEnable fast processing mode for quicker generation.
| Value | Description |
|---|---|
| true | Faster generation (may reduce quality) |
| false | Standard quality generation |
falseseedintegerOptionalDefault: -1Random seed for reproducible generation. Use -1 for random seed.
Notes
- Range: -1 to 2147483647
- Same seed produces consistent results
-1promptstringOptionalOptional text prompt to guide the generation style.
A person speaking naturally with subtle expressionscallback_urlstringOptionalHTTPS callback address after task completion.
Notes
- Triggered on completion or failure
- HTTPS only, no internal IPs
- Max length: 2048 chars
- Timeout: 10s, Max 3 retries
https://your-domain.com/webhooks/video-task-completed