OmniHuman 1.5 API
Verwandle jedes Gesicht und jede Stimme in Minuten in einen filmreifen Talking-Avatar – bereit für TikTok, Reels, Shorts und In-App-Erlebnisse.
Upload audio for lip-sync (max 35 seconds, MP3/WAV)
Upload a portrait image containing a human face
Upload audio file (MP3/WAV)
Click to upload or drag and drop
Supported formats: MP3, WAV
Maximum file size: 50MB; Duration: max 35s
Upload reference images
Click to upload or drag and drop
Supported formats: JPG, JPEG, PNG, WEBP
Maximum file size: 10MB; Maximum files: 10
Verlauf
Max. 20 Einträge0 läuft · 0 abgeschlossen
OmniHuman 1.5 API für realistische digitale Menschen
Erzeuge expressive, echte Lippensynchron-Avatar-Videos aus einem einzigen Foto und einer Audiospur – direkt einsetzbar für Social Content oder SaaS-Produkte.

Pricing
| Model | Mode | Price |
|---|---|---|
| OmniHuman 1.5 | Video Generation | $0.1667/ second(12 Credits) |
If it's down, we automatically use the next cheapest available—ensuring 99.9% uptime at the best possible price.
Was ist die OmniHuman 1.5 API
Filmreifer Talking-Avatar aus einem Foto
Mit der OmniHuman 1.5 API laden Sie ein einziges Porträt und eine Audiospur hoch und erhalten automatisch ein filmreifes Talking-Avatar-Video mit natürlichen Mimik, Gestik und Kamerabewegung – passend zu Skript und Markenton. Das ersetzt Schauspieler, Studio und wiederholte Drehs, sodass Sie konsistente Digital-Human-Inhalte für Social Media, Landingpages und In-Product-Education erstellen, ohne Ihre visuelle Identität zu gefährden.

Emotional ausdrucksstarke digitale Menschen für Social Feeds
OmniHuman 1.5 API fokussiert auf Performance, nicht nur auf Lippenbewegung. So fühlt sich jedes Video wie eine echte Person an, die auf Botschaft und Stimmung reagiert. Körperhaltung, Mimik und Timing werden mit Rhythmus und Bedeutung der Sprache abgestimmt – für stärkere TikTok-Hooks, spannendere YouTube-Intros und binge‑würdigere Instagram Reels, ohne dass Sie täglich selbst vor die Kamera müssen.

Entwicklerfreundliche API für Apps und SaaS
Die OmniHuman 1.5 API ist für Entwickler:innen gedacht, die hochwertige digitale Menschen in Produkte integrieren wollen, ohne ein Videomodell von Grund auf zu bauen. Senden Sie Bilder und Audio per einfachem API-Call, erhalten Sie Videodateien oder Links und betten Sie sie in Onboarding-Flows, Tutorial-Hubs, Lernplattformen oder Creator-Tools ein – und verwandeln Sie statische Interfaces in lebendige, sprechende Erlebnisse.

Warum OmniHuman 1.5 API wählen
Wählen Sie die OmniHuman 1.5 API, wenn Sie Wert auf Sprech-Performance, Emotion und On-Camera-Vertrauen legen.
Für menschenähnliche Talking-Inhalte gebaut
Wan2.2-Animate ist stark für breite Charakteranimation und bewegungsreiche Szenen, aber der Großteil von Social- und Produktcontent beginnt mit einer Person, die in die Kamera spricht. OmniHuman 1.5 API ist genau darauf optimiert – mit besserer Lippensynchronität, glaubwürdigem Blickkontakt und Emotionen, die zum Skript passen. Das ist entscheidend für Sales-Videos, Tutorials und Brand-Announcements.
Schneller vom Skript zum Post
Bei Wan2.2-Animate müssen Sie oft über Referenzvideos, Template-Motion und kreative Kamerafahrten nachdenken – perfekt für komplexe Szenen, aber schwer für täglichen Content. OmniHuman 1.5 API hält die Pipeline schlank: Skript schreiben, Audio aufnehmen, ein Foto und eine Datei senden, dann den Talking-Avatar-Clip posten – ideal für TikTok, Reels und Shorts.
Mehr Vertrauen für Marke und Education
Wenn das Ziel Vertrauen ist – Features erklären, Nutzer onboarden oder eine wiederkehrende Show hosten – performt ein stabiler digitaler Host meist besser als ständig wechselnde Charaktere. OmniHuman 1.5 API hilft, einen Avatar zu etablieren, den das Publikum wiedererkennt, und macht ihn zum langfristigen Marken-Asset.
So funktioniert die OmniHuman 1.5 API in Ihrem Workflow
Von der Idee zum postfertigen Digital-Human-Video in wenigen Schritten.
Avatar und Skript vorbereiten
Wählen Sie ein klares Porträt für Ihren digitalen Menschen und nehmen Sie eine saubere Audiospur oder Voice-over auf, die Ihre Botschaft transportiert.
Anfrage an die OmniHuman 1.5 API senden
Senden Sie Bild und Audio aus Ihrer App, Automation oder Ihrem Content-Tool per einfachem API-Call mit Ihren gewünschten Einstellungen.
Video erhalten, prüfen und veröffentlichen
Laden Sie das generierte Talking-Avatar-Video herunter, prüfen Sie die Performance und veröffentlichen oder planen Sie es direkt für TikTok, Reels, Shorts oder Ihr Produkt.
OmniHuman 1.5 API Features
Fokussiert auf realistische Talking-Avatare, die sich einfach skalieren lassen.
Ein Foto, Studio-Host
Verwandeln Sie ein Porträt in einen wiederverwendbaren digitalen Host, der Skripte immer wieder liefert – konsistent ohne wiederholte Foto- oder Videodrehs.
Echte Lippensynchronität und Emotion
Mundformen, Mimik und Timing folgen dem Audio eng – so wirkt es, als spräche eine echte Person direkt zum Publikum.
API-first für Apps und SaaS
OmniHuman 1.5 API aus Produkt, Automation oder internen Tools aufrufen und Talking-Avatar-Clips on-demand für Onboarding, Updates und Support erzeugen.
Optimiert für Social Video
Erstellen Sie kurze vertikale Videos für TikTok, Reels und Shorts, damit Ihr digitaler Host natürlich in Feeds wirkt und die Watchtime hoch bleibt.
Konsistente Markenpräsenz
Nutzen Sie denselben Avatar für Ads, Tutorials und Hilfecenter, um eine wiedererkennbare Markenfigur aufzubauen.
Skaliert mit Ihrem Content-Kalender
Sobald Avatar und Audio-Workflow stehen, können Sie Dutzende Talking-Videos batchen und Ihr Team auf Hooks, Offers und Distribution fokussieren.
OmniHuman 1.5 API FAQs
Everything you need to know about the product and billing.
API Reference
Select endpoint
Authentication
All APIs require Bearer Token authentication.
Authorization:
Bearer YOUR_API_KEY/v1/videos/generationsCreate Digital Human Video
OmniHuman 1.5 (omnihuman-1.5) generates realistic digital human videos with audio-driven lip-sync.
Asynchronous processing mode, use the returned task ID to .
Generated video links are valid for 24 hours, please save them promptly.
Important Notes
- Maximum audio duration is 35 seconds.
- Billing is based on audio duration (rounded up to the nearest second).
- Tasks cannot be cancelled once started.
- Supported audio formats: MP3, WAV.
Request Parameters
modelstringRequiredDefault: omnihuman-1.5Model name for digital human video generation.
omnihuman-1.5audio_urlstringRequiredAudio URL for driving lip-sync and body movements.
Notes
- Maximum duration: 35 seconds
- Supported formats: MP3, WAV
- URL must be directly accessible by the server
https://example.com/audio.mp3image_urlsstring[]RequiredReference image URL array containing the person to animate. OmniHuman uses only the first image.
Notes
- Should contain a clear human figure
- Max size: 10MB
- Formats: .jpg, .jpeg, .png, .webp
- URL must be directly accessible by the server
https://example.com/person.jpgmask_urlstringOptionalMask image URL for specifying animation regions. White areas indicate regions to animate.
Notes
- Optional - use with auto_mask=false for custom control
- Same dimensions as input image recommended
https://example.com/mask.pngsubject_checkbooleanOptionalDefault: falseEnable subject detection to verify human presence in the image.
| Value | Description |
|---|---|
| true | Verify human subject exists |
| false | Skip subject verification |
trueauto_maskbooleanOptionalDefault: falseEnable automatic mask generation for the human subject.
| Value | Description |
|---|---|
| true | Auto-generate mask for animation |
| false | Use provided mask_url or full image |
truepe_fast_modebooleanOptionalDefault: falseEnable fast processing mode for quicker generation.
| Value | Description |
|---|---|
| true | Faster generation (may reduce quality) |
| false | Standard quality generation |
falseseedintegerOptionalDefault: -1Random seed for reproducible generation. Use -1 for random seed.
Notes
- Range: -1 to 2147483647
- Same seed produces consistent results
-1promptstringOptionalOptional text prompt to guide the generation style.
A person speaking naturally with subtle expressionscallback_urlstringOptionalHTTPS callback address after task completion.
Notes
- Triggered on completion or failure
- HTTPS only, no internal IPs
- Max length: 2048 chars
- Timeout: 10s, Max 3 retries
https://your-domain.com/webhooks/video-task-completed