Kling O3 API

Name: EvoLink AI Model API Platform
Brand: EvoLink
Availability: InStock

Kling O3 (kling-v3-omni) est la famille de modèles vidéo la plus récente de Kling pour le texte-vers-vidéo, l'image-vers-vidéo, la référence-vers-vidéo et l'édition vidéo. Avec EvoLink, les équipes peuvent tester les modes en ligne, router les requêtes via une API unifiée et déployer des workflows vidéo de 3 à 15 secondes avec une facturation prévisible à la seconde.

Type de modèle:

✓Kling O3 Text to Video Kling O3 Image to Video Kling O3 Reference to Video Kling O3 Video Edit Custom Element

Prix: $0.080 - 0.398(~ 5.4 - 27 credits) per second of video

Accès géré stable pour les charges de production. Recommandé lorsque vous avez besoin d'une facturation dans le tableau de bord, d'un contrôle des clés API et d'un comportement d'intégration prévisible.

Le même endpoint API est utilisé pour toutes les versions. Seul le paramètre model change.

Prompt*

105 (suggéré : 2,000)

Aspect Ratio

Duration5s

3s15s

Quality

Sound

0:00 / 0:00

Audio

Historique

Max 20 éléments

0 en cours · 0 terminé

Votre historique de génération apparaîtra ici

Billing Rules

•Price shown is per second
•Duration range: 3-15 seconds
•Total = price/second × duration

Pricing

Model	Mode	Quality	Sound	Price
Kling O3 Text to Video	Video Generation	720p	Off	$0.080/ second(5.4 Credits)
Kling O3 Text to Video	Video Generation	720p	On	$0.106/ second(7.2036 Credits)
Kling O3 Text to Video	Video Generation	1080p	Off	$0.106/ second(7.2036 Credits)
Kling O3 Text to Video	Video Generation	1080p	On	$0.133/ second(9.0018 Credits)
Kling O3 Text to Video	Video Generation	4K	Off	$0.398/ second(27 Credits)
Kling O3 Text to Video	Video Generation	4K	On	$0.398/ second(27 Credits)

Kling O3 Text to Video

Video Generation

Quality:720p

Sound:Off

Price:

$0.080/ second

(5.4 Credits)

Kling O3 Text to Video

Video Generation

Quality:720p

Sound:On

Price:

$0.106/ second

(7.2036 Credits)

Kling O3 Text to Video

Video Generation

Quality:1080p

Sound:Off

Price:

$0.106/ second

(7.2036 Credits)

Kling O3 Text to Video

Video Generation

Quality:1080p

Sound:On

Price:

$0.133/ second

(9.0018 Credits)

Kling O3 Text to Video

Video Generation

Quality:4K

Sound:Off

Price:

$0.398/ second

(27 Credits)

Kling O3 Text to Video

Video Generation

Quality:4K

Sound:On

Price:

$0.398/ second

(27 Credits)

If an upstream route is unavailable, EvoLink can use the next available option where fallback coverage exists, helping teams keep costs and operations predictable.

Kling O3 (3.0 Omni) API Tarifs, Playground et Intégration

Accédez à Kling O3 (3.0 Omni) via le gateway API unifié EvoLink. Exécutez texte-vers-vidéo, image-vers-vidéo, référence-vers-vidéo et édition vidéo avec les dernières améliorations Omni pour entrée/sortie vidéo jusqu à 15 secondes et entrée/sortie 4K en édition vidéo.

Kling O3 commence à $0.075 par seconde sur EvoLink, contre $0.084 sur l'API officielle Kling. Accédez aux quatre modes vidéo -- texte-vers-vidéo, image-vers-vidéo, référence-vers-vidéo et édition vidéo -- avec des crédits gratuits pour démarrer.

Hero showcase des capacités vidéo de Kling O3

Présentation de Kling O3 et nouveautés par rapport à Kling 3.0

Kling O3 (Kling 3.0 Omni) est le modèle vidéo orienté contrôle de la famille Kling AI. Il étend Kling 3.0 avec reference-to-video et édition vidéo; la dernière mise à jour Omni améliore ces deux workflows.

Choisissez O3 lorsque le workflow demande plus qu une génération par prompt : vidéo de référence, édition de séquences existantes, entrée/sortie vidéo jusqu à 15 secondes ou entrée et sortie 4K en édition vidéo.

Modes vidéo de l'API Kling O3

API Kling O3 texte-vers-vidéo

Générez des vidéos directement à partir de prompts texte avec Kling O3. Décrivez des scènes, actions et styles en langage naturel et laissez le modèle produire des clips de 3 à 15 secondes prêts pour le marketing, les réseaux sociaux ou des projets créatifs.

API Kling O3 image-vers-vidéo et référence-vers-vidéo

Utilisez des images ou des vidéos de référence pour guider la génération. Kling O3 supporte les modes image-vers-vidéo et référence-vers-vidéo, donnant aux équipes un contrôle précis sur le style visuel, la cohérence des personnages et la composition des scènes.

API Kling O3 d'édition vidéo

Éditez et transformez des séquences existantes avec le mode édition vidéo de Kling O3. Appliquez des transferts de style, ajustez des scènes et affinez le contenu sans repartir de zéro — idéal pour itérer sur du contenu commercial à l'échelle.

Pourquoi les équipes utilisent Kling O3 via EvoLink

Kling O3 réunit quatre modes vidéo prêts pour la production dans une seule famille de modèles, tandis qu'EvoLink apporte un accès unifié, une facturation prévisible et une intégration plus rapide.

Quatre modes spécialisés

Les modes texte, image, référence et édition couvrent l'ensemble du workflow de création vidéo.

Dernière architecture V3 Omni

Construit sur la toute nouvelle génération de Kling pour une qualité et cohérence améliorées.

Sorties flexibles de 3 à 15s

Générez des vidéos de 3 à 15 secondes avec facturation par seconde.

Comment intégrer l'API Kling O3

Testez un mode en ligne, envoyez une requête asynchrone, puis faites passer les sorties validées en production.

Choisissez votre mode

Sélectionnez texte-vers-vidéo, image-vers-vidéo, référence-vers-vidéo ou édition vidéo selon votre workflow.

Envoyez votre requête

Fournissez votre prompt, image ou vidéo de référence avec les paramètres de durée et qualité.

Récupérez votre vidéo

Kling O3 génère votre vidéo de 3 à 15 secondes, prête à être intégrée dans votre application.

Voir la documentation API

Capacités clés de Kling O3

Quatre modes vidéo prêts pour la production via une API unifiée

Modes

Quatre modes de génération

Kling O3 supporte texte-vers-vidéo, image-vers-vidéo, référence-vers-vidéo et édition vidéo dans un seul modèle. Chaque mode est optimisé pour des workflows de production spécifiques.

Durée

Sorties de 3 à 15 secondes

Générez des vidéos de 3 à 15 secondes avec facturation par seconde. Idéal pour les clips réseaux sociaux, publicités et contenu court format.

Architecture V3 Omni

Construit sur la dernière fondation V3 Omni de Kling, offrant une qualité visuelle améliorée, une meilleure cohérence de mouvement et un suivi de prompt plus précis.

FAQ Kling O3 API

Everything you need to know about the product and billing.

L API Kling O3 donne accès à Kling 3.0 Omni via EvoLink. Elle prend en charge texte-vers-vidéo, image-vers-vidéo, reference-to-video et édition vidéo. La dernière amélioration Omni renforce les workflows de référence et d édition, prend en charge jusqu à 15 secondes d entrée/sortie vidéo et fait passer l édition vidéo en entrée et sortie 4K.

Kling O3 offre quatre modes : texte-vers-vidéo pour générer à partir de prompts, image-vers-vidéo pour animer des images, référence-vers-vidéo pour une génération guidée par style utilisant des vidéos de référence, et édition vidéo pour transformer des séquences existantes. Chaque mode est optimisé pour différents workflows de production.

Kling O3 génère des vidéos entre 3 et 15 secondes. La facturation est par seconde dans cette plage. Les vidéos de moins de 3 secondes sont facturées au minimum de 3 secondes. Cette plage convient aux clips réseaux sociaux, publicités et contenu court format.

La tarification de Kling O3 part de tarifs de base par seconde, puis applique des facteurs selon le mode. Le texte-vers-vidéo et l'image-vers-vidéo utilisent une base de 5,4 crédits/seconde : 720p sans son = 1,0x, 720p avec son = 1,334x, 1080p sans son = 1,334x, 1080p avec son = 1,667x, 4K = 5,0x (en 4K, le supplément son ne s'applique pas). La référence-vers-vidéo et l'édition vidéo utilisent une base de 8,1 crédits/seconde ; le 1080p est facturé à 1,334x par rapport au 720p et le son reste désactivé (la 4K n'est pas disponible dans ces modes). Consultez votre dashboard EvoLink pour la tarification propre à votre groupe.

Kling O3 est construit sur la nouvelle architecture V3 Omni et ajoute texte-vers-vidéo comme nouveau mode. Il introduit également référence-vers-vidéo pour une génération guidée par style. La plage de durée vidéo est de 3 à 15 secondes comparée aux plages variables d'O1. O3 représente la dernière génération avec une qualité et cohérence améliorées.

Commencez par un sujet clair et décrivez l'action, l'ambiance et le décor en termes simples. Pour image-vers-vidéo, fournissez des images de référence de haute qualité. Pour référence-vers-vidéo, utilisez des vidéos qui correspondent au style souhaité. La cohérence s'améliore lorsque la structure de votre prompt reste stable entre les exécutions.

Les limites, tarification et modes disponibles sont déterminés par votre fournisseur et région. Utilisez votre dashboard EvoLink et les réponses API comme source de vérité. Consultez la documentation API pour les contraintes et paramètres les plus récents.

Tous les modèles Kling AI

EvoLink fournit un accès API unifié à toute la famille de modèles Kling : Tous les modèles partagent la même clé API. Changez de modèle avec un seul paramètre.

Explorer la famille Kling Voir Kling 3.0 Voir Kling O1 Voir Motion Control

API Reference

Select endpoint

Endpoints

Authentication

All APIs require Bearer Token authentication.

Header

Authorization: 
Bearer YOUR_API_KEY

Get API Key

POST

/v1/videos/generations

Create Video

Kling O3 Text to Video (kling-o3-text-to-video) generates videos from text prompts using the V3 Omni model. Supports single-shot and multi-shot modes with optional sound effects.

Asynchronous processing mode, use the returned task ID to query status.

Generated video links are valid for 24 hours, please save them promptly.

Important Notes

Text-to-video mode: no image input required.
Video duration: 3-15 seconds, billed per second.
Pricing varies by quality and sound: 720p+off = 1.0x, 720p+on = 1.334x, 1080p+off = 1.334x, 1080p+on = 1.667x, 4k = 5.0x (sound surcharge does not apply at 4K).

Request Parameters

modelstringRequiredDefault: kling-o3-text-to-video

Video generation model name.

Examplekling-o3-text-to-video

promptstringRequired

Text prompt describing what kind of video to generate. When multi_shot=true and shot_type=customize, this can be empty (use multi_prompt instead).

Notes

Max 2500 characters
Reference elements using <<<element_1>>> syntax in the prompt

ExampleA golden retriever running through a sunlit meadow, cinematic slow motion.

durationintegerOptionalDefault: 5

Specifies the generated video duration in seconds.

Notes

Range: 3-15 seconds (integer)
Base price: 5.4 credits per second
Minimum billing: 3 seconds

Example5

aspect_ratiostringOptional

Video aspect ratio.

Value	Description
16:9	Landscape video
9:16	Portrait video
1:1	Square video

Example16:9

qualitystringOptionalDefault: 720p

Video resolution quality. Affects billing multiplier.

Value	Description
720p	Standard 720P (1.0x base)
1080p	High quality 1080P (1.334x base)
4k	Ultra HD 4K (5.0x base, sound surcharge does not apply)

Example720p

soundstringOptionalDefault: off

Sound effect control. Affects billing multiplier (no effect when quality=4k).

Value	Description
off	No sound effects (1.0x)
on	Generate sound effects (1.334x)

Notes

Combined multiplier: 720p+off=1.0x, 720p+on=1.334x, 1080p+off=1.334x, 1080p+on=1.667x, 4k=5.0x (sound has no effect)

Exampleoff

callback_urlstringOptional

HTTPS callback address after task completion.

Notes

Triggered on completion, failure, or cancellation
HTTPS only, no internal IPs
Max length: 2048 chars
Timeout: 10s, Max 3 retries

Examplehttps://your-domain.com/webhooks/video-task-completed

model_params.multi_shotbooleanOptionalDefault: false

Enable multi-shot mode for generating videos with multiple camera angles or scenes.

Notes

When enabled, prompt parameter will be ignored — use multi_prompt instead
Sum of all shot duration values must equal total video duration

Exampletrue

model_params.shot_typestringOptional

Shot type for multi-shot mode. Required when multi_shot is true.

Value	Description
customize	Custom per-shot prompts and durations

Notes

Only effective when multi_shot=true

Examplecustomize

model_params.multi_promptarrayOptional

Per-shot prompt array. Required when multi_shot=true and shot_type=customize. Each item defines a shot segment.

Notes

Format: [{index: number, prompt: string, duration: string}, ...]
Max 6 shots, each shot prompt max 512 characters
Sum of all shot durations must equal total video duration
When used, top-level prompt can be empty

Example

[{"index": 1, "prompt": "A person on a hilltop", "duration": "5"}, {"index": 2, "prompt": "Camera pulls back", "duration": "5"}]

model_params.element_listarrayOptional

Subject element list for consistent character appearance. Elements are created via kling-custom-element model.

Notes

Format: [{element_id: string}, ...]
Max 7 elements per request
element_id is obtained from kling-custom-element creation result
Ensures consistent character appearance across generated videos

Example[{"element_id": "123456"}]

model_params.watermark_infoobjectOptional

Watermark configuration for the generated video.

Notes

Format: {enabled: boolean}

Example{"enabled": false}

Request Example

{
  "model": "kling-o3-text-to-video",
  "prompt": "A golden retriever running through a sunlit meadow, cinematic slow motion.",
  "duration": 5,
  "aspect_ratio": "16:9",
  "quality": "720p",
  "sound": "off"
}

Multi-Shot Example

{
  "model": "kling-o3-text-to-video",
  "duration": 10,
  "aspect_ratio": "16:9",
  "quality": "1080p",
  "sound": "on",
  "model_params": {
    "multi_shot": true,
    "shot_type": "customize",
    "multi_prompt": [
      {"index": 1, "prompt": "A person standing on a hilltop watching sunrise", "duration": "5"},
      {"index": 2, "prompt": "Camera pulls back to reveal a vast mountain panorama", "duration": "5"}
    ]
  }
}

Response Example

{
  "created": 1757169743,
  "id": "task-unified-1757169743-o3t2v",
  "model": "kling-o3-text-to-video",
  "object": "video.generation.task",
  "progress": 0,
  "status": "pending",
  "task_info": {
    "can_cancel": true,
    "estimated_time": 180,
    "video_duration": 5
  },
  "type": "video",
  "usage": {
    "billing_rule": "per_second",
    "credits_reserved": 27.0,
    "user_group": "default"
  }
}