Kling O1 API
Kling O1 video generation model with image-to-video, video editing, and fast video editing variants. Supports 3-20 second videos with reference images for style-guided generation.
Prompt
A cinematic transformation video. Start with the model standing in a clean white photography studio, wearing a simple nude-tone fitting outfit. The camera is steady, 9:16 vertical, natural soft light. The model makes very subtle natural movements such as blinking or shifting her weight. Then, the environment begins to slowly transform. Soft pastel mist fades in behind her. Large pink flowers begin to appear and grow around her in a magical, elegant way. The grass and dreamy atmosphere gradually form. The lighting becomes more cinematic and soft. Next, her outfit transforms from the simple fitting outfit into the final fantasy couture outfit shown in the reference: layered pink tulle dress, fluffy textured jacket, mint-green thigh-high stockings, and heels. The transformation must be smooth, elegant, and high-end. As the scene completes, the final environment fully resembles the dreamy floral fantasy world from the reference image. Extremely large pink flowers, lush green textures, soft cloudy sky. The model stands confidently in the completed scene and makes light natural movements, such as a gentle head turn or slight breathing motion. Ultra high-end, fashion commercial style. Final 2 seconds: the completed big scene, subtle motion in flowers like a gentle breeze, and the model holding a graceful pose.
Input Video
Upload a video for editing (max 100MB). Supports MP4, WebM, MOV, AVI formats.
Reference Images (Optional)
Upload up to 4 reference images for style guidance.
Parameters
Sample Result
Upload a video for editing (max 100MB)
Click to upload or drag and drop
Supported formats: MP4, MOV
Maximum file size: 100MB; Maximum files: 1
Upload reference images
Click to upload or drag and drop
Supported formats: JPG, JPEG, PNG, WEBP
Maximum file size: 10MB; Maximum files: 4
Historique
Max 20 éléments0 en cours · 0 terminé
Billing Rules
- •Minimum billing: 3 seconds (videos < 3s are charged for 3s)
- •Maximum billing: 10 seconds (videos > 10s are charged for 10s)
Pricing
| Model | Mode | Billing Range | Price |
|---|---|---|---|
| Kling O1 Video Edit | Video Editing | 3s (min) - 10s (max) | Popular $0.1667/ second(12 Credits) |
If it's down, we automatically use the next cheapest available—ensuring 99.9% uptime at the best possible price.
Kling O1 API pour une génération et édition vidéo unifiées
Construisez des workflows vidéo modernes avec Kling O1. Une seule API pour créer des clips à partir de prompts, affiner des séquences existantes et garder personnages et scènes cohérents pour marketing, social et commerce.

Que pouvez-vous construire avec l'API Kling O1 ?
Storytelling prompt‑to‑video
Transformez de courts briefs créatifs en vidéos avec Kling O1 et conservez le même look sur plusieurs outputs. Utile pour des campagnes sociales, séries de marque ou contenus épisodiques où la cohérence compte plus que les expériences one‑off.

Édits guidés par référence
Utilisez Kling O1 pour affiner ou retravailler des séquences existantes via des edits guidés par instruction. Gardez le sujet principal intact tout en ajustant style, lumière ou détails de scène afin d'itérer rapidement sans re‑shoot complet.

Contenu commercial à l'échelle
Kling O1 est positionné pour les équipes production en publicité, e‑commerce et social media. Utilisez‑le pour générer des variations, garder un ton de marque cohérent et livrer du contenu au rythme des canaux modernes.

Pourquoi les équipes choisissent Kling O1
Kling O1 met l'accent sur la création et l'édition unifiées avec une cohérence des personnages et des scènes, réduisant les reprises et rendant les pipelines créatifs plus prévisibles.
Workflow multimodal unifié
Texte, image, vidéo et sujets dans un seul modèle.
Sorties axées cohérence
Conserver des personnages et scènes reconnaissables entre clips.
Focus production‑friendly
Conçu pour le film, social, ads et commerce.
Comment intégrer l'API Kling O1
Un flux simple de l'input à la vidéo prête pour la production.
Choisir les inputs et le mode
Sélectionnez texte, image, vidéo ou sujet selon votre workflow et le type d'output souhaité.
Soumettre une tâche de génération
Envoyez la requête avec instructions et références, puis suivez la tâche jusqu'à disponibilité des résultats.
Revoir et itérer
Téléchargez les résultats, comparez les variations et réutilisez la même structure pour itérer vite.
Capacités clés de l'API Kling O1
Création et édition vidéo unifiées dans un seul modèle
Moteur multimodal unifié
Kling O1 est présenté comme un modèle multimodal unifié qui combine génération et édition dans un seul système. Cela permet aux équipes de conserver une seule intégration tout en gérant création de clips et edits dans un même workflow.
Inputs texte, image, vidéo et sujet
Les descriptions publiques indiquent que Kling O1 supporte texte, image, vidéo et sujet. Cela donne plus de leviers de contrôle aux créateurs et réduit l'incertitude lorsque des résultats cohérents sont requis.
Cohérence des personnages et des scènes
Kling O1 est positionné pour répondre au défi de cohérence en génération vidéo IA. Cela aide à garder identité de personnage, accessoires et détails de scène alignés sur plusieurs clips.
Workflows génération + édition
Plutôt que de changer d'outil, Kling O1 réunit génération et édition dans un seul moteur. Utile pour les équipes marketing qui doivent créer puis affiner sans casser la continuité.
Use cases contenu commercial
Le modèle est décrit comme adapté aux workflows de film, télévision, social media, publicité et e‑commerce. Un choix pratique pour des équipes qui produisent du contenu à l'échelle.
Langage visuel multimodal
Kling O1 s'appuie sur un framework de langage visuel multimodal. Cela l'aide à interpréter l'intention à travers texte et références visuelles pour aligner les outputs avec la direction créative.
Questions fréquentes
Everything you need to know about the product and billing.
API Reference
Select endpoint
Authentication
All APIs require Bearer Token authentication.
Authorization:
Bearer YOUR_API_KEY/v1/videos/generationsEdit Video
Kling O1 Video Edit (kling-o1-video-edit) model transforms and edits videos with AI-powered style transfer.
Asynchronous processing mode, use the returned task ID to query status.
Generated video links are valid for 24 hours, please save them promptly.
Important Notes
- Exactly 1 input video is required for video editing.
- Maximum file size: 100MB per video.
- Supported formats: MP4, WebM, MOV, AVI.
- Optional: Up to 4 reference images for style guidance.
Request Parameters
modelstringRequiredDefault: kling-o1-video-editVideo editing model name.
kling-o1-video-editpromptstringRequiredPrompt describing how to edit and transform the video.
Notes
- Limited to 2000 tokens
Transform the video with cinematic color grading and smooth transitions.video_urlsarrayRequiredInput video URL list for video editing.
Notes
- Required: exactly 1 video
- Maximum: 1 video per request
- Max size: 100MB per video
- Formats: .mp4, .mov
- URLs must be directly accessible by the server
["https://example.com/input-video.mp4"]image_urlsarrayOptionalReference image URL list for style guidance.
Notes
- Optional
- Maximum: 4 images per request
- Max size: 10MB per image
- Formats: .jpg, .jpeg, .png, .webp
- Use reference images to guide the AI in understanding your desired style
["https://example.com/reference1.jpg", "https://example.com/reference2.jpg"]keep_original_soundbooleanOptionalDefault: trueWhether to keep the original audio from the input video.
| Value | Description |
|---|---|
| true | Preserve original audio track |
| false | Generate new audio or mute |
trueaspect_ratiostringOptionalDefault: 16:9Output video aspect ratio.
| Value | Description |
|---|---|
| 16:9 | Landscape video |
| 9:16 | Portrait video |
| 1:1 | Square video |
'16:9'callback_urlstringOptionalHTTPS callback address after task completion.
Notes
- Triggered on completion, failure, or cancellation
- Sent after billing confirmation
- HTTPS only, no internal IPs
- Max length: 2048 chars
- Timeout: 10s, Max 3 retries
https://your-domain.com/webhooks/video-task-completed