Kling 3.0 API
Precio: $0.075 - 0.150(~ 5.4 - 10.8 credits) per second of video
Máxima estabilidad con 99.9% de disponibilidad garantizada. Recomendado para producción.
Todas las versiones usan el mismo endpoint API. Solo cambia el parámetro model.
Video starts from this image
Click to upload or drag and drop
Supported formats: JPG, JPEG, PNG
Maximum file size: 10MB; Maximum files: 1
End-frame image (optional)
Click to upload or drag and drop
Supported formats: JPG, JPEG, PNG
Maximum file size: 10MB; Maximum files: 1
Historial
Máx. 20 elementos0 ejecutando · 0 completado
Billing Rules
- •Price shown is per second
- •Duration range: 3-15 seconds
- •Total = price/second × duration
Pricing
| Model | Mode | Quality | Sound | Price |
|---|---|---|---|---|
| Kling 3.0 Image to Video | Video Generation | 720p | Off | $0.075/ second(5.4 Credits) |
| Kling 3.0 Image to Video | Video Generation | 720p | On | $0.113/ second(8.1 Credits) |
| Kling 3.0 Image to Video | Video Generation | 1080p | Off | $0.100/ second(7.1982 Credits) |
| Kling 3.0 Image to Video | Video Generation | 1080p | On | $0.150/ second(10.8 Credits) |
If it's down, we automatically use the next cheapest available—ensuring 99.9% uptime at the best possible price.
Kling 3.0 API: precios, Playground e integración
Accede a Kling 3.0 a través de la API unificada de EvoLink. Usa las rutas de texto a vídeo e imagen a vídeo con entrega asíncrona, facturación por segundo y una sola integración para flujos de producción.
Kling 3.0 comienza en $0.075 por segundo en EvoLink, frente a $0.084 en la API oficial de Kling. Genera vídeos de 3 a 15 segundos a partir de texto o imágenes con créditos gratuitos para empezar, sin depósito requerido.

Descripción general de Kling 3.0 e historial de versiones
Kling 3.0 es el modelo estándar de generación de vídeo de la familia Kling AI de Kuaishou. Dos modos — text-to-video e image-to-video — producen clips de 3 a 15 segundos en 720p o 1080p con facturación por segundo.
En comparación con Kling 2.1 y 1.6, la versión 3.0 mejora la calidad del movimiento, la coherencia de escenas y la fidelidad a los prompts. También añade soporte multi-shot, efectos de sonido IA y control de sujeto para mantener personajes consistentes entre clips. Accede a Kling 3.0 en EvoLink con créditos gratuitos, un Playground integrado y precios más bajos que la tarifa oficial.
Modos de vídeo y funciones de flujo en Kling 3.0 API
Kling 3.0 API de texto a vídeo
Genera vídeos directamente a partir de prompts de texto con Kling 3.0. Describe escenas, acciones y estilos en lenguaje natural y deja que el modelo produzca clips de 3 a 15 segundos para marketing, redes sociales o proyectos creativos.

Kling 3.0 API de imagen a vídeo
Usa imágenes para guiar la generación de vídeo. Kling 3.0 admite imagen a vídeo y ofrece al equipo más control sobre estilo visual, consistencia del personaje y composición de escena.

Kling 3.0 Multi-Shot y efectos de sonido
Crea vídeos complejos con múltiples tomas y añade efectos de sonido generados por IA. Kling 3.0 admite secuencias de tomas personalizadas y generación de audio para una salida más profesional.

Por qué los equipos usan Kling 3.0 con EvoLink
Kling 3.0 ofrece texto a vídeo e imagen a vídeo a través de una sola pasarela, facilitando la gestión de precios, routing e integración en producción.
Una API para dos modos principales de Kling 3.0
Usa la misma integración para texto a vídeo e imagen a vídeo, en lugar de repartir la implementación entre varios proveedores.
Integración más limpia en producción
Las tareas asíncronas, una sola API key y la facturación unificada facilitan el uso de Kling 3.0 en herramientas internas, productos para creadores y flujos automatizados.
Precios por segundo más predecibles
Las salidas de 3 a 15 segundos y las opciones visibles de calidad ayudan a estimar costes antes de enviar tráfico real.
Cómo integrar Kling 3.0 API
De la entrada al vídeo listo para producción en tres pasos.
Elige tu modo
Selecciona texto a vídeo o imagen a vídeo según las necesidades de tu flujo.
Envía una tarea de generación
Envía tu solicitud con prompts o imágenes y sigue la tarea asíncrona hasta que el resultado esté listo.
Revisa e itera
Descarga los resultados, compara variantes y reutiliza la misma estructura para iterar campañas más rápido.
Capacidades de Kling 3.0 API
Acceso a texto a vídeo e imagen a vídeo a través de una pasarela lista para producción
Generación de texto a vídeo
Genera vídeos solo a partir de descripciones en texto. Kling 3.0 interpreta prompts en lenguaje natural y produce contenido dinámico sin requerir entrada visual.
Transformación de imagen a vídeo
Convierte imágenes estáticas en vídeos dinámicos. Aporta imágenes de referencia y deja que Kling 3.0 las anime con movimiento natural y dinámica de escena.
Soporte multi-shot
Crea vídeos complejos con múltiples tomas, transiciones personalizables, prompts por toma y control de duración para producción profesional.
Efectos de sonido
Añade efectos de sonido generados por IA. Activa o desactiva el audio según tu caso de uso, con precios transparentes para la generación sonora.
Facturación por segundo
Paga solo por lo que generas. Los vídeos van de 3 a 15 segundos, lo que ayuda a controlar mejor el coste por proyecto.
Calidad 720p y 1080p
Elige entre 720p estándar y 1080p de mayor calidad para equilibrar calidad y coste según tu caso.
Preguntas frecuentes sobre Kling 3.0 API
Everything you need to know about the product and billing.
Todos los modelos de Kling AI
EvoLink ofrece acceso API unificado a toda la familia de modelos Kling: Todos los modelos comparten la misma clave API. Cambie de modelo con un solo parámetro.
API Reference
Select endpoint
Authentication
All APIs require Bearer Token authentication.
Authorization:
Bearer YOUR_API_KEY/v1/videos/generationsCreate Video
Kling 3.0 Image to Video (kling-v3-image-to-video) transforms static images into dynamic videos using the 3.0 model. Supports first frame, end frame, subject control, multi-shot, and sound effects.
Asynchronous processing mode, use the returned task ID to query status.
Generated video links are valid for 24 hours, please save them promptly.
Important Notes
- image_start (first frame) is required. image_end (end frame) is optional.
- Image requirements: JPG/JPEG/PNG, ≤ 10MB, width/height ≥ 300px, aspect ratio 1:2.5 ~ 2.5:1.
- Video duration: 3-15 seconds, billed per second.
- Pricing varies by quality and sound: 720p+off = 1.0x, 720p+on = 1.5x, 1080p+off = 1.333x, 1080p+on = 2.0x.
Request Parameters
modelstringRequiredDefault: kling-v3-image-to-videoVideo generation model name.
kling-v3-image-to-videopromptstringOptionalText prompt describing what kind of motion and video to generate.
Notes
- Max 2500 characters
- Optional for image-to-video
- Reference elements using <<<element_1>>> syntax
A gentle breeze moves through the scene, creating subtle motion and life.image_startstringRequiredFirst-frame image URL (required).
Notes
- JPG/JPEG/PNG format
- Max size: 10MB
- Width/height ≥ 300px, aspect ratio 1:2.5 ~ 2.5:1
https://example.com/first-frame.jpgimage_endstringOptionalEnd-frame image URL (optional).
Notes
- Optional
- Requires a first frame (image_start)
- JPG/JPEG/PNG format, max 10MB
- Cannot be used together with multi-shot mode (multi_shot=true)
https://example.com/end-frame.jpgdurationintegerOptionalDefault: 5Specifies the generated video duration in seconds.
Notes
- Range: 3-15 seconds (integer)
- Base price: 5.4 credits per second
- Minimum billing: 3 seconds
5qualitystringOptionalDefault: 720pVideo resolution quality. Affects billing multiplier.
| Value | Description |
|---|---|
| 720p | Standard 720P (1.0x base) |
| 1080p | High quality 1080P (1.333x base) |
720psoundstringOptionalDefault: offSound effect control. Affects billing multiplier.
| Value | Description |
|---|---|
| off | No sound effects (1.0x) |
| on | Generate sound effects (1.5x) |
Notes
- Combined multiplier: 720p+off=1.0x, 720p+on=1.5x, 1080p+off=1.333x, 1080p+on=2.0x
offcallback_urlstringOptionalHTTPS callback address after task completion.
Notes
- Triggered on completion, failure, or cancellation
- HTTPS only, no internal IPs
- Max length: 2048 chars
- Timeout: 10s, Max 3 retries
https://your-domain.com/webhooks/video-task-completedmodel_params.multi_shotbooleanOptionalDefault: falseEnable multi-shot mode for generating videos with multiple camera angles or scenes.
Notes
- Cannot be used together with end frame (image_end)
- When enabled, prompt parameter will be ignored — use multi_prompt instead
- Sum of all shot duration values must equal total video duration
truemodel_params.shot_typestringOptionalShot type for multi-shot mode. Required when multi_shot is true.
| Value | Description |
|---|---|
| customize | Custom per-shot prompts and durations |
| intelligence | AI auto-plans shots based on prompt |
Notes
- Only effective when multi_shot=true
customizemodel_params.multi_promptarrayOptionalPer-shot prompt array. Required when multi_shot=true and shot_type=customize. Each item defines a shot segment.
Notes
- Format: [{index: number, prompt: string, duration: string}, ...]
- Max 6 shots, each shot prompt max 512 characters
- Sum of all shot durations must equal total video duration
- When used, top-level prompt can be empty
[{"index": 1, "prompt": "Scene one", "duration": "5"}, {"index": 2, "prompt": "Scene two", "duration": "5"}]model_params.element_listarrayOptionalSubject element list for consistent character appearance. Elements are created via kling-custom-element model.
Notes
- Format: [{element_id: string}, ...]
- Max 3 elements per request
- Video character elements not supported (only multi-image elements supported)
- element_id is obtained from kling-custom-element creation result
[{"element_id": "123456"}]negative_promptstringOptionalNegative prompt describing what you don't want in the video.
Notes
- Max 2500 characters
- Optional
blurry, watermark, text, low qualitymodel_params.watermark_infoobjectOptionalWatermark configuration for the generated video.
Notes
- Format: {enabled: boolean}
{"enabled": false}