Kling 3.0 API
Precio: $0.075 - 0.150(~ 5.4 - 10.8 credits) per second of video
Máxima estabilidad con 99.9% de disponibilidad garantizada. Recomendado para producción.
Todas las versiones usan el mismo endpoint API. Solo cambia el parámetro model.
Historial
Máx. 20 elementos0 ejecutando · 0 completado
Billing Rules
- •Price shown is per second
- •Duration range: 3-15 seconds
- •Total = price/second × duration
Pricing
| Model | Mode | Quality | Sound | Price |
|---|---|---|---|---|
| Kling 3.0 Text to Video | Video Generation | 720p | Off | $0.075/ second(5.4 Credits) |
| Kling 3.0 Text to Video | Video Generation | 720p | On | $0.113/ second(8.1 Credits) |
| Kling 3.0 Text to Video | Video Generation | 1080p | Off | $0.100/ second(7.1982 Credits) |
| Kling 3.0 Text to Video | Video Generation | 1080p | On | $0.150/ second(10.8 Credits) |
If it's down, we automatically use the next cheapest available—ensuring 99.9% uptime at the best possible price.
Kling 3.0 API: precios, Playground e integración
Accede a Kling 3.0 a través de la API unificada de EvoLink. Usa las rutas de texto a vídeo e imagen a vídeo con entrega asíncrona, facturación por segundo y una sola integración para flujos de producción.
Kling 3.0 comienza en $0.075 por segundo en EvoLink, frente a $0.084 en la API oficial de Kling. Genera vídeos de 3 a 15 segundos a partir de texto o imágenes con créditos gratuitos para empezar, sin depósito requerido.

Descripción general de Kling 3.0 e historial de versiones
Kling 3.0 es el modelo estándar de generación de vídeo de la familia Kling AI de Kuaishou. Dos modos — text-to-video e image-to-video — producen clips de 3 a 15 segundos en 720p o 1080p con facturación por segundo.
En comparación con Kling 2.1 y 1.6, la versión 3.0 mejora la calidad del movimiento, la coherencia de escenas y la fidelidad a los prompts. También añade soporte multi-shot, efectos de sonido IA y control de sujeto para mantener personajes consistentes entre clips. Accede a Kling 3.0 en EvoLink con créditos gratuitos, un Playground integrado y precios más bajos que la tarifa oficial.
Modos de vídeo y funciones de flujo en Kling 3.0 API
Kling 3.0 API de texto a vídeo
Genera vídeos directamente a partir de prompts de texto con Kling 3.0. Describe escenas, acciones y estilos en lenguaje natural y deja que el modelo produzca clips de 3 a 15 segundos para marketing, redes sociales o proyectos creativos.

Kling 3.0 API de imagen a vídeo
Usa imágenes para guiar la generación de vídeo. Kling 3.0 admite imagen a vídeo y ofrece al equipo más control sobre estilo visual, consistencia del personaje y composición de escena.

Kling 3.0 Multi-Shot y efectos de sonido
Crea vídeos complejos con múltiples tomas y añade efectos de sonido generados por IA. Kling 3.0 admite secuencias de tomas personalizadas y generación de audio para una salida más profesional.

Por qué los equipos usan Kling 3.0 con EvoLink
Kling 3.0 ofrece texto a vídeo e imagen a vídeo a través de una sola pasarela, facilitando la gestión de precios, routing e integración en producción.
Una API para dos modos principales de Kling 3.0
Usa la misma integración para texto a vídeo e imagen a vídeo, en lugar de repartir la implementación entre varios proveedores.
Integración más limpia en producción
Las tareas asíncronas, una sola API key y la facturación unificada facilitan el uso de Kling 3.0 en herramientas internas, productos para creadores y flujos automatizados.
Precios por segundo más predecibles
Las salidas de 3 a 15 segundos y las opciones visibles de calidad ayudan a estimar costes antes de enviar tráfico real.
Cómo integrar Kling 3.0 API
De la entrada al vídeo listo para producción en tres pasos.
Elige tu modo
Selecciona texto a vídeo o imagen a vídeo según las necesidades de tu flujo.
Envía una tarea de generación
Envía tu solicitud con prompts o imágenes y sigue la tarea asíncrona hasta que el resultado esté listo.
Revisa e itera
Descarga los resultados, compara variantes y reutiliza la misma estructura para iterar campañas más rápido.
Capacidades de Kling 3.0 API
Acceso a texto a vídeo e imagen a vídeo a través de una pasarela lista para producción
Generación de texto a vídeo
Genera vídeos solo a partir de descripciones en texto. Kling 3.0 interpreta prompts en lenguaje natural y produce contenido dinámico sin requerir entrada visual.
Transformación de imagen a vídeo
Convierte imágenes estáticas en vídeos dinámicos. Aporta imágenes de referencia y deja que Kling 3.0 las anime con movimiento natural y dinámica de escena.
Soporte multi-shot
Crea vídeos complejos con múltiples tomas, transiciones personalizables, prompts por toma y control de duración para producción profesional.
Efectos de sonido
Añade efectos de sonido generados por IA. Activa o desactiva el audio según tu caso de uso, con precios transparentes para la generación sonora.
Facturación por segundo
Paga solo por lo que generas. Los vídeos van de 3 a 15 segundos, lo que ayuda a controlar mejor el coste por proyecto.
Calidad 720p y 1080p
Elige entre 720p estándar y 1080p de mayor calidad para equilibrar calidad y coste según tu caso.
Preguntas frecuentes sobre Kling 3.0 API
Everything you need to know about the product and billing.
Todos los modelos de Kling AI
EvoLink ofrece acceso API unificado a toda la familia de modelos Kling: Todos los modelos comparten la misma clave API. Cambie de modelo con un solo parámetro.
API Reference
Select endpoint
Authentication
All APIs require Bearer Token authentication.
Authorization:
Bearer YOUR_API_KEY/v1/videos/generationsCreate Video
Kling 3.0 Text to Video (kling-v3-text-to-video) generates videos from text prompts using the 3.0 model. Supports single-shot and multi-shot modes with optional sound effects.
Asynchronous processing mode, use the returned task ID to query status.
Generated video links are valid for 24 hours, please save them promptly.
Important Notes
- Text-to-video mode: no image input required.
- Video duration: 3-15 seconds, billed per second.
- Pricing varies by quality and sound: 720p+off = 1.0x, 720p+on = 1.5x, 1080p+off = 1.333x, 1080p+on = 2.0x.
Request Parameters
modelstringRequiredDefault: kling-v3-text-to-videoVideo generation model name.
kling-v3-text-to-videopromptstringRequiredText prompt describing what kind of video to generate. When multi_shot=true and shot_type=customize, this can be empty (use multi_prompt instead).
Notes
- Max 2500 characters
- Reference elements using <<<element_1>>> syntax in the prompt
A golden retriever running through a sunlit meadow, cinematic slow motion.durationintegerOptionalDefault: 5Specifies the generated video duration in seconds.
Notes
- Range: 3-15 seconds (integer)
- Base price: 5.4 credits per second
- Minimum billing: 3 seconds
5aspect_ratiostringOptionalVideo aspect ratio.
| Value | Description |
|---|---|
| 16:9 | Landscape video |
| 9:16 | Portrait video |
| 1:1 | Square video |
16:9qualitystringOptionalDefault: 720pVideo resolution quality. Affects billing multiplier.
| Value | Description |
|---|---|
| 720p | Standard 720P (1.0x base) |
| 1080p | High quality 1080P (1.333x base) |
720psoundstringOptionalDefault: offSound effect control. Affects billing multiplier.
| Value | Description |
|---|---|
| off | No sound effects (1.0x) |
| on | Generate sound effects (1.5x) |
Notes
- Combined multiplier: 720p+off=1.0x, 720p+on=1.5x, 1080p+off=1.333x, 1080p+on=2.0x
offcallback_urlstringOptionalHTTPS callback address after task completion.
Notes
- Triggered on completion, failure, or cancellation
- HTTPS only, no internal IPs
- Max length: 2048 chars
- Timeout: 10s, Max 3 retries
https://your-domain.com/webhooks/video-task-completedmodel_params.multi_shotbooleanOptionalDefault: falseEnable multi-shot mode for generating videos with multiple camera angles or scenes.
Notes
- When enabled, prompt parameter will be ignored — use multi_prompt instead
- Sum of all shot duration values must equal total video duration
truemodel_params.shot_typestringOptionalShot type for multi-shot mode. Required when multi_shot is true.
| Value | Description |
|---|---|
| customize | Custom per-shot prompts and durations |
| intelligence | AI auto-plans shots based on prompt |
Notes
- Only effective when multi_shot=true
customizemodel_params.multi_promptarrayOptionalPer-shot prompt array. Required when multi_shot=true and shot_type=customize. Each item defines a shot segment.
Notes
- Format: [{index: number, prompt: string, duration: string}, ...]
- Max 6 shots, each shot prompt max 512 characters
- Sum of all shot durations must equal total video duration
- When used, top-level prompt can be empty
[{"index": 1, "prompt": "A person on a hilltop", "duration": "5"}, {"index": 2, "prompt": "Camera pulls back", "duration": "5"}]negative_promptstringOptionalNegative prompt describing what you don't want in the video.
Notes
- Max 2500 characters
- Optional
blurry, watermark, text, low qualitymodel_params.watermark_infoobjectOptionalWatermark configuration for the generated video.
Notes
- Format: {enabled: boolean}
{"enabled": false}