Kling 3.0 API
Precio: $0.014(~ 1 credits) per request
Máxima estabilidad con 99.9% de disponibilidad garantizada. Recomendado para producción.
Todas las versiones usan el mismo endpoint API. Solo cambia el parámetro model.
Choose whether to create element from images or video
Frontal view of the subject — must contain a visible human face (1 image)
Click to upload or drag and drop
Supported formats: JPG, JPEG, PNG
Maximum file size: 10MB; Maximum files: 1
Other angle reference images — must contain a visible human face (optional, 1-3)
Click to upload or drag and drop
Supported formats: JPG, JPEG, PNG
Maximum file size: 10MB; Maximum files: 3
Name of the subject element (max 20 characters)
Description of the subject element (max 100 characters)
No video URL found in response
Check console for details
Historial
Máx. 20 elementos0 ejecutando · 0 completado
Billing Rules
- •Fixed price: 1 Credit per element creation
- •Full refund on failure
- •Estimated processing time: ~10 minutes
Pricing
| Model | Mode | Type | Price |
|---|---|---|---|
| Kling Custom Element | Element Creation | Element Creation | $0.014/ request(1 Credits) |
If it's down, we automatically use the next cheapest available—ensuring 99.9% uptime at the best possible price.
Kling 3.0 API: precios, Playground e integración
Accede a Kling 3.0 a través de la API unificada de EvoLink. Usa las rutas de texto a vídeo e imagen a vídeo con entrega asíncrona, facturación por segundo y una sola integración para flujos de producción.
Kling 3.0 comienza en $0.075 por segundo en EvoLink, frente a $0.084 en la API oficial de Kling. Genera vídeos de 3 a 15 segundos a partir de texto o imágenes con créditos gratuitos para empezar, sin depósito requerido.

Descripción general de Kling 3.0 e historial de versiones
Kling 3.0 es el modelo estándar de generación de vídeo de la familia Kling AI de Kuaishou. Dos modos — text-to-video e image-to-video — producen clips de 3 a 15 segundos en 720p o 1080p con facturación por segundo.
En comparación con Kling 2.1 y 1.6, la versión 3.0 mejora la calidad del movimiento, la coherencia de escenas y la fidelidad a los prompts. También añade soporte multi-shot, efectos de sonido IA y control de sujeto para mantener personajes consistentes entre clips. Accede a Kling 3.0 en EvoLink con créditos gratuitos, un Playground integrado y precios más bajos que la tarifa oficial.
Modos de vídeo y funciones de flujo en Kling 3.0 API
Kling 3.0 API de texto a vídeo
Genera vídeos directamente a partir de prompts de texto con Kling 3.0. Describe escenas, acciones y estilos en lenguaje natural y deja que el modelo produzca clips de 3 a 15 segundos para marketing, redes sociales o proyectos creativos.

Kling 3.0 API de imagen a vídeo
Usa imágenes para guiar la generación de vídeo. Kling 3.0 admite imagen a vídeo y ofrece al equipo más control sobre estilo visual, consistencia del personaje y composición de escena.

Kling 3.0 Multi-Shot y efectos de sonido
Crea vídeos complejos con múltiples tomas y añade efectos de sonido generados por IA. Kling 3.0 admite secuencias de tomas personalizadas y generación de audio para una salida más profesional.

Por qué los equipos usan Kling 3.0 con EvoLink
Kling 3.0 ofrece texto a vídeo e imagen a vídeo a través de una sola pasarela, facilitando la gestión de precios, routing e integración en producción.
Una API para dos modos principales de Kling 3.0
Usa la misma integración para texto a vídeo e imagen a vídeo, en lugar de repartir la implementación entre varios proveedores.
Integración más limpia en producción
Las tareas asíncronas, una sola API key y la facturación unificada facilitan el uso de Kling 3.0 en herramientas internas, productos para creadores y flujos automatizados.
Precios por segundo más predecibles
Las salidas de 3 a 15 segundos y las opciones visibles de calidad ayudan a estimar costes antes de enviar tráfico real.
Cómo integrar Kling 3.0 API
De la entrada al vídeo listo para producción en tres pasos.
Elige tu modo
Selecciona texto a vídeo o imagen a vídeo según las necesidades de tu flujo.
Envía una tarea de generación
Envía tu solicitud con prompts o imágenes y sigue la tarea asíncrona hasta que el resultado esté listo.
Revisa e itera
Descarga los resultados, compara variantes y reutiliza la misma estructura para iterar campañas más rápido.
Capacidades de Kling 3.0 API
Acceso a texto a vídeo e imagen a vídeo a través de una pasarela lista para producción
Generación de texto a vídeo
Genera vídeos solo a partir de descripciones en texto. Kling 3.0 interpreta prompts en lenguaje natural y produce contenido dinámico sin requerir entrada visual.
Transformación de imagen a vídeo
Convierte imágenes estáticas en vídeos dinámicos. Aporta imágenes de referencia y deja que Kling 3.0 las anime con movimiento natural y dinámica de escena.
Soporte multi-shot
Crea vídeos complejos con múltiples tomas, transiciones personalizables, prompts por toma y control de duración para producción profesional.
Efectos de sonido
Añade efectos de sonido generados por IA. Activa o desactiva el audio según tu caso de uso, con precios transparentes para la generación sonora.
Facturación por segundo
Paga solo por lo que generas. Los vídeos van de 3 a 15 segundos, lo que ayuda a controlar mejor el coste por proyecto.
Calidad 720p y 1080p
Elige entre 720p estándar y 1080p de mayor calidad para equilibrar calidad y coste según tu caso.
Preguntas frecuentes sobre Kling 3.0 API
Everything you need to know about the product and billing.
Todos los modelos de Kling AI
EvoLink ofrece acceso API unificado a toda la familia de modelos Kling: Todos los modelos comparten la misma clave API. Cambie de modelo con un solo parámetro.
API Reference
Select endpoint
Authentication
All APIs require Bearer Token authentication.
Authorization:
Bearer YOUR_API_KEY/v1/videos/generationsCreate Element
Kling Custom Element (kling-custom-element) creates reusable subjects (elements) from reference images or videos. Created elements can be referenced in Kling V3 Image-to-Video, Kling O3 series, and Kling V3 Motion Control video generation via element_list for consistent character appearance.
Asynchronous processing mode, use the returned task ID to query status.
Upon completion, result_data will contain the element_id for use in video generation.
Important Notes
- This model creates reusable elements (subjects), not videos. No prompt/duration/quality/aspect_ratio parameters needed.
- The reference image or video must contain a clearly visible human face.
- Fixed pricing: 1 Credit per element creation. Full refund on failure.
- Estimated processing time: approximately 10 minutes.
- After successful creation, use the returned element_id in Kling V3 Image-to-Video, Kling O3 series, and Kling V3 Motion Control video generation via element_list.
Request Parameters
modelstringRequiredDefault: kling-custom-elementModel name for custom element creation.
kling-custom-elementmodel_params.element_namestringRequiredName for the element (subject) being created.
Notes
- Max 20 characters
MyCharactermodel_params.element_descriptionstringRequiredDescription of the element, used to help the model understand the subject characteristics.
Notes
- Max 100 characters
A young male character with short hair, wearing a white T-shirtmodel_params.reference_typestringRequiredType of reference material used to create the element.
| Value | Description |
|---|---|
| image_refer | Use reference images to create element |
| video_refer | Use reference video to create element |
image_refermodel_params.element_image_listobjectOptionalReference image list for element creation. Required when reference_type is image_refer.
Notes
- Conditionally required: must be provided when reference_type = image_refer
- frontal_image (string): URL of the frontal reference image (recommended)
- refer_images (array): Additional reference images, each with an image_url field
- Use clear, well-lit images with the subject clearly visible for best results
- The reference images must contain a clearly visible human face
{"frontal_image": "https://example.com/front.jpg", "refer_images": [{"image_url": "https://example.com/side.jpg"}]}model_params.element_video_listobjectOptionalReference video for element creation. Required when reference_type is video_refer.
Notes
- Conditionally required: must be provided when reference_type = video_refer
- video_url (string): URL of the reference video
- The reference video must contain a clearly visible human face
{"video_url": "https://example.com/reference.mp4"}model_params.element_voice_idstringOptionalVoice ID to assign to the element. The voice will be used when the element speaks in generated videos.
Notes
- Optional parameter — only supported when reference_type = video_refer
- Not available for image_refer (image-based element creation does not support voice assignment)
- See the Voice ID Reference section below for all available voice IDs
829824295735410756callback_urlstringOptionalHTTPS callback address after task completion.
Notes
- Triggered on completion, failure, or cancellation
- HTTPS only, no internal IPs
- Max length: 2048 chars
- Timeout: 10s, Max 3 retries
https://your-domain.com/webhooks/element-task-completed