Kling 3.0 API
价格: $0.075 - 0.150(~ 5.4 - 10.8 credits) per second of video
稳定性最高,保证 99.9% 可用性。推荐用于生产环境。
所有版本使用同一个 API 端点,仅 model 参数不同。
Video starts from this image
Click to upload or drag and drop
Supported formats: JPG, JPEG, PNG
Maximum file size: 10MB; Maximum files: 1
End-frame image (optional)
Click to upload or drag and drop
Supported formats: JPG, JPEG, PNG
Maximum file size: 10MB; Maximum files: 1
History
最多保留20条0 运行中 · 0 已完成
Billing Rules
- •Price shown is per second
- •Duration range: 3-15 seconds
- •Total = price/second × duration
Pricing
| Model | Mode | Quality | Sound | Price |
|---|---|---|---|---|
| Kling 3.0 Image to Video | Video Generation | 720p | Off | $0.075/ second(5.4 Credits) |
| Kling 3.0 Image to Video | Video Generation | 720p | On | $0.113/ second(8.1 Credits) |
| Kling 3.0 Image to Video | Video Generation | 1080p | Off | $0.100/ second(7.1982 Credits) |
| Kling 3.0 Image to Video | Video Generation | 1080p | On | $0.150/ second(10.8 Credits) |
If it's down, we automatically use the next cheapest available—ensuring 99.9% uptime at the best possible price.
Kling 3.0 API 定价、Playground 与集成
通过 EvoLink 统一 API 接入 Kling 3.0。用一个集成路径完成文生视频和图生视频,支持异步交付、按秒计费和生产工作流接入。
Kling 3.0 在 EvoLink 上的起步价为每秒 $0.075,而官方 Kling API 为每秒 $0.084。支持从文本或图像生成 3-15 秒视频,注册即送免费额度,无需预充值。

Kling 3.0 概述与版本历史
Kling 3.0 是快手 Kling AI 系列中的标准视频生成模型。两种模式——text-to-video 和 image-to-video——可生成 3-15 秒、720p 或 1080p 的视频片段,按秒计费。
与 Kling 2.1 和 1.6 相比,3.0 版本提升了运动质量、场景连贯性和提示词遵循度,还新增了多镜头支持、AI 音效和角色一致性控制,使角色在多个片段中保持统一。通过 EvoLink 使用 Kling 3.0,享受免费额度、内置 Playground,以及低于官方的价格。
Kling 3.0 API 视频模式与工作流能力
Kling 3.0 文生视频 API
使用 Kling 3.0 直接从文本提示生成视频。用自然语言描述场景、动作和风格,让模型生成 3-15 秒的片段,适用于营销、社交媒体或创意项目。

Kling 3.0 图生视频 API
使用图像来引导视频生成。Kling 3.0 支持图生视频模式,让团队精确控制视觉风格、角色一致性和场景构图。

Kling 3.0 多镜头与音效能力
创建复杂的多镜头视频,支持场景切换和 AI 生成的音效。Kling 3.0 支持自定义镜头序列和音频生成,为专业级视频输出提供支持。

为什么团队通过 EvoLink 使用 Kling 3.0
Kling 3.0 通过一个网关同时提供文生视频和图生视频能力,让定价、路由和生产接入更容易管理。
一个 API 覆盖两种 Kling 3.0 核心模式
用同一套接入方式处理文生视频和图生视频,而不必拆成多套不同的供应商实现。
更适合生产环境的接入方式
异步任务处理、单个 API Key 和统一计费,让 Kling 3.0 更容易接进内部工具、创作者产品和自动化工作流。
更可预期的按秒成本
3-15 秒输出范围和清晰的画质选项,让团队在发送生产流量前更容易预估成本。
如何集成 Kling 3.0 API
从输入到生产就绪视频的三个步骤。
选择模式
根据您的工作流需求,选择文生视频或图生视频模式。
提交生成任务
发送带有提示词或图像的请求。跟踪异步任务直到结果就绪。
评审与迭代
下载结果,比较变体,并复用相同的结构在不同营销活动中快速迭代。
Kling 3.0 API 核心能力
通过一个生产可用网关接入文生视频和图生视频
文生视频生成
纯粹从文本描述生成视频。Kling 3.0 解读自然语言提示,无需任何视觉输入即可生成动态视频内容。
图生视频转换
将静态图像转换为动态视频。提供参考图像,让 Kling 3.0 以自然的运动和场景动态将其动画化。
多镜头支持
创建复杂的多镜头视频,支持自定义场景切换、每镜头提示词和时长控制,满足专业视频制作需求。
音效
为视频添加 AI 生成的音效。根据需要开启或关闭音效,音频生成定价透明。
按秒计费
按秒计费,只为生成的内容付费。视频范围从 3 到 15 秒,让团队对每个项目都有精确的成本控制。
720p 和 1080p 质量
在标准 720p 和高质量 1080p 输出分辨率之间选择,为特定用例平衡质量和成本。
Kling 3.0 API 常见问题
Everything you need to know about the product and billing.
全部 Kling AI 模型
EvoLink 提供统一 API 接入 Kling 全系列模型: 所有模型共享同一 API Key,切换模型只需修改一个参数。
API Reference
Select endpoint
Authentication
All APIs require Bearer Token authentication.
Authorization:
Bearer YOUR_API_KEY/v1/videos/generationsCreate Video
Kling 3.0 Image to Video (kling-v3-image-to-video) transforms static images into dynamic videos using the 3.0 model. Supports first frame, end frame, subject control, multi-shot, and sound effects.
Asynchronous processing mode, use the returned task ID to query status.
Generated video links are valid for 24 hours, please save them promptly.
Important Notes
- image_start (first frame) is required. image_end (end frame) is optional.
- Image requirements: JPG/JPEG/PNG, ≤ 10MB, width/height ≥ 300px, aspect ratio 1:2.5 ~ 2.5:1.
- Video duration: 3-15 seconds, billed per second.
- Pricing varies by quality and sound: 720p+off = 1.0x, 720p+on = 1.5x, 1080p+off = 1.333x, 1080p+on = 2.0x.
Request Parameters
modelstringRequiredDefault: kling-v3-image-to-videoVideo generation model name.
kling-v3-image-to-videopromptstringOptionalText prompt describing what kind of motion and video to generate.
Notes
- Max 2500 characters
- Optional for image-to-video
- Reference elements using <<<element_1>>> syntax
A gentle breeze moves through the scene, creating subtle motion and life.image_startstringRequiredFirst-frame image URL (required).
Notes
- JPG/JPEG/PNG format
- Max size: 10MB
- Width/height ≥ 300px, aspect ratio 1:2.5 ~ 2.5:1
https://example.com/first-frame.jpgimage_endstringOptionalEnd-frame image URL (optional).
Notes
- Optional
- Requires a first frame (image_start)
- JPG/JPEG/PNG format, max 10MB
- Cannot be used together with multi-shot mode (multi_shot=true)
https://example.com/end-frame.jpgdurationintegerOptionalDefault: 5Specifies the generated video duration in seconds.
Notes
- Range: 3-15 seconds (integer)
- Base price: 5.4 credits per second
- Minimum billing: 3 seconds
5qualitystringOptionalDefault: 720pVideo resolution quality. Affects billing multiplier.
| Value | Description |
|---|---|
| 720p | Standard 720P (1.0x base) |
| 1080p | High quality 1080P (1.333x base) |
720psoundstringOptionalDefault: offSound effect control. Affects billing multiplier.
| Value | Description |
|---|---|
| off | No sound effects (1.0x) |
| on | Generate sound effects (1.5x) |
Notes
- Combined multiplier: 720p+off=1.0x, 720p+on=1.5x, 1080p+off=1.333x, 1080p+on=2.0x
offcallback_urlstringOptionalHTTPS callback address after task completion.
Notes
- Triggered on completion, failure, or cancellation
- HTTPS only, no internal IPs
- Max length: 2048 chars
- Timeout: 10s, Max 3 retries
https://your-domain.com/webhooks/video-task-completedmodel_params.multi_shotbooleanOptionalDefault: falseEnable multi-shot mode for generating videos with multiple camera angles or scenes.
Notes
- Cannot be used together with end frame (image_end)
- When enabled, prompt parameter will be ignored — use multi_prompt instead
- Sum of all shot duration values must equal total video duration
truemodel_params.shot_typestringOptionalShot type for multi-shot mode. Required when multi_shot is true.
| Value | Description |
|---|---|
| customize | Custom per-shot prompts and durations |
| intelligence | AI auto-plans shots based on prompt |
Notes
- Only effective when multi_shot=true
customizemodel_params.multi_promptarrayOptionalPer-shot prompt array. Required when multi_shot=true and shot_type=customize. Each item defines a shot segment.
Notes
- Format: [{index: number, prompt: string, duration: string}, ...]
- Max 6 shots, each shot prompt max 512 characters
- Sum of all shot durations must equal total video duration
- When used, top-level prompt can be empty
[{"index": 1, "prompt": "Scene one", "duration": "5"}, {"index": 2, "prompt": "Scene two", "duration": "5"}]model_params.element_listarrayOptionalSubject element list for consistent character appearance. Elements are created via kling-custom-element model.
Notes
- Format: [{element_id: string}, ...]
- Max 3 elements per request
- Video character elements not supported (only multi-image elements supported)
- element_id is obtained from kling-custom-element creation result
[{"element_id": "123456"}]negative_promptstringOptionalNegative prompt describing what you don't want in the video.
Notes
- Max 2500 characters
- Optional
blurry, watermark, text, low qualitymodel_params.watermark_infoobjectOptionalWatermark configuration for the generated video.
Notes
- Format: {enabled: boolean}
{"enabled": false}