Veo 3.1 API

利用 Google DeepMind 的 Veo 3.1 模型。生成带有对话和音效的 1080p 视频。选择 Fast 追求速度或 Pro 追求最佳质量。

Estimated Cost
60 Credits
Sample Result

No sample available

0 (suggested: 2,000)

Upload up to 3 images

Click to upload or drag and drop

Supported formats: JPG, JPEG, PNG, WEBP
Maximum file size: 10MB; Maximum files: 3

Only 16:9 is supported when using reference images or 3 images.

Click Generate to see preview

History

最多保留20条

0 运行中 · 0 已完成

您的生成历史将显示在这里

Veo 3.1 API — 生产级带同步音频视频

集成 Google 最新的生成式视频模型。制作 4-8 秒片段,语音与环境音完美对齐。支持竖屏格式、参考图以及快速的提示词迭代。

示例 1

使用 Veo 3.1 API 可以构建什么?

即时社交媒体内容

自动化 9:16 Shorts 和 Reels 的创作。Veo 3.1 API 提供高质量渲染,非常适合内容引擎。

示例 2

基于参考图的精准控制

保持角色和风格的一致性。通过 API 传递参考图像或起始/结束帧,以精准引导视频生成过程。

示例 3

同步音频声景

单次生成即可同时获得视频和音频。该模型能够创作出与视觉动作逐帧匹配的对话、拟音和配乐。

示例 4

为什么开发者选择 Veo 3.1 API

Veo 3.1 提供两种变体:Fast 追求速度和性价比,Pro 追求最高视觉保真度。两者都包含原生音频生成。

满足不同需求的两种变体

Fast 变体适合快速迭代和高性价比需求。Pro 变体适合追求最高质量和复杂场景。

高性价比的规模化扩展

更低的每秒计算成本,使得为广告 A/B 测试或用户个性化内容进行数千次迭代成为可能。

生产级输出

提供用于草稿的 720p 和用于最终导出的 1080p 分辨率,并内置水印以确保安全与合规。

如何集成 Veo 3.1

一个简单的 API 工作流,用于通过文本或图像生成带音频的视频。

1

第 1 步 — 选择变体并配置

选择 Fast 或 Pro 变体。设置所需的时长(4秒、6秒、8秒)、画幅比例和分辨率(720p/1080p)。

2

第 2 步 — 发送提示词与参考图

提交您的文本提示词,以及可选的用于风格控制的参考图像,或用于转场的起始/结束帧。

3

第 3 步 — 获取视频 + 音频

接收完全内嵌同步音频的 MP4 输出文件,即可直接播放或发布。

核心能力

通过 Veo 3.1 API 端点可用的高级功能

音频

原生音频生成

创建与视频动作在时间上对齐的语音、音乐和音效。

灵活

Fast 与 Pro 变体

选择 Fast 追求速度和性价比,或选择 Pro 追求最高视觉质量。

控制

视觉控制

使用图生视频或首尾帧输入来控制流程和构图。

分辨率

灵活分辨率

无需更换模型即可在追求速度的 720p 和追求质量的 1080p 之间切换。

物理

物理模拟

更新的世界模型以高逼真度处理流体动力学、光照和碰撞。

信任

SynthID 水印

默认嵌入不可见水印,以确保负责任的 AI 内容使用。

Veo 3.1 API 变体对比

对比 Fast 和 Pro 变体

ModelDurationResolutionPriceStrength
Veo 3.1 Fast4/6/8秒720p / 1080p~$0.15/秒 (EvoLink)延迟最低;原生音频;最多 3 张参考图;适合快速迭代。
Veo 3.1 Pro4/6/8秒720p / 1080p溢价最高视觉保真度;复杂物理效果;首尾帧模式;适合最终资产。
Sora (Pro)10–15秒最高 1080p~$0.20/10秒 (标准)更长的原生时长;强大的提示词遵循度;有竞争力的物理效果。

常见问题解答

Everything you need to know about the product and billing.

Veo 3.1 API 提供了对 Google 视频生成模型的编程访问。它提供两种变体:Fast 追求速度和性价比,Pro 追求最高视觉保真度。两者都支持 1080p 分辨率和原生音频。
Fast 变体优先考虑速度和较低成本,适合快速迭代。Pro 变体提供更高的视觉质量和更好的复杂场景处理,适合最终生产资产。
可以。Fast 和 Pro 变体都能在单次生成过程中生成与视频内容匹配的原生音频(包括对话、环境音和音乐)。
当然可以。API 支持使用「参考图像」来引导视觉风格。Fast 支持最多 3 张图片,Pro 支持最多 2 张图片用于首尾帧模式。
API 输出 720p 或 1080p 分辨率的 MP4 文件。您可以选择 16:9(横屏)或 9:16(竖屏)画幅比例,时长可选 4、6 或 8 秒。
是的,Veo 3.1 专为商业工作流设计,包括广告和社交媒体自动化。它包含 SynthID 水印以确保透明度和合规性。
POST
/v1/videos/generations

Create Video

Veo 3.1 Fast Lite (veo3.1-fast) model supports text-to-video, first-frame image-to-video and other modes.

Asynchronous processing mode, use the returned task ID to .

Generated video links are valid for 24 hours, please save them promptly.

Request Parameters

modelstringRequiredDefault: veo3.1-fast

Video generation model name.

Exampleveo3.1-fast
promptstringRequired

Prompt describing what kind of video to generate.

Notes
  • Limited to 2000 tokens
ExampleA cat playing piano
aspect_ratiostringOptionalDefault: auto

Video aspect ratio. When set to auto: image-to-video will automatically select based on the input image ratio, text-to-video will automatically select based on the prompt content.

ValueDescription
autoAutomatic selection based on input
16:9Landscape video
9:16Portrait video
Exampleauto
image_urlsarrayOptional

Reference image URL list for image-to-video feature.

Notes
  • 1 image for first-frame video generation
  • 2 images for first-and-last-frame video generation
  • Up to 3 images for reference image to video
  • Max size: 10MB per image
  • Formats: .jpg, .jpeg, .png, .webp
  • URLs must be directly viewable by the server
Examplehttp://example.com/image1.jpg
generation_typestringOptional

Video generation mode, default matches based on image count.

ValueDescription
TEXTText to video
FIRST&LASTFirst and last frame to video (1-2 images)
REFERENCEReference image to video (up to 3 images, 16:9 only)
ExampleTEXT
enhance_promptbooleanOptionalDefault: true

Whether to automatically translate the prompt to English. When enabled, non-English prompts will be automatically translated to English for better generation results.

Exampletrue
callback_urlstringOptional

HTTPS callback address after task completion.

Notes
  • Triggered on completion, failure, or cancellation
  • Sent after billing confirmation
  • HTTPS only, no internal IPs
  • Max length: 2048 chars
  • Timeout: 10s, Max 3 retries
Examplehttps://your-domain.com/webhooks/video-task-completed

Request Example

{
  "model": "veo3.1-fast",
  "prompt": "A cat playing piano",
  "aspect_ratio": "16:9"
}

Response Example

{
  "created": 1757169743,
  "id": "task-unified-1757169743-7cvnl5zw",
  "model": "veo3.1-fast",
  "object": "video.generation.task",
  "progress": 0,
  "status": "pending",
  "task_info": {
    "can_cancel": true,
    "estimated_time": 180,
    "video_duration": 8
  },
  "type": "video",
  "usage": {
    "billing_rule": "per_call",
    "credits_reserved": 60,
    "user_group": "default"
  }
}
Veo 3.1 API:高质量带音频视频生成 | EvoLink