Gemini Omni API

EvoLink 上的 Gemini Omni API — 一个 API key 搞定视频生成与对话式编辑，支持异步任务工作流和回调通知。

模型类型:

稳定性最高，保证 99.9% 可用性。推荐用于生产环境。

所有版本使用同一个 API 端点，仅 model 参数不同。

Google Gemini Omni API — AI 视频生成模型

Name: EvoLink AI API Gateway
Brand: EvoLink
Availability: InStock

通过 EvoLink 的单一 API key 调用 Gemini Omni API，运行 Google 的对话式视频模型，实现文生视频、图生视频和对话式编辑。与 Veo 3.1 不同，Gemini Omni 将编辑作为核心能力 — 在对话中逐步精修片段，无需从头重新生成。通过 EvoLink 全球可用，支持异步任务工作流、回调通知，无需 Google Cloud 项目。上方的定价标签页展示了 Pro 和 Flash 路由的当前费率。

Gemini Omni API 能做什么？

对话式视频编辑

用 Gemini Omni 生成一段视频，然后在对话中逐步精修——「让光线更暖一些」「把红色汽车替换掉」。模型只重写受影响的帧，其余部分保持像素级稳定，无需从头重新生成。

在 Playground 试用

物体替换与场景改写

替换画面中的物体、移除多余元素，或在保留身份和运动的前提下改写场景。适用于广告创意迭代和产品变体渲染，无需外部编辑工具。

查看工作流

参考图工作流

传入一张参考图，Gemini Omni 会在生成视频中锚定角色身份、光线和色彩。结合对话式编辑，可在不破坏视觉一致性的前提下精修特定镜头。

开始使用 API

原生音视频同步生成

Gemini Omni 在一次推理中同时输出同步的音频和视频 — 脚步声匹配落地瞬间，对话匹配唇部动作，无需单独的 TTS 或音效设计流程。

开始使用 API

Gemini Omni 横向对比 — 所有模型共用一个 EvoLink API key

Gemini Omni 并非画质标杆 — Seedance 2.0 目前在公开基准测试中领先。Gemini Omni 的优势在于工作流：对话式编辑、长上下文一致性，以及 Google 视频模型中最简洁的生产接入路径。

对话原生编辑工作流

Gemini Omni 是目前唯一将编辑作为核心能力的主流 Google 视频模型。Veo 3.1 和 Seedance 2.0 以生成为主。在多轮精修场景下，这是结构性差异。

长上下文角色一致性

Gemini Omni 继承了 Gemini 的长上下文窗口，可在同一任务的多个镜头中保持角色、服装和道具的一致性，减少分镜制作中的手动参考管理工作。

无需 Google Cloud 项目 — 与 Veo、Seedance 相同的异步模式

无需 GCP 配置、无需 Vertex 计费、无需单独的区域审批。如果你已通过 EvoLink 运行视频生成，接入 Gemini Omni 只需改一个参数 — 请求结构、任务生命周期与 Veo 3.1、Seedance 2.0、Kling 完全一致。

Gemini Omni vs Veo 3.1 vs Seedance 2.0 — 详细对比

2026 年生产级视频工作流中最常被候选的三个模型，均可通过一个 EvoLink API key 访问。

功能	Gemini Omni	Veo 3.1	Seedance 2.0
EvoLink 价格	TBC	From $0.50/s	From $0.092/s
画质	720p / 1080p (TBC)	720p / 1080p / 4K	480p / 720p / 1080p
原生音频	支持	支持	支持
参考控制	文本 + 图片 + 对话编辑	文本 + 图片	文本 + 图片 + 视频 + 音频
视频时长	~10s	4–8s + 16s 扩展	4–15s
编辑能力	对话原生，多轮交互	以生成为主	V2V 模式
最适合	编辑密集型工作流	电影级基准	多模态参考生产

Gemini Omni vs Veo 3.1 →

如何接入 Gemini Omni API

三步完成你的第一个 Gemini Omni 视频任务，接入模式与 Veo 3.1、Seedance 2.0、Kling 3.0 一致。

Step 1 — 获取 API Key

在 EvoLink.ai 注册并在控制台生成你的 API key，无需 Google Cloud 项目。

Step 2 — 提交生成任务

向 /v1/videos/generations 发送 POST 请求，指定 model 为 gemini-omni-pro（或 gemini-omni-flash）并填写 prompt。可选传入参考图 URL 实现图生视频，以及 callback_url 接收完成通知。API 异步处理并返回 task_id。

Step 3 — 获取视频结果

使用 task_id 轮询状态接口，或等待 callback_url webhook 回调。当状态变为 completed 时，你将获得生成的 MP4 下载链接，链接有效期 24 小时。

查看代码示例

Gemini Omni API 能力总览

面向生产视频工作流的技术规格。

编辑

对话式视频编辑

在同一对话线程中多轮精修，仅受影响的帧重新渲染。

输出

最高 1080p，约 10 秒片段

支持 720p 和 1080p 输出，片段时长约 10 秒。适用于短视频内容和分镜制作。

模式

文生视频与图生视频

支持 T2V 文本提示生成和 I2V 参考图输入。对话编辑适用于两种模式的输出。

音频

原生同步音频

画面和音频联合生成 — 对话、环境音、撞击音效与画面动作精准同步。

一致性

长上下文角色一致性

继承 Gemini 的长上下文窗口，在同一任务的多个镜头中保持角色和道具一致。

工作流

异步 API — 支持 Task ID 和回调

提交任务后获取 ID，轮询状态或配置 callback_url。与 EvoLink 其他视频模型的生命周期一致。

费用示例 — Gemini Omni 定价预估

100 × 10s 片段（社交媒体批量生成）

定价即将公布

1,000 × 10s 片段/月（生产规模）

定价即将公布

1 次生成 + 3 次编辑（多轮工作流）

定价即将公布

先用 gemini-omni-flash 快速迭代，再将优选结果提升至 gemini-omni-pro。路由上线后将公布详细定价。

探索 EvoLink 上更多视频生成模型 →

Gemini Omni API 常见问题

Everything you need to know about the product and billing.

Gemini Omni 是 Google 在 Google I/O 2026 发布的对话式视频生成模型。Veo 3.1 以生成为核心，擅长电影级文生视频和图生视频输出；而 Gemini Omni 将编辑作为一等能力。Veo 3.1 在原始电影级画质和 4K 输出上仍然领先，Gemini Omni 则在多轮编辑工作流上更具优势。

按任务计费，提供两条路由：gemini-omni-pro 用于高质量输出，gemini-omni-flash 用于低成本迭代。音频生成已包含在内。请查看上方定价表了解当前费率。

不需要。EvoLink 通过一个 API key 提供访问，无需 Google Cloud 项目、无需 Vertex 计费、无需单独的区域审批。认证方式与 EvoLink 上的 Veo 3.1 和 Seedance 2.0 完全一致。

Pro 是高画质路由，适合生产级输出。Flash 是低成本路由，适合快速迭代和 A/B 测试。两者共享相同的异步 API — 只需切换 model 参数即可。

支持。提交任务时传入 callback_url（HTTPS），任务完成、失败或取消时 EvoLink 会向你的端点发送 POST 请求。失败的回调最多重试 3 次，退避间隔为 1s/2s/4s。也可以轮询任务状态接口。

失败任务会返回 failed 状态并附带错误原因。失败任务不计费。应用层重试时，可将任务视为幂等操作，使用相同参数重新提交即可。

可以 — 这正是 Gemini Omni 的核心差异化能力。传入之前的 task ID 和自然语言编辑指令，模型只会重写受影响的帧。支持在单个任务中进行多轮编辑。

当前路由生成的片段最长约 10 秒。对于更长的叙事，可利用长上下文角色一致性将多个片段串联起来。

支持。传入参考图 URL，Gemini Omni 会将其作为生成视频的身份锚点。

Seedance 2.0 在纯文生视频基准测试中领先，且支持最广泛的多模态参考输入。Veo 3.1 是电影级基准，支持 4K 和 16 秒扩展。Gemini Omni 的差异化优势在于对话式编辑和长上下文一致性。

可以。EvoLink 通过单一 API key 提供 Gemini Omni、Veo 3.1、Nano Banana 2 以及 Gemini 全系列模型的统一访问。切换模型只需更改 model 参数。

全部 Gemini 视频 API 模型

EvoLink 通过单一 API key 提供对 Google 视频与媒体模型家族的统一访问。所有模型共享同一 EvoLink API 端点，切换模型只需更改一个参数。

探索 Gemini 系列查看 Veo 3.1 查看 Nano Banana 2

API Reference

Select endpoint

Authentication

All APIs require Bearer Token authentication.

Header

Authorization: 
Bearer YOUR_API_KEY

Get API Key

POST

/v1/videos/generations

Create Gemini Omni Video Task

Confirm live route fields before production use

Submit a Gemini Omni video task through EvoLink using the live supported request fields.

Asynchronous processing returns a task ID. Use it to , or provide callback_url when callback support is documented for the route.

Store completed outputs in your own system when result URLs are time-limited.

Core Request Parameters

modelstringRequiredDefault: gemini-omni

EvoLink model parameter for the Gemini Omni route. Confirm the live value before launch.

Examplegemini-omni

promptstringRequired

Text prompt describing the desired video workflow.

ExampleCreate a short product video with smooth camera motion and clean studio lighting

callback_urlstringOptional

Optional HTTPS callback for task completion when supported by the live route.

Notes

Use polling if callback_url is not enabled for the route
Store outputs promptly when result URLs are time-limited

Examplehttps://your-domain.com/webhooks/video-task-completed

Request Example

{
  "model": "gemini-omni",
  "prompt": "Create a short product video with smooth camera motion and clean studio lighting",
  "callback_url": "https://your-domain.com/webhooks/video-task-completed"
}

Response Example

{
  "id": "task-video-xxxxxxxx",
  "model": "gemini-omni",
  "object": "video.generation.task",
  "status": "pending",
  "progress": 0,
  "task_info": {
    "can_cancel": true
  },
  "type": "video"
}