Gemini Omni 即将上线了解更多

Gemini Omni API

EvoLink 上的 Gemini Omni API — 一个 API key 搞定视频生成与对话式编辑,支持异步任务工作流和回调通知。
模型类型:

稳定性最高,保证 99.9% 可用性。推荐用于生产环境。

所有版本使用同一个 API 端点,仅 model 参数不同。

Google Gemini Omni API — AI 视频生成模型

通过 EvoLink 的单一 API key 调用 Gemini Omni API,运行 Google 的对话式视频模型,实现文生视频、图生视频和对话式编辑。与 Veo 3.1 不同,Gemini Omni 将编辑作为核心能力 — 在对话中逐步精修片段,无需从头重新生成。 通过 EvoLink 全球可用,支持异步任务工作流、回调通知,无需 Google Cloud 项目。上方的定价标签页展示了 Pro 和 Flash 路由的当前费率。

EvoLink 上的 Gemini Omni API 视频工作流

Gemini Omni API 能做什么?

对话式视频编辑

用 Gemini Omni 生成一段视频,然后在对话中逐步精修——「让光线更暖一些」「把红色汽车替换掉」。模型只重写受影响的帧,其余部分保持像素级稳定,无需从头重新生成。

Gemini Omni 对话式视频编辑

物体替换与场景改写

替换画面中的物体、移除多余元素,或在保留身份和运动的前提下改写场景。适用于广告创意迭代和产品变体渲染,无需外部编辑工具。

Gemini Omni 物体替换与场景改写

参考图工作流

传入一张参考图,Gemini Omni 会在生成视频中锚定角色身份、光线和色彩。结合对话式编辑,可在不破坏视觉一致性的前提下精修特定镜头。

Gemini Omni 参考图工作流

原生音视频同步生成

Gemini Omni 在一次推理中同时输出同步的音频和视频 — 脚步声匹配落地瞬间,对话匹配唇部动作,无需单独的 TTS 或音效设计流程。

Gemini Omni 原生音视频同步生成

Gemini Omni 横向对比 — 所有模型共用一个 EvoLink API key

Gemini Omni 并非画质标杆 — Seedance 2.0 目前在公开基准测试中领先。Gemini Omni 的优势在于工作流:对话式编辑、长上下文一致性,以及 Google 视频模型中最简洁的生产接入路径。

对话原生编辑工作流

Gemini Omni 是目前唯一将编辑作为核心能力的主流 Google 视频模型。Veo 3.1 和 Seedance 2.0 以生成为主。在多轮精修场景下,这是结构性差异。

长上下文角色一致性

Gemini Omni 继承了 Gemini 的长上下文窗口,可在同一任务的多个镜头中保持角色、服装和道具的一致性,减少分镜制作中的手动参考管理工作。

无需 Google Cloud 项目 — 与 Veo、Seedance 相同的异步模式

无需 GCP 配置、无需 Vertex 计费、无需单独的区域审批。如果你已通过 EvoLink 运行视频生成,接入 Gemini Omni 只需改一个参数 — 请求结构、任务生命周期与 Veo 3.1、Seedance 2.0、Kling 完全一致。

Gemini Omni vs Veo 3.1 vs Seedance 2.0 — 详细对比

2026 年生产级视频工作流中最常被候选的三个模型,均可通过一个 EvoLink API key 访问。

功能Gemini OmniVeo 3.1Seedance 2.0
EvoLink 价格TBCFrom $0.50/sFrom $0.092/s
画质720p / 1080p (TBC)720p / 1080p / 4K480p / 720p / 1080p
原生音频支持支持支持
参考控制文本 + 图片 + 对话编辑文本 + 图片文本 + 图片 + 视频 + 音频
视频时长~10s4–8s + 16s 扩展4–15s
编辑能力对话原生,多轮交互以生成为主V2V 模式
最适合编辑密集型工作流电影级基准多模态参考生产

如何接入 Gemini Omni API

三步完成你的第一个 Gemini Omni 视频任务,接入模式与 Veo 3.1、Seedance 2.0、Kling 3.0 一致。

1

Step 1 — 获取 API Key

在 EvoLink.ai 注册并在控制台生成你的 API key,无需 Google Cloud 项目。

2

Step 2 — 提交生成任务

向 /v1/videos/generations 发送 POST 请求,指定 model 为 gemini-omni-pro(或 gemini-omni-flash)并填写 prompt。可选传入参考图 URL 实现图生视频,以及 callback_url 接收完成通知。API 异步处理并返回 task_id。

3

Step 3 — 获取视频结果

使用 task_id 轮询状态接口,或等待 callback_url webhook 回调。当状态变为 completed 时,你将获得生成的 MP4 下载链接,链接有效期 24 小时。

Gemini Omni API 能力总览

面向生产视频工作流的技术规格。

编辑

对话式视频编辑

在同一对话线程中多轮精修,仅受影响的帧重新渲染。

输出

最高 1080p,约 10 秒片段

支持 720p 和 1080p 输出,片段时长约 10 秒。适用于短视频内容和分镜制作。

模式

文生视频与图生视频

支持 T2V 文本提示生成和 I2V 参考图输入。对话编辑适用于两种模式的输出。

音频

原生同步音频

画面和音频联合生成 — 对话、环境音、撞击音效与画面动作精准同步。

一致性

长上下文角色一致性

继承 Gemini 的长上下文窗口,在同一任务的多个镜头中保持角色和道具一致。

工作流

异步 API — 支持 Task ID 和回调

提交任务后获取 ID,轮询状态或配置 callback_url。与 EvoLink 其他视频模型的生命周期一致。

费用示例 — Gemini Omni 定价预估

100 × 10s 片段(社交媒体批量生成)

定价即将公布

1,000 × 10s 片段/月(生产规模)

定价即将公布

1 次生成 + 3 次编辑(多轮工作流)

定价即将公布

先用 gemini-omni-flash 快速迭代,再将优选结果提升至 gemini-omni-pro。路由上线后将公布详细定价。

Gemini Omni API 常见问题

Everything you need to know about the product and billing.

Gemini Omni 是 Google 在 Google I/O 2026 发布的对话式视频生成模型。Veo 3.1 以生成为核心,擅长电影级文生视频和图生视频输出;而 Gemini Omni 将编辑作为一等能力。Veo 3.1 在原始电影级画质和 4K 输出上仍然领先,Gemini Omni 则在多轮编辑工作流上更具优势。
按任务计费,提供两条路由:gemini-omni-pro 用于高质量输出,gemini-omni-flash 用于低成本迭代。音频生成已包含在内。请查看上方定价表了解当前费率。
不需要。EvoLink 通过一个 API key 提供访问,无需 Google Cloud 项目、无需 Vertex 计费、无需单独的区域审批。认证方式与 EvoLink 上的 Veo 3.1 和 Seedance 2.0 完全一致。
Pro 是高画质路由,适合生产级输出。Flash 是低成本路由,适合快速迭代和 A/B 测试。两者共享相同的异步 API — 只需切换 model 参数即可。
支持。提交任务时传入 callback_url(HTTPS),任务完成、失败或取消时 EvoLink 会向你的端点发送 POST 请求。失败的回调最多重试 3 次,退避间隔为 1s/2s/4s。也可以轮询任务状态接口。
失败任务会返回 failed 状态并附带错误原因。失败任务不计费。应用层重试时,可将任务视为幂等操作,使用相同参数重新提交即可。
可以 — 这正是 Gemini Omni 的核心差异化能力。传入之前的 task ID 和自然语言编辑指令,模型只会重写受影响的帧。支持在单个任务中进行多轮编辑。
当前路由生成的片段最长约 10 秒。对于更长的叙事,可利用长上下文角色一致性将多个片段串联起来。
支持。传入参考图 URL,Gemini Omni 会将其作为生成视频的身份锚点。
Seedance 2.0 在纯文生视频基准测试中领先,且支持最广泛的多模态参考输入。Veo 3.1 是电影级基准,支持 4K 和 16 秒扩展。Gemini Omni 的差异化优势在于对话式编辑和长上下文一致性。
可以。EvoLink 通过单一 API key 提供 Gemini Omni、Veo 3.1、Nano Banana 2 以及 Gemini 全系列模型的统一访问。切换模型只需更改 model 参数。

全部 Gemini 视频 API 模型

EvoLink 通过单一 API key 提供对 Google 视频与媒体模型家族的统一访问。 所有模型共享同一 EvoLink API 端点,切换模型只需更改一个参数。

POST
/v1/videos/generations

Create Gemini Omni Video Task

Confirm live route fields before production use

Submit a Gemini Omni video task through EvoLink using the live supported request fields.

Asynchronous processing returns a task ID. Use it to , or provide callback_url when callback support is documented for the route.

Store completed outputs in your own system when result URLs are time-limited.

Core Request Parameters

modelstringRequiredDefault: gemini-omni

EvoLink model parameter for the Gemini Omni route. Confirm the live value before launch.

Examplegemini-omni
promptstringRequired

Text prompt describing the desired video workflow.

ExampleCreate a short product video with smooth camera motion and clean studio lighting
callback_urlstringOptional

Optional HTTPS callback for task completion when supported by the live route.

Notes
  • Use polling if callback_url is not enabled for the route
  • Store outputs promptly when result URLs are time-limited
Examplehttps://your-domain.com/webhooks/video-task-completed

Request Example

{
  "model": "gemini-omni",
  "prompt": "Create a short product video with smooth camera motion and clean studio lighting",
  "callback_url": "https://your-domain.com/webhooks/video-task-completed"
}

Response Example

{
  "id": "task-video-xxxxxxxx",
  "model": "gemini-omni",
  "object": "video.generation.task",
  "status": "pending",
  "progress": 0,
  "task_info": {
    "can_cancel": true
  },
  "type": "video"
}