Gemini Omni API
Google Gemini Omni API — AI 视频生成模型
通过 EvoLink 的单一 API key 调用 Gemini Omni API,运行 Google 的对话式视频模型,实现文生视频、图生视频和对话式编辑。与 Veo 3.1 不同,Gemini Omni 将编辑作为核心能力 — 在对话中逐步精修片段,无需从头重新生成。 通过 EvoLink 全球可用,支持异步任务工作流、回调通知,无需 Google Cloud 项目。上方的定价标签页展示了 Pro 和 Flash 路由的当前费率。

Gemini Omni API 能做什么?
对话式视频编辑
用 Gemini Omni 生成一段视频,然后在对话中逐步精修——「让光线更暖一些」「把红色汽车替换掉」。模型只重写受影响的帧,其余部分保持像素级稳定,无需从头重新生成。




Gemini Omni 横向对比 — 所有模型共用一个 EvoLink API key
Gemini Omni 并非画质标杆 — Seedance 2.0 目前在公开基准测试中领先。Gemini Omni 的优势在于工作流:对话式编辑、长上下文一致性,以及 Google 视频模型中最简洁的生产接入路径。
对话原生编辑工作流
Gemini Omni 是目前唯一将编辑作为核心能力的主流 Google 视频模型。Veo 3.1 和 Seedance 2.0 以生成为主。在多轮精修场景下,这是结构性差异。
长上下文角色一致性
Gemini Omni 继承了 Gemini 的长上下文窗口,可在同一任务的多个镜头中保持角色、服装和道具的一致性,减少分镜制作中的手动参考管理工作。
无需 Google Cloud 项目 — 与 Veo、Seedance 相同的异步模式
无需 GCP 配置、无需 Vertex 计费、无需单独的区域审批。如果你已通过 EvoLink 运行视频生成,接入 Gemini Omni 只需改一个参数 — 请求结构、任务生命周期与 Veo 3.1、Seedance 2.0、Kling 完全一致。
Gemini Omni vs Veo 3.1 vs Seedance 2.0 — 详细对比
2026 年生产级视频工作流中最常被候选的三个模型,均可通过一个 EvoLink API key 访问。
| 功能 | Gemini Omni | Veo 3.1 | Seedance 2.0 |
|---|---|---|---|
| EvoLink 价格 | TBC | From $0.50/s | From $0.092/s |
| 画质 | 720p / 1080p (TBC) | 720p / 1080p / 4K | 480p / 720p / 1080p |
| 原生音频 | 支持 | 支持 | 支持 |
| 参考控制 | 文本 + 图片 + 对话编辑 | 文本 + 图片 | 文本 + 图片 + 视频 + 音频 |
| 视频时长 | ~10s | 4–8s + 16s 扩展 | 4–15s |
| 编辑能力 | 对话原生,多轮交互 | 以生成为主 | V2V 模式 |
| 最适合 | 编辑密集型工作流 | 电影级基准 | 多模态参考生产 |
如何接入 Gemini Omni API
三步完成你的第一个 Gemini Omni 视频任务,接入模式与 Veo 3.1、Seedance 2.0、Kling 3.0 一致。
Step 1 — 获取 API Key
在 EvoLink.ai 注册并在控制台生成你的 API key,无需 Google Cloud 项目。
Step 2 — 提交生成任务
向 /v1/videos/generations 发送 POST 请求,指定 model 为 gemini-omni-pro(或 gemini-omni-flash)并填写 prompt。可选传入参考图 URL 实现图生视频,以及 callback_url 接收完成通知。API 异步处理并返回 task_id。
Step 3 — 获取视频结果
使用 task_id 轮询状态接口,或等待 callback_url webhook 回调。当状态变为 completed 时,你将获得生成的 MP4 下载链接,链接有效期 24 小时。
Gemini Omni API 能力总览
面向生产视频工作流的技术规格。
对话式视频编辑
在同一对话线程中多轮精修,仅受影响的帧重新渲染。
最高 1080p,约 10 秒片段
支持 720p 和 1080p 输出,片段时长约 10 秒。适用于短视频内容和分镜制作。
文生视频与图生视频
支持 T2V 文本提示生成和 I2V 参考图输入。对话编辑适用于两种模式的输出。
原生同步音频
画面和音频联合生成 — 对话、环境音、撞击音效与画面动作精准同步。
长上下文角色一致性
继承 Gemini 的长上下文窗口,在同一任务的多个镜头中保持角色和道具一致。
异步 API — 支持 Task ID 和回调
提交任务后获取 ID,轮询状态或配置 callback_url。与 EvoLink 其他视频模型的生命周期一致。
费用示例 — Gemini Omni 定价预估
100 × 10s 片段(社交媒体批量生成)
定价即将公布
1,000 × 10s 片段/月(生产规模)
定价即将公布
1 次生成 + 3 次编辑(多轮工作流)
定价即将公布
先用 gemini-omni-flash 快速迭代,再将优选结果提升至 gemini-omni-pro。路由上线后将公布详细定价。
Gemini Omni API 常见问题
Everything you need to know about the product and billing.
全部 Gemini 视频 API 模型
EvoLink 通过单一 API key 提供对 Google 视频与媒体模型家族的统一访问。 所有模型共享同一 EvoLink API 端点,切换模型只需更改一个参数。
API Reference
Select endpoint
Authentication
All APIs require Bearer Token authentication.
Authorization:
Bearer YOUR_API_KEY/v1/videos/generationsCreate Gemini Omni Video Task
Submit a Gemini Omni video task through EvoLink using the live supported request fields.
Asynchronous processing returns a task ID. Use it to , or provide callback_url when callback support is documented for the route.
Store completed outputs in your own system when result URLs are time-limited.
Core Request Parameters
modelstringRequiredDefault: gemini-omniEvoLink model parameter for the Gemini Omni route. Confirm the live value before launch.
gemini-omnipromptstringRequiredText prompt describing the desired video workflow.
Create a short product video with smooth camera motion and clean studio lightingcallback_urlstringOptionalOptional HTTPS callback for task completion when supported by the live route.
Notes
- Use polling if callback_url is not enabled for the route
- Store outputs promptly when result URLs are time-limited
https://your-domain.com/webhooks/video-task-completed