对比 Gemini API 路由
从任务出发选择:旗舰推理、生产级 Flash 流量、低成本提取,或长上下文多模态分析。
| 路由 | 适合场景 | 价格 | 上下文窗口 | 模态 | 状态 |
|---|---|---|---|---|---|
| 最高质量的 Gemini 推理、编程、agent 和长上下文分析。 | $2/$12 <=200K; $4/$18 >200K | 1M input / 64K output | 文本、代码、图片、视频、音频、PDF 输入 | Preview flagship | |
Gemini 3 Flash Preview 高速 Gemini 3 | 需要 Gemini 3 能力和低延迟响应的多模态应用。 | $0.50/$3.00 per MTok (audio in: $1.00) | 1M input / 64K output | 文本、图片、视频、音频、PDF 输入 | Preview route |
Gemini 3.1 Flash Lite Preview 最低价 Gemini 3 | 大批量翻译、分类、提取和文本批处理任务。 | $0.25/$1.50 per MTok (audio in: $0.50) | 1M input / 64K output | 文本、图片、视频、音频、PDF 输入 | Preview route |
Gemini 2.5 Pro 稳定 Pro | 生产级推理、编程辅助、分析和复杂多模态任务。 | $1.25/$10 <=200K; $2.50/$15 >200K | 1M input / 64K output | 文本、图片、视频、音频、PDF 输入 | Stable deep reasoning |
Gemini 2.5 Flash 生产级 Flash | 快速聊天、提取、摘要和多模态生产流量。 | $0.30/$2.50 per MTok (audio in: $1.00) | 1M input / 64K output | 文本、图片、视频、音频、PDF 输入 | Production workhorse |
| 高并发分类、提取、路由和轻量聊天流程。 | $0.10/$0.40 per MTok (audio in: $0.30) | 1M input / 64K output | 文本和音频输入 | Lowest-cost text route |
如何判断该用哪个 Gemini 模型
按以下 4 条规则在 Pro、Flash 和 Lite 之间快速缩小选择范围。
先看推理深度
复杂编程 agent、多步工具调用、深度文档分析和高精度输出——首选 Gemini 3.1 Pro 或 Gemini 2.5 Pro。
再看延迟和吞吐需求
生产级聊天、客服机器人、实时提取和高频多模态应用——对比 Gemini 3 Flash 或 Gemini 2.5 Flash。
再看成本敏感度
大批量分类、文本批处理、路由分发和轻量提取——对比 Gemini 3.1 Flash Lite 或 Gemini 2.5 Flash Lite。
如果你已经清楚任务类型,可以在下表中找到推荐的起点。
按场景选择 Gemini 模型:推理、速度、成本和多模态任务
将你的主要任务匹配到合适的 Gemini 路由。
| 你的任务 | 推荐起点 | 适合场景 | 注意事项 |
|---|---|---|---|
| 复杂推理和编程 agent | Gemini 3.1 Pro | 需要最高质量的 Gemini 推理、多步工具调用或深度代码分析 | 成本较高——简单任务用 Flash |
| 稳定深度推理 + 多模态 | Gemini 2.5 Pro | 需要生产级推理能力、广泛多模态支持和经过验证的稳定性 | 能力上限略低于 3.1 Pro |
| 低延迟多模态应用 | Gemini 3 Flash | 需要 Gemini 3 代能力的快速响应,覆盖文本、图像、音频和视频 | Preview 路由——请确认稳定性要求 |
| 生产级聊天和提取 | Gemini 2.5 Flash | 需要经过验证的生产级主力模型,处理聊天、摘要和大规模提取 | 大多数生产任务的良好默认选择 |
| 最低成本的大批量文本 | Gemini 2.5 Flash Lite | 任务是分类、路由或短回复,成本控制最重要 | 仅支持文本和音频输入 |
| 混合复杂度的文本任务 | EvoLink Smart Router | 同一流水线中既有简单任务也有复杂任务,跨 Gemini 和其他供应商 | 不想维护手动模型路由逻辑时最佳 |
Gemini API 工作流:agent、聊天、文档和多模态处理
看看 Gemini 模型如何融入真实产品、agent 和内容处理流水线。
推理和编程 agent
用于代码生成、bug 修复、多步工具调用和复杂分析 agent。如果输出质量直接影响产品表现,从 Gemini 3.1 Pro 开始测试;需要更稳定的表现则对比 Gemini 2.5 Pro。
生产级聊天和客服
用于客服机器人、应用内助手、知识库问答和高频多轮对话。先用 Gemini 2.5 Flash 测试吞吐性能,再对比 Flash Lite 降低成本。
长文档和多模态分析
用于 PDF 分析、视频理解、音频转录和多文件研究工作流。Gemini 的 1M 上下文窗口和原生多模态支持让 Pro 和 Flash 路由成为强有力的选择。
Agent 路由与混合任务
分类、提取、推理和生成共存于同一流水线的场景。使用 EvoLink Smart Router 通过 evolink/auto 在 Gemini 和其他供应商之间自动路由。
查看 Gemini 模型详情
在此页面对比后,访问各模型页面查看价格详情、Playground 和集成指南。
Gemini 3.1 Pro Preview
旗舰推理
- 上下文
- 1M input / 64K output
- 价格
- $2/$12 <=200K; $4/$18 >200K
Gemini 3 Flash Preview
高速 Gemini 3
- 上下文
- 1M input / 64K output
- 价格
- $0.50/$3.00 per MTok (audio in: $1.00)
Gemini 3.1 Flash Lite Preview
最低价 Gemini 3
- 上下文
- 1M input / 64K output
- 价格
- $0.25/$1.50 per MTok (audio in: $0.50)
Gemini 2.5 Pro
稳定 Pro
- 上下文
- 1M input / 64K output
- 价格
- $1.25/$10 <=200K; $2.50/$15 >200K
Gemini 2.5 Flash
生产级 Flash
- 上下文
- 1M input / 64K output
- 价格
- $0.30/$2.50 per MTok (audio in: $1.00)
Gemini 2.5 Flash Lite
最低成本
- 上下文
- 1M input / 64K output
- 价格
- $0.10/$0.40 per MTok (audio in: $0.30)
通过一个 EvoLink API 访问所有 Gemini 模型
全部 6 条 Gemini 路由均通过单个 EvoLink API key 和 OpenAI 兼容端点提供。只需更改 model 参数即可在 Pro、Flash 和 Lite 之间切换,无需额外账号或密钥。
将 model="gemini-3.1-pro" 改为 model="gemini-2.5-flash",无需重构集成。如何看待 Gemini API 成本:Pro vs Flash vs Lite
Pro 路由:推理价值证明溢价合理
Gemini 3.1 Pro 和 2.5 Pro 的每 token 成本更高,但复杂编程 agent、深度文档分析和多步工具调用产出更高价值。不要为简单提取或分类默认使用 Pro。
Flash 路由:生产流量的最佳平衡
Gemini 3 Flash 和 2.5 Flash 以 Pro 价格的零头提供强大的多模态能力。在考虑 Pro 之前,先用这些路由处理聊天、摘要和大规模提取。
Lite 路由:最大限度降低简单高并发任务成本
Gemini 3.1 Flash Lite 和 2.5 Flash Lite 提供最低的每 token 成本。用于分类、路由、批量文本和短回复等不需要深度推理的场景。
价格概览
Gemini 路由价格从 $0.10/MTok 输入(Flash Lite)到 $4.00/MTok 输入(Pro >200K),全部通过 EvoLink 按 token 计费。
Gemini 3.1 Pro
$2/$12 — $4/$18 /MTok
Context: 1M
旗舰推理,1M 上下文。分级定价:200K 以内 $2/$12,200K 以上 $4/$18。
Gemini 3 Flash
$0.50/$3.00 /MTok
Context: 1M
Gemini 3 代 Flash 路由,$0.50/$3.00 per MTok,1M 上下文。
Gemini 3.1 Flash Lite
$0.25/$1.50 /MTok
Context: 1M
最便宜的 Gemini 3 路由,$0.25/$1.50 per MTok,适合批量文本。
Gemini 2.5 Pro
$1.25/$10 — $2.50/$15 /MTok
Context: 1M
稳定深度推理,200K 以内 $1.25/$10,200K 以上 $2.50/$15。
Gemini 2.5 Flash
$0.30/$2.50 /MTok
Context: 1M
生产主力,$0.30/$2.50 per MTok,支持全多模态。
Gemini 2.5 Flash Lite
$0.10/$0.40 /MTok
Context: 1M
最低成本 Gemini 路由,$0.10/$0.40 per MTok,支持文本和音频。
Gemini 指南与对比
在选择路由前,可以参考这些指南获取更多背景信息。
Gemini API 常见问题
Everything you need to know about the product and billing.