Seedance 2.0 Mini 现已上线立即体验
Gemini 模型系列

Gemini API 模型系列

通过一个 EvoLink API 访问所有 Gemini 模型。对比 Gemini 3.1 Pro、3 Flash、3.1 Flash Lite、2.5 Pro、2.5 Flash 和 2.5 Flash Lite 的价格、上下文窗口、模态和推理能力,然后为你的任务选择合适的路由。

对比 Gemini API 路由

从任务出发选择:旗舰推理、生产级 Flash 流量、低成本提取,或长上下文多模态分析。

路由适合场景价格上下文窗口模态状态
最高质量的 Gemini 推理、编程、agent 和长上下文分析。$2/$12 <=200K; $4/$18 >200K1M input / 64K output文本、代码、图片、视频、音频、PDF 输入Preview flagship
Gemini 3.5 Flash

稳定版 — GA 可用于生产

Agentic 工作流、编程 agent、子 agent 部署和长周期生产任务,Flash 级别成本。$1.50/$9.00 per MTok1M input / 65K output文本、图片、视频、音频、PDF 输入Stable (GA)
Gemini 3 Flash Preview

高速 Gemini 3

需要 Gemini 3 能力和低延迟响应的多模态应用。$0.50/$3.00 per MTok (audio in: $1.00)1M input / 64K output文本、图片、视频、音频、PDF 输入Preview route
大批量翻译、分类、提取和文本批处理任务。$0.25/$1.50 per MTok (audio in: $0.50)1M input / 64K output文本、图片、视频、音频、PDF 输入Preview route
Gemini 2.5 Pro

稳定 Pro

生产级推理、编程辅助、分析和复杂多模态任务。$1.25/$10 <=200K; $2.50/$15 >200K1M input / 64K output文本、图片、视频、音频、PDF 输入Stable deep reasoning
Gemini 2.5 Flash

生产级 Flash

快速聊天、提取、摘要和多模态生产流量。$0.30/$2.50 per MTok (audio in: $1.00)1M input / 64K output文本、图片、视频、音频、PDF 输入Production workhorse
高并发分类、提取、路由和轻量聊天流程。$0.10/$0.40 per MTok (audio in: $0.30)1M input / 64K output文本和音频输入Lowest-cost text route

如何判断该用哪个 Gemini 模型

按以下 4 条规则在 Pro、Flash 和 Lite 之间快速缩小选择范围。

1

先看推理深度

复杂编程 agent、多步工具调用、深度文档分析和高精度输出——首选 Gemini 3.1 Pro 或 Gemini 2.5 Pro。

2

再看延迟和吞吐需求

生产级聊天、客服机器人、实时提取和高频多模态应用——对比 Gemini 3 Flash 或 Gemini 2.5 Flash。

3

再看成本敏感度

大批量分类、文本批处理、路由分发和轻量提取——对比 Gemini 3.1 Flash Lite 或 Gemini 2.5 Flash Lite。

4

最后考虑混合复杂度场景

如果同一流水线混合了简单分类和深度推理步骤,可以考虑 EvoLink Smart Router 而不是固定一个 Gemini 模型。

Smart Router →

如果你已经清楚任务类型,可以在下表中找到推荐的起点。

按场景选择 Gemini 模型:推理、速度、成本和多模态任务

将你的主要任务匹配到合适的 Gemini 路由。

你的任务推荐起点适合场景注意事项
复杂推理和编程 agentGemini 3.1 Pro需要最高质量的 Gemini 推理、多步工具调用或深度代码分析成本较高——简单任务用 Flash
稳定深度推理 + 多模态Gemini 2.5 Pro需要生产级推理能力、广泛多模态支持和经过验证的稳定性能力上限略低于 3.1 Pro
Agentic 工作流和编程 agentGemini 3.5 Flash需要以 Flash 级别成本获得前沿智能,用于编程 agent、子 agent 循环和长周期任务GA 稳定版 — agent 工作负载的默认 Flash
低延迟多模态应用Gemini 3 Flash需要 Gemini 3 代能力的快速响应,覆盖文本、图像、音频和视频Preview 路由——请确认稳定性要求
生产级聊天和提取Gemini 2.5 Flash需要经过验证的生产级主力模型,处理聊天、摘要和大规模提取大多数生产任务的良好默认选择
最低成本的大批量文本Gemini 2.5 Flash Lite任务是分类、路由或短回复,成本控制最重要仅支持文本和音频输入
混合复杂度的文本任务EvoLink Smart Router同一流水线中既有简单任务也有复杂任务,跨 Gemini 和其他供应商不想维护手动模型路由逻辑时最佳

Gemini API 工作流:agent、聊天、文档和多模态处理

看看 Gemini 模型如何融入真实产品、agent 和内容处理流水线。

推理和编程 agent

用于代码生成、bug 修复、多步工具调用和复杂分析 agent。如果输出质量直接影响产品表现,从 Gemini 3.1 Pro 开始测试;需要更稳定的表现则对比 Gemini 2.5 Pro。

生产级聊天和客服

用于客服机器人、应用内助手、知识库问答和高频多轮对话。先用 Gemini 2.5 Flash 测试吞吐性能,再对比 Flash Lite 降低成本。

长文档和多模态分析

用于 PDF 分析、视频理解、音频转录和多文件研究工作流。Gemini 的 1M 上下文窗口和原生多模态支持让 Pro 和 Flash 路由成为强有力的选择。

Agent 路由与混合任务

分类、提取、推理和生成共存于同一流水线的场景。使用 EvoLink Smart Router 通过 evolink/auto 在 Gemini 和其他供应商之间自动路由。

查看 Gemini 模型详情

在此页面对比后,访问各模型页面查看价格详情、Playground 和集成指南。

通过一个 EvoLink API 访问所有 Gemini 模型

全部 7 条 Gemini 路由均通过单个 EvoLink API key 和 OpenAI 兼容端点提供。只需更改 model 参数即可在 Pro、Flash 和 Lite 之间切换,无需额外账号或密钥。

将 model="gemini-3.1-pro" 改为 model="gemini-2.5-flash",无需重构集成。
一个 API key 访问所有 Gemini 模型
兼容 OpenAI 的接入端点
更改 model 参数即可切换模型
统一的账单和用量可视化

如何看待 Gemini API 成本:Pro vs Flash vs Lite

Pro 路由:推理价值证明溢价合理

Gemini 3.1 Pro 和 2.5 Pro 的每 token 成本更高,但复杂编程 agent、深度文档分析和多步工具调用产出更高价值。不要为简单提取或分类默认使用 Pro。

Flash 路由:生产流量的最佳平衡

Gemini 3 Flash 和 2.5 Flash 以 Pro 价格的零头提供强大的多模态能力。在考虑 Pro 之前,先用这些路由处理聊天、摘要和大规模提取。

Lite 路由:最大限度降低简单高并发任务成本

Gemini 3.1 Flash Lite 和 2.5 Flash Lite 提供最低的每 token 成本。用于分类、路由、批量文本和短回复等不需要深度推理的场景。

价格概览

Gemini 路由价格从 $0.10/MTok 输入(Flash Lite)到 $4.00/MTok 输入(Pro >200K),全部通过 EvoLink 按 token 计费。

Gemini 3.1 Pro

$2/$12 — $4/$18 /MTok

Context: 1M

旗舰推理,1M 上下文。分级定价:200K 以内 $2/$12,200K 以上 $4/$18。

Gemini 3.5 Flash

$1.50/$9.00 /MTok

Context: 1M

GA 稳定版 Flash,适合 agentic 工作流和编程,$1.50/$9.00 per MTok,1M 上下文,内置推理。

Gemini 3 Flash

$0.50/$3.00 /MTok

Context: 1M

Gemini 3 代 Flash 路由,$0.50/$3.00 per MTok,1M 上下文。

Gemini 3.1 Flash Lite

$0.25/$1.50 /MTok

Context: 1M

最便宜的 Gemini 3 路由,$0.25/$1.50 per MTok,适合批量文本。

Gemini 2.5 Pro

$1.25/$10 — $2.50/$15 /MTok

Context: 1M

稳定深度推理,200K 以内 $1.25/$10,200K 以上 $2.50/$15。

Gemini 2.5 Flash

$0.30/$2.50 /MTok

Context: 1M

生产主力,$0.30/$2.50 per MTok,支持全多模态。

Gemini 2.5 Flash Lite

$0.10/$0.40 /MTok

Context: 1M

最低成本 Gemini 路由,$0.10/$0.40 per MTok,支持文本和音频。

Gemini 指南与对比

在选择路由前,可以参考这些指南获取更多背景信息。

Gemini API 常见问题

Everything you need to know about the product and billing.

追求最高推理质量选 Gemini 3.1 Pro,agentic 工作流和编程 agent 选 Gemini 3.5 Flash,需要稳定深度推理选 Gemini 2.5 Pro,快速生产任务选 Gemini 2.5 Flash,成本优先选 Flash Lite。
适合。多条 Gemini 路由支持超大 context window,非常适合 PDF 分析、文档审阅、检索工作流和多文件推理。
回答质量、编程和多步推理优先时选 Pro;速度、生产吞吐量和可控成本优先时选 Flash。
EvoLink 提供 Gemini 3.1 Pro、Gemini 3.5 Flash、Gemini 3 Flash Preview、Gemini 3.1 Flash Lite Preview、Gemini 2.5 Pro、Gemini 2.5 Flash 和 Gemini 2.5 Flash Lite。全部 7 条路由通过一个 API key 和 OpenAI 兼容端点访问。
Gemini 2.5 Flash Lite,$0.10/$0.40 per 1M tokens(输入/输出),是最低成本的 Gemini 路由。Gemini 3 代中最便宜的是 Flash Lite,$0.25/$1.50 per MTok。
可以。EvoLink 提供单个 API key 访问所有 Gemini 模型,以及 GPT、Claude 等 200+ 其他模型。只需更改 model 参数即可切换,无需额外账号或密钥。