HappyHorse 1.0 正式上线立即体验
Gemini 模型系列

Gemini API 模型系列

通过一个 EvoLink API 访问所有 Gemini 模型。对比 Gemini 3.1 Pro、3 Flash、3.1 Flash Lite、2.5 Pro、2.5 Flash 和 2.5 Flash Lite 的价格、上下文窗口、模态和推理能力,然后为你的任务选择合适的路由。

对比 Gemini API 路由

从任务出发选择:旗舰推理、生产级 Flash 流量、低成本提取,或长上下文多模态分析。

路由适合场景价格上下文窗口模态状态
最高质量的 Gemini 推理、编程、agent 和长上下文分析。$2/$12 <=200K; $4/$18 >200K1M input / 64K output文本、代码、图片、视频、音频、PDF 输入Preview flagship
Gemini 3 Flash Preview

高速 Gemini 3

需要 Gemini 3 能力和低延迟响应的多模态应用。$0.50/$3.00 per MTok (audio in: $1.00)1M input / 64K output文本、图片、视频、音频、PDF 输入Preview route
大批量翻译、分类、提取和文本批处理任务。$0.25/$1.50 per MTok (audio in: $0.50)1M input / 64K output文本、图片、视频、音频、PDF 输入Preview route
Gemini 2.5 Pro

稳定 Pro

生产级推理、编程辅助、分析和复杂多模态任务。$1.25/$10 <=200K; $2.50/$15 >200K1M input / 64K output文本、图片、视频、音频、PDF 输入Stable deep reasoning
Gemini 2.5 Flash

生产级 Flash

快速聊天、提取、摘要和多模态生产流量。$0.30/$2.50 per MTok (audio in: $1.00)1M input / 64K output文本、图片、视频、音频、PDF 输入Production workhorse
高并发分类、提取、路由和轻量聊天流程。$0.10/$0.40 per MTok (audio in: $0.30)1M input / 64K output文本和音频输入Lowest-cost text route

如何判断该用哪个 Gemini 模型

按以下 4 条规则在 Pro、Flash 和 Lite 之间快速缩小选择范围。

1

先看推理深度

复杂编程 agent、多步工具调用、深度文档分析和高精度输出——首选 Gemini 3.1 Pro 或 Gemini 2.5 Pro。

2

再看延迟和吞吐需求

生产级聊天、客服机器人、实时提取和高频多模态应用——对比 Gemini 3 Flash 或 Gemini 2.5 Flash。

3

再看成本敏感度

大批量分类、文本批处理、路由分发和轻量提取——对比 Gemini 3.1 Flash Lite 或 Gemini 2.5 Flash Lite。

4

最后考虑混合复杂度场景

如果同一流水线混合了简单分类和深度推理步骤,可以考虑 EvoLink Smart Router 而不是固定一个 Gemini 模型。

Smart Router →

如果你已经清楚任务类型,可以在下表中找到推荐的起点。

按场景选择 Gemini 模型:推理、速度、成本和多模态任务

将你的主要任务匹配到合适的 Gemini 路由。

你的任务推荐起点适合场景注意事项
复杂推理和编程 agentGemini 3.1 Pro需要最高质量的 Gemini 推理、多步工具调用或深度代码分析成本较高——简单任务用 Flash
稳定深度推理 + 多模态Gemini 2.5 Pro需要生产级推理能力、广泛多模态支持和经过验证的稳定性能力上限略低于 3.1 Pro
低延迟多模态应用Gemini 3 Flash需要 Gemini 3 代能力的快速响应,覆盖文本、图像、音频和视频Preview 路由——请确认稳定性要求
生产级聊天和提取Gemini 2.5 Flash需要经过验证的生产级主力模型,处理聊天、摘要和大规模提取大多数生产任务的良好默认选择
最低成本的大批量文本Gemini 2.5 Flash Lite任务是分类、路由或短回复,成本控制最重要仅支持文本和音频输入
混合复杂度的文本任务EvoLink Smart Router同一流水线中既有简单任务也有复杂任务,跨 Gemini 和其他供应商不想维护手动模型路由逻辑时最佳

Gemini API 工作流:agent、聊天、文档和多模态处理

看看 Gemini 模型如何融入真实产品、agent 和内容处理流水线。

推理和编程 agent

用于代码生成、bug 修复、多步工具调用和复杂分析 agent。如果输出质量直接影响产品表现,从 Gemini 3.1 Pro 开始测试;需要更稳定的表现则对比 Gemini 2.5 Pro。

生产级聊天和客服

用于客服机器人、应用内助手、知识库问答和高频多轮对话。先用 Gemini 2.5 Flash 测试吞吐性能,再对比 Flash Lite 降低成本。

长文档和多模态分析

用于 PDF 分析、视频理解、音频转录和多文件研究工作流。Gemini 的 1M 上下文窗口和原生多模态支持让 Pro 和 Flash 路由成为强有力的选择。

Agent 路由与混合任务

分类、提取、推理和生成共存于同一流水线的场景。使用 EvoLink Smart Router 通过 evolink/auto 在 Gemini 和其他供应商之间自动路由。

查看 Gemini 模型详情

在此页面对比后,访问各模型页面查看价格详情、Playground 和集成指南。

通过一个 EvoLink API 访问所有 Gemini 模型

全部 6 条 Gemini 路由均通过单个 EvoLink API key 和 OpenAI 兼容端点提供。只需更改 model 参数即可在 Pro、Flash 和 Lite 之间切换,无需额外账号或密钥。

将 model="gemini-3.1-pro" 改为 model="gemini-2.5-flash",无需重构集成。
一个 API key 访问所有 Gemini 模型
兼容 OpenAI 的接入端点
更改 model 参数即可切换模型
统一的账单和用量可视化

如何看待 Gemini API 成本:Pro vs Flash vs Lite

Pro 路由:推理价值证明溢价合理

Gemini 3.1 Pro 和 2.5 Pro 的每 token 成本更高,但复杂编程 agent、深度文档分析和多步工具调用产出更高价值。不要为简单提取或分类默认使用 Pro。

Flash 路由:生产流量的最佳平衡

Gemini 3 Flash 和 2.5 Flash 以 Pro 价格的零头提供强大的多模态能力。在考虑 Pro 之前,先用这些路由处理聊天、摘要和大规模提取。

Lite 路由:最大限度降低简单高并发任务成本

Gemini 3.1 Flash Lite 和 2.5 Flash Lite 提供最低的每 token 成本。用于分类、路由、批量文本和短回复等不需要深度推理的场景。

价格概览

Gemini 路由价格从 $0.10/MTok 输入(Flash Lite)到 $4.00/MTok 输入(Pro >200K),全部通过 EvoLink 按 token 计费。

Gemini 3.1 Pro

$2/$12 — $4/$18 /MTok

Context: 1M

旗舰推理,1M 上下文。分级定价:200K 以内 $2/$12,200K 以上 $4/$18。

Gemini 3 Flash

$0.50/$3.00 /MTok

Context: 1M

Gemini 3 代 Flash 路由,$0.50/$3.00 per MTok,1M 上下文。

Gemini 3.1 Flash Lite

$0.25/$1.50 /MTok

Context: 1M

最便宜的 Gemini 3 路由,$0.25/$1.50 per MTok,适合批量文本。

Gemini 2.5 Pro

$1.25/$10 — $2.50/$15 /MTok

Context: 1M

稳定深度推理,200K 以内 $1.25/$10,200K 以上 $2.50/$15。

Gemini 2.5 Flash

$0.30/$2.50 /MTok

Context: 1M

生产主力,$0.30/$2.50 per MTok,支持全多模态。

Gemini 2.5 Flash Lite

$0.10/$0.40 /MTok

Context: 1M

最低成本 Gemini 路由,$0.10/$0.40 per MTok,支持文本和音频。

Gemini 指南与对比

在选择路由前,可以参考这些指南获取更多背景信息。

Gemini API 常见问题

Everything you need to know about the product and billing.

追求最高推理质量选 Gemini 3.1 Pro,需要稳定深度推理选 Gemini 2.5 Pro,快速生产任务选 Gemini 2.5 Flash,成本优先选 Flash Lite。
适合。多条 Gemini 路由支持超大 context window,非常适合 PDF 分析、文档审阅、检索工作流和多文件推理。
回答质量、编程和多步推理优先时选 Pro;速度、生产吞吐量和可控成本优先时选 Flash。
EvoLink 提供 Gemini 3.1 Pro、Gemini 3 Flash Preview、Gemini 3.1 Flash Lite Preview、Gemini 2.5 Pro、Gemini 2.5 Flash 和 Gemini 2.5 Flash Lite。全部 6 条路由通过一个 API key 和 OpenAI 兼容端点访问。
Gemini 2.5 Flash Lite,$0.10/$0.40 per 1M tokens(输入/输出),是最低成本的 Gemini 路由。Gemini 3 代中最便宜的是 Flash Lite,$0.25/$1.50 per MTok。
可以。EvoLink 提供单个 API key 访问所有 Gemini 模型,以及 GPT、Claude 等 200+ 其他模型。只需更改 model 参数即可切换,无需额外账号或密钥。