
Gemini 3.5 Flash 与 Gemini 3 Flash Preview 对比:定价、上下文窗口与迁移指南

要点速览
- Gemini 3 Flash Preview 仍然是更便宜的选择,
$0.50/$3.00/ 1M tokens(输入/输出)。适合对成本敏感、吞吐量大、且能接受 Preview 状态的场景。 - Gemini 3.5 Flash 价格是
$1.50/$9.00/ 1M tokens,但它是稳定的 GA 模型,在推理、函数调用和结构化输出方面有明显增强,适合 Agent 工作流。 - 两者共享 1M token 上下文窗口和 65,536 token 输出上限。
- API 层面的迁移很简单(换个模型 ID),但预算影响不小——切之前先算账。
详细对比表
| 维度 | Gemini 3.5 Flash | Gemini 3 Flash Preview |
|---|---|---|
| Model ID | gemini-3.5-flash | gemini-3-flash-preview |
| 状态 | 稳定版 (GA) | Preview |
| 输入定价 | $1.50 / 1M tokens | $0.50 / 1M tokens |
| 输出定价 | $9.00 / 1M tokens | $3.00 / 1M tokens |
| 缓存命中定价 | $0.15 / 1M tokens | $0.05 / 1M tokens |
| 音频输入定价 | $1.50 / 1M tokens | $1.00 / 1M tokens |
| 上下文窗口 | 1,000,000 tokens | 1,048,576 tokens |
| 输出上限 | 65,536 tokens | 65,536 tokens |
| 多模态输入 | Text, image, video, audio, PDF | Text, image, video, audio, PDF |
| 函数调用 | Yes | Yes |
| 结构化输出 | Yes | Yes |
| 代码执行 | Yes | Yes |
| Context caching | Yes | Yes |
| Batch API | Yes | Yes |
| Google Search grounding | Yes | Yes |
| 内置推理 | Yes(增强版) | Yes |
什么情况下继续用 Gemini 3 Flash Preview
Gemini 3 Flash Preview 在以下场景依然是更好的选择:
成本是第一优先级
$0.50、输出 $3.00 / 1M tokens,Gemini 3 Flash Preview 比 Gemini 3.5 Flash 便宜 3 倍。对于大量的分类、提取、格式化、路由等任务,如果现有质量已经够用,成本差异会快速累积。| 模型 | 日均输入成本 | 日均输出成本 | 日均总计 | 月均总计 |
|---|---|---|---|---|
| Gemini 3 Flash Preview | $5.00 | $6.00 | $11.00 | $330 |
| Gemini 3.5 Flash | $15.00 | $18.00 | $33.00 | $990 |
单条 Pipeline 一个月差 $660。
能接受 Preview 状态
如果你的工作负载能容忍偶尔的 API 行为变更,而且你已经在处理 Preview 模型的各种问题(版本锁定、更新后测试),那继续留在 Gemini 3 Flash Preview 可以省掉不必要的迁移成本。
现有质量满足验收标准
如果你现在的 Gemini 3 Flash Preview 集成通过了质量检查——Schema 有效性、事实准确率、延迟、重试率都达标——没有理由仅仅因为"有更新的模型"就去迁移。
什么情况下该迁移到 Gemini 3.5 Flash
以下场景 Gemini 3.5 Flash 是更好的选择:
需要 GA 级别的稳定性保证
Preview 模型可能在版本间出现行为变化。Gemini 3.5 Flash 是稳定的 GA 模型,行为更可预测,适合不能承受意外回退的生产部署。
Agent 工作流需要更强的推理能力
Gemini 3.5 Flash 内置了增强版推理能力。对于涉及多步规划、工具选择或复杂函数调用链的 Agent 子步骤,更强的推理可以降低重试率和回退频率——这部分节省可能抵消更高的 token 价格。
结构化输出的可靠性很关键
如果你的 Pipeline 依赖严格的 Schema 遵循(JSON mode、函数调用响应、类型化输出),Gemini 3.5 Flash 改进的结构化输出能力可以减少验证失败和下游错误处理。
从零开始构建新项目
对于没有历史 Gemini 3 Flash Preview 集成的新项目,直接上 Gemini 3.5 Flash 可以避免在一个未来可能被弃用的 Preview 模型上构建。
迁移检查清单
如果决定从 Gemini 3 Flash Preview 迁移到 Gemini 3.5 Flash:
1. 更新模型 ID
gemini-3-flash-preview → gemini-3.5-flash
如果你使用的是 EvoLink 统一 API,只需更新请求中的 model 参数,不需要改端点或认证方式。
2. 重新估算预算
把你当前 Gemini 3 Flash Preview 的花费乘以大约 3 倍来预估 Gemini 3.5 Flash 的成本。如果你的工作负载能从更强的推理中受益(降低重试率),记得把这部分节省也算进去。
3. 跑一轮并行评估
在切换生产流量之前,用相同的工作负载样本同时跑两个模型。对比:
- 任务成功率
- 重试率
- 延迟(首 token 时间和完整生成时间)
- Schema 有效率
- 每成功任务的成本
4. 更新监控和告警
调整成本告警和预算阈值,匹配新的定价层级。
5. 准备回退方案
迁移期间保留 Gemini 3 Flash Preview 作为回退路由。如果 Gemini 3.5 Flash 遇到配额压力或延迟尖峰,可以直接切回去,不需要改代码。
每成功任务的成本:真正的对比维度
Token 单价只是成本的一部分。如果 Gemini 3.5 Flash 在你的工作负载上能产生更少的重试、更少的回退、更高的首次通过率,实际成本差距会缩小。
| 指标 | 关注点 |
|---|---|
| 每请求 token 成本 | 直接定价差异 |
| 重试率 | 首次响应未通过验证的频率 |
| 回退率 | Flash 需要升级到更强模型的频率 |
| 延迟 | 首 token 时间和完整生成时间 |
| 任务成功率 | 首次尝试即满足验收标准的百分比 |
| 每成功任务的成本 | 重试、回退和浪费 token 后的混合成本 |
一个 token 单价贵 3 倍但首次就成功的模型,可能比一个需要 2-3 次重试的模型更便宜。
Gemini 3.1 Flash Lite Preview 呢?
$0.25/$1.50 / 1M tokens。它是 Gemini Flash 系列中最便宜的选项,专为大吞吐量、可重试的工作负载设计,延迟和成本优先于最高质量。| 模型 | 输入 | 输出 | 适用场景 |
|---|---|---|---|
| Gemini 3.1 Flash Lite Preview | $0.25 | $1.50 | 最大吞吐量,成本优先 |
| Gemini 3 Flash Preview | $0.50 | $3.00 | 成本与能力平衡 |
| Gemini 3.5 Flash | $1.50 | $9.00 | GA 稳定性和 Agent 工作流 |
FAQ
Gemini 3.5 Flash 可以直接替换 Gemini 3 Flash Preview 吗?
功能上可以——两者都支持相同的输入模态、函数调用、结构化输出和 context caching。但 Gemini 3.5 Flash 是更高价位的 GA 模型,而 Gemini 3 Flash Preview 仍以 Preview 定价提供。
Gemini 3 Flash Preview 会被弃用吗?
能通过 EvoLink 同时使用两个模型吗?
可以。EvoLink 的统一 API 支持这两个模型 ID。你可以根据成本、质量或延迟需求将不同工作负载路由到不同模型,无需管理单独的提供商集成。
3 倍的价格涨幅值得吗?
完全取决于你的工作负载。对于大量、对成本敏感、且 Gemini 3 Flash Preview 已经满足质量要求的任务,升级可能不划算。对于 Agent 工作流、结构化输出 Pipeline 和需要 GA 稳定性的生产系统,推理和可靠性的提升可以抵消成本增加。
迁移前怎么测试?
用你生产工作负载的代表性样本同时跑两个模型。对比任务成功率、重试率、延迟和每成功任务的成本。基于实测数据做决定,不要假设"新模型一定全面更好"。
在 EvoLink 上对比 Gemini Flash 模型
EvoLink 提供统一 API,可同时访问 Gemini 3.5 Flash 和 Gemini 3 Flash Preview。通过一个集成测试路由、回退行为和工作负载级别的成本。
相关阅读:
- Gemini 3.5 Flash API — 产品页,含定价、模型 ID 和 Playground
- Gemini 3.5 Flash 定价指南 — Token 成本拆解和生产预算案例
- Gemini 3.5 Flash 用于编码 Agent — Agent 工作流评估和成本分析
- Gemini 3.5 Flash vs Claude Haiku 4.5 — 跨系列性价比模型对比
- Gemini 3.5 Flash API 发布追踪 — 发布状态追踪
在 EvoLink 上探索:
- Gemini 3.5 Flash API — $1.50/$9.00 每百万 token,稳定 GA 版
- Gemini 3 Flash Preview API — $0.50/$3.00 每百万 token,预览版
- Gemini API 系列 — 按价格和工作负载对比所有 Gemini 路由


