HappyHorse 1.0 正式上线立即体验
Gemini 3.5 Pro API 发布追踪:Google 已确认的信息
发布观察

Gemini 3.5 Pro API 发布追踪:Google 已确认的信息

EvoLink Team
EvoLink Team
Product Team
2026年5月18日
12 分钟阅读
截至 2026年5月18日,Google 官方 Gemini API 和 Vertex/Google 模型文档列出 Gemini 3.5 Pro 或 gemini-3.5-pro 模型 ID。本发布追踪页面记录了已确认的信息、尚未确认的内容,以及开发者如何在不假设未发布模型行为的情况下做好准备。

对于生产团队来说,要点很简单:不要围绕推测性的模型名称制定计划。在将 Gemini 3.5 Pro 加入应用路线图之前,请关注官方模型列表、定价页面、发布说明和 Vertex/Google 模型页面。

要点摘要

  • 截至2026年5月18日,Google 官方 Gemini API 模型文档中未列出 Gemini 3.5 Pro。
  • 在已检查的 Google 文档中,没有确认官方的 gemini-3.5-pro 模型 ID、定价行、上下文窗口、区域列表或 API 发布说明。
  • Google 当前的 Gemini 3 API 文档列出了 Gemini 3.1 Pro Preview、Gemini 3 Flash、Gemini 3.1 Flash-Lite 及相关的 Gemini 3 模型。
  • Gemini 3.1 Pro 是目前最接近的官方 Pro 系列基准模型,但在 Google 正式宣布之前,不应将 Gemini 3.5 Pro 描述为已确认的后续版本。
  • 准备迎接未来 Gemini 模型的团队应设计模型切换、回退、成本追踪和针对特定工作负载的评估方案。

当前官方状态

下表反映了 2026年5月18日 的文档检查结果。
项目当前状态监控来源
Gemini 3.5 Pro 官方发布在已检查的 Google 文档中未确认Gemini API 发布说明
Gemini API 模型 ID未确认Gemini API 模型列表
Vertex/Google 模型可用性未确认Google Cloud 模型文档
定价未确认Gemini API 定价
上下文窗口未确认官方模型卡片或 API 文档
工具调用和智能体功能Gemini 3.5 Pro 未确认官方模型文档和能力表

这并不意味着 Google 永远不会发布 Gemini 3.5 Pro。这只是说明开发者在 Google 通过官方渠道发布之前,不应将 Gemini 3.5 Pro 视为可用或已规范的 API 模型。

Google 当前列出的替代模型

Google 当前的 Gemini API 模型文档列出了 Gemini 3 系列模型,如 Gemini 3.1 ProGemini 3 FlashGemini 3.1 Flash-Lite 以及相关的音频、图像和实时变体。同一文档还提到 Gemini 3 Pro Preview 已于2026年3月9日弃用并关闭,并提供了向 Gemini 3.1 Pro Preview 迁移的指南。
定价页面还包含 Gemini 3.1 Pro Preview 的当前行,包括 gemini-3.1-pro-previewgemini-3.1-pro-preview-customtools 等模型 ID。在已检查的文档中没有 Gemini 3.5 Pro 对应的官方定价行。

对于发布追踪内容而言,这一点很重要,因为最安全的基准是当前的官方模型系列,而非假设的未来命名序列。

使用 Gemini 3.5 Pro 之前开发者应关注的事项

在围绕任何未来的 Gemini 3.5 Pro 发布规划生产工作之前,请从 Google 官方来源验证以下事项。

1. 模型 ID

不要假设模型 ID 会是 gemini-3.5-pro。Google 可能使用不同的后缀、预览名称、日期模型字符串或特定路由标识符。生产应用应将模型 ID 保存在配置中,而不是硬编码到业务逻辑中。

2. API 渠道

检查模型是出现在 Gemini API、Vertex AI、Google AI Studio 中,还是仅在其中一部分渠道中。一个模型可能在一个产品界面比另一个更早可用,因此"已发布"应始终指定具体渠道。

3. 定价

在估算生产成本之前,请等待官方定价行发布。对于智能体工作负载,还需计算每个成功任务的成本,因为重试、长上下文、工具调用和失败的会话可能使实际支出高于标注的 token 价格。

4. 上下文窗口和输出限制

不要从模型名称推断上下文长度。请查看官方模型卡片或 API 文档中的输入上下文、输出限制、缓存定价以及任何改变定价的 token 阈值。

5. 工具调用和结构化输出

对于智能体应用,请从官方能力表验证函数调用、结构化输出、代码执行、搜索增强和文件支持。然后使用真实的工具调用测试 schema 遵循性和错误恢复。

6. 速率限制和区域

对于生产系统,可用性与原始模型质量同样重要。检查速率限制、区域可用性、配额规则、预览限制以及是否有更高吞吐量的推理选项。

Gemini 3.5 Pro 与 Gemini 3.1 Pro:安全的对比框架

Gemini 3.1 Pro 是目前 Google 列出的官方 Pro 系列模型,因此它是实际监控的基准。Gemini 3.5 Pro 应仅在 Google 发布官方详情后才与之进行比较。

维度当前 Gemini 3.1 Pro 信号Gemini 3.5 Pro 发布时需验证的内容
模型 ID官方模型 ID 已记录确切的 API 模型 ID 和渠道支持
定价官方定价行已存在输入、输出、缓存、批量、弹性和优先级定价
上下文官方模型文档描述了支持的上下文上下文窗口、输出限制和定价层级是否有变化
智能体工作流Google 将 3.1 Pro 定位于智能体和编程工作负载在真实智能体工作负载上任务完成率是否提升
生产就绪度预览状态和速率限制适用GA 或预览状态、配额、区域和弃用条款

在 Google 提供模型详情或您在发布后拥有自己的基准数据之前,避免发布"Gemini 3.5 Pro 将更适合编程智能体"之类的声明。

如何在不依赖未发布模型的情况下做好准备

团队可以在不做出无根据声明的情况下为未来的 Gemini 发布做好准备。

保持模型选择可配置

将模型 ID、路由规则和提供商特定选项存储在应用逻辑之外。这样在新模型出现时,无需重构产品代码即可轻松测试。

追踪每个成功任务的成本

对于编程智能体、RAG 管道和长上下文助手,token 价格只是成本的一部分。追踪输入 token、输出 token、重试次数、延迟、错误率和最终任务结果。

构建回退路径

不要让生产流量依赖单一模型。回退路径可以让您在中断、配额压力、延迟峰值或模型特定回归时进行路由切换。

使用真实工作负载测试

当新模型可用时,在您的实际提示词、工具、文档和验收标准上对其进行基准测试。公开基准测试是有用的信号,但它们很少能预测每种生产工作流。

将发布追踪与推荐分开

在发布前,文章应回答"Google 确认了什么?"。发布后,它可以转变为包含定价、上下文、延迟、质量和迁移建议的评估指南。

EvoLink 提供了一个统一的 API 层,用于比较和管理多个模型系列。对于关注未来 Gemini 模型的团队,这可以减少集成开销,并使跨提供商的模型切换、路由行为和工作负载级成本评估更加便捷。

一旦 Gemini 3.5 Pro 出现在支持的上游渠道中,本页面将更新确切的模型 ID、定价说明、可用性状态和生产评估结果。

相关文章

需要监控的官方来源

常见问题

Gemini 3.5 Pro 在 API 中可用吗?

截至 2026年5月18日,根据已检查的 Google 官方文档,答案是否定的。Google 的 Gemini API 模型列表、定价页面、发布说明和 Vertex/Google 模型文档均未列出 Gemini 3.5 Pro 或 gemini-3.5-pro

当前官方的 Pro 系列基准是什么?

在已检查的 Google 文档中,Gemini 3.1 Pro 是相关的官方 Pro 系列基准。它有记录在案的 API 模型 ID 和定价,而 Gemini 3.5 Pro 没有。

Gemini 3.5 Pro 会有 Gemini API 或 Vertex AI 路由吗?

目前尚未确认。由于之前的 Gemini 模型均记录在 Gemini API 和 Vertex/Google 模型文档中,因此监控这些文档是合理的,但在 Google 正式发布之前,渠道、模型 ID 和可用性条款不应被视为已确认。

开发者现在应该做什么?

使用当前的官方模型进行生产规划,保持模型选择可配置,在任务级别追踪成本和可靠性,并在将 Gemini 3.5 Pro 加入集成路线图之前监控 Google 发布说明。

发布后是否应更新此文章?

是的。如果 Google 发布 Gemini 3.5 Pro,请使用确切的发布日期、模型 ID、API 渠道、定价、上下文窗口、速率限制、官方来源链接和经过测量的生产指导更新此页面。

准备好把 AI 成本降低 89% 吗?

现在就开始使用 EvoLink,体验智能 API 路由的强大能力。