发布观察

Gemini 3.5 Flash API 已正式发布：模型 ID、价格与生产部署指南

Name: EvoLink AI Model API Platform
Brand: EvoLink
Availability: InStock

EvoLink Team

Product Team

2026年5月18日

更新于 2026年5月20日

8 分钟阅读

更新（2026 年 5 月 20 日）： Google 已更新官方 Gemini API 文档。Gemini 3.5 Flash 现已标记为正式发布（GA），稳定可用于大规模生产。模型 ID 为 gemini-3.5-flash。本页已从发布追踪格式更新为确认可用状态。

查看完整的 Gemini 3.5 Flash API 页面（含价格、代码示例和使用场景），请访问 EvoLink 上的 Gemini 3.5 Flash API。

TL;DR

Gemini 3.5 Flash 已正式发布（GA），标记为稳定可用于生产。
模型 ID：gemini-3.5-flash — 已在 Google 官方 Gemini API 文档中确认。
价格：$1.50 输入 / $9.00 输出（每百万 Token）（标准层），支持上下文缓存和批量折扣。
上下文：1,048,576 输入 Token / 65,536 输出 Token。
核心优势：Agent 工作流、编码 Agent、子 Agent 部署、长周期任务。
非预览版 — 生产团队可以放心路由流量。

自 5 月 18 日以来发生了什么变化

2026 年 5 月 18 日，本页报告 Google 官方 Gemini API 文档未列出 Gemini 3.5 Flash。以下是最新变化：

项目	5 月 18 日状态	当前状态（5 月 20 日）
官方发布	未确认	正式发布，稳定
模型 ID	未确认	`gemini-3.5-flash`
价格	未确认	$1.50 输入 / $9.00 输出（每百万 Token）
上下文窗口	未确认	1M 输入 / 65K 输出
工具调用	未确认	支持函数调用、结构化输出、代码执行
上下文缓存	未确认	支持
Batch API	未确认	支持
生产状态	不可用	稳定可用于大规模生产

已确认的能力

Google 官方文档将 Gemini 3.5 Flash 定位为一个面向真实任务的模型，以 Flash 级速度和成本提供前沿智能。已确认的关键能力：

Agent 工作流

Gemini 3.5 Flash 针对 Agent 工作流、并行执行循环和子 Agent 部署进行了优化。原生支持函数调用、结构化输出和代码执行。

编码任务

该模型以 Flash 级速度处理代码生成、调试、重构和测试编写，非常适合每次迭代消耗 Token 的编码 Agent 循环。

长周期任务

1M 输入上下文支持完整代码库分析、多文档分析、法律审查、研究综合和 PDF 密集型工作流，无需截断上下文。

多模态输入

支持文本、图像、视频、音频和 PDF 输入，统一定价 — 音频和视频输入无额外溢价。

价格概览

层级	输入（每百万 Token）	输出（每百万 Token）
标准	$1.50	$9.00
上下文缓存	降低输入成本	相同输出
Batch API	额外折扣	额外折扣

EvoLink 的详细价格和积分换算，请查看 Gemini 3.5 Flash API 页面。

对生产团队意味着什么

现在可以路由生产流量

Gemini 3.5 Flash 不是预览版或实验模型。Google 将其标记为稳定可用于大规模生产。你可以围绕它规划生产路由、成本预算和 SLA。

评估 Agent 和编码工作负载

Google 明确将此模型定位为 Agent 工作流和编码任务。如果你在运行编码 Agent、多步自动化或工具编排流水线，这个模型值得与当前默认模型进行基准测试。

Gemini 家族内对比

模型	最适合	成本档次
Gemini 3.5 Flash	Agent 工作流、编码、长周期任务	Flash 级
Gemini 3.1 Pro	最难推理、复杂分析	更高成本
Gemini 3.1 Flash Lite	高吞吐批量、简单提取	最低成本

通过 EvoLink 统一接入

EvoLink 提供 OpenAI 兼容接口接入 Gemini 3.5 Flash 及其他模型。一个 API Key、一套账单系统，并在 Flash、Pro 和其他厂商模型之间灵活路由。

在 EvoLink 上使用 Gemini 3.5 Flash →

更新后的评估清单

模型已上线，以下是在实际工作负载上需要验证的内容：

维度	测量什么
延迟	你的 prompt 分布下的首 Token 时间和完整生成时间
质量	任务成功率、Schema 遵守率、幻觉率
成本	含重试、降级和缓存节省的 Token 成本
工具使用	函数调用可靠性、结构化输出准确性
Agent 循环	每个完整 Agent 会话的成本（见成本示例）
降级率	Flash 需要升级到 Pro 的频率

官方来源

常见问题

Gemini 3.5 Flash 现在可以通过 API 使用了吗？

是的。截至 2026 年 5 月，Google 官方 Gemini API 文档将 Gemini 3.5 Flash 列为正式发布（GA），稳定可用于大规模生产。模型 ID 为 gemini-3.5-flash。

Gemini 3.5 Flash 的模型 ID 是什么？

已确认的模型 ID 为 gemini-3.5-flash。在 API 请求中使用此精确字符串。

Gemini 3.5 Flash 的价格是多少？

标准价格为每百万输入 Token $1.50，每百万输出 Token $9.00。上下文缓存和 Batch API 提供额外的成本节省。EvoLink 特定价格请查看 Gemini 3.5 Flash API 页面。

Gemini 3.5 Flash 可以用于生产环境吗？

可以。Google 将其标记为稳定可用于大规模生产。它不是预览或实验模型。

Gemini 3.5 Flash 最适合什么场景？

根据 Google 官方文档，它针对 Agent 工作流、编码 Agent、子 Agent 部署、长周期任务和 1M 上下文下的低成本生产推理进行了优化。

Gemini 3.5 Flash 和 Gemini 3 Flash 有什么区别？

Gemini 3.5 Flash 是当代 Flash 模型，具备前沿智能、更强的 Agent 和编码性能以及内置推理。Gemini 3 Flash 是上一代。

可以通过 EvoLink 使用 Gemini 3.5 Flash 吗？

可以。EvoLink 提供 OpenAI 兼容和 Gemini 原生 API 接入。详情请查看 Gemini 3.5 Flash API 页面。

所有文章

#Gemini 3.5 Flash #Gemini API #Google AI #Flash models #release watch