Gemini 3 Flash Preview API
定价
| 方案 | 上下文窗口 | 最大输出 | 输入 | 输出 | 缓存读取 |
|---|---|---|---|---|---|
| Gemini 3 Flash | 1.05M | 65.5K | ≤200.0K$0.400-20% $0.500官方价格 >200.0K$0.400-20% $0.500官方价格 | ≤200.0K$2.40-20% $3.00官方价格 >200.0K$2.40-20% $3.00官方价格 | ≤200.0K$0.040-19% $0.050官方价格 >200.0K$0.040-19% $0.050官方价格 |
| Gemini 3 Flash (Beta) | 1.05M | 65.5K | ≤200.0K$0.130-74% $0.500官方价格 >200.0K$0.130-74% $0.500官方价格 | ≤200.0K$0.780-74% $3.00官方价格 >200.0K$0.780-74% $3.00官方价格 | ≤200.0K$0.013-74% $0.050官方价格 >200.0K$0.013-74% $0.050官方价格 |
定价说明: 价格单位:USD / 1M tokens
缓存命中: 适用于缓存的提示词 Tokens 价格。
在 EvoLink 上运行 Gemini 3 Flash 有两种方式,您可以选择适合您需求的层级。
- · Gemini 3 Flash: 默认层级,适合生产环境的可靠性和可预测的可用性。
- · Gemini 3 Flash (Beta): 低成本层级,尽力而为的可用性;推荐用于可接受重试的工作负载。
EvoLink 上的 Gemini 3 Flash Preview API
Gemini 3 Flash Preview 为速度和规模而生,能够理解文本、图像、视频、音频和 PDF,并处理海量上下文(高达 1M Token)。它为实时助手、文档理解和媒体分析提供清晰、可靠的回答。

利用 Gemini 3 Flash Preview 可以构建什么?
为什么为 Gemini 3 Flash Preview 选择 EvoLink
通过 OpenAI SDK 格式或 Google 原生 API 格式运行 gemini-3-flash-preview,享受官方 Gemini 能力和定价。
一次集成,两种格式
以 OpenAI SDK 或原生 Gemini 格式调用 Gemini 3 Flash Preview,无需更改应用逻辑。
批处理 + 缓存节省成本
使用批处理和上下文缓存降低重复成本,同时安全地扩展高业务量负载。
生产环境就绪
多模态输入、长上下文和工具支持覆盖了真实的生产级助手、分析和自动化工作流。
如何调用 Gemini 3 Flash Preview
选择 OpenAI SDK 或 Google 原生 API 格式,然后发送您的请求。
第 1 步 - 选择 API 格式
OpenAI SDK 格式:POST /v1/chat/completions,模型设为 "gemini-3-flash-preview"。原生 API 格式:POST /v1beta/models/gemini-3-flash-preview:{method},方法使用 generateContent 或 streamGenerateContent。
第 2 步 - 添加鉴权与输入
包含 Authorization: Bearer <token>。发送包含文本或多模态部分(图像、视频、音频、PDF)的消息/内容。
第 3 步 - 流式传输或规模化
启用流式传输以获得实时用户体验,或使用 X-Async-Mode 返回任务 ID。结合批处理和缓存,实现高性价比的大规模运行。
技术规格
gemini-3-flash-preview 的官方模型能力
1,048,576 输入 Token
高达 1,048,576 个输入 Token 和 65,536 个输出 Token。
多模态输入
支持文本、图像、视频、音频和 PDF 输入,并返回文本输出。
思考 + 结构化输出
支持思考和结构化输出,以获得可靠的、机器可读的结果。
函数调用 + 工具
支持函数调用、代码执行和文件搜索。
缓存 + 批处理
支持上下文缓存和批处理 API,适用于重复性或大规模负载。
搜索接地 + URL 上下文
支持搜索接地和 URL 上下文(不支持 Google Maps 接地)。
Gemini 3 Flash Preview API 常见问题
Everything you need to know about the product and billing.


