Gemini 3 Flash Preview API
- One API for Code Agents & CLIs. (View Docs)
$0.466(~ 31.7 credits) per 1M input tokens; $2.796(~ 190.1 credits) per 1M output tokens
$0.047(~ 3.2 credits) per 1M cache read tokens; $0.932(~ 63.4 credits) per 1M audio tokens
Google Search grounding charged separately per query.
稳定性最高,保证 99.9% 可用性。推荐用于生产环境。
所有版本使用同一个 API 端点,仅 model 参数不同。
EvoLink 上的 Gemini 3 Flash Preview API
Gemini 3 Flash Preview 为速度和规模而生,能够理解文本、图像、视频、音频和 PDF,并处理海量上下文(高达 1M Token)。它为实时助手、文档理解和媒体分析提供清晰、可靠的回答。

利用 Gemini 3 Flash Preview 可以构建什么?
为什么为 Gemini 3 Flash Preview 选择 EvoLink
通过 OpenAI SDK 格式或 Google 原生 API 格式运行 gemini-3-flash-preview,享受官方 Gemini 能力和定价。
一次集成,两种格式
以 OpenAI SDK 或原生 Gemini 格式调用 Gemini 3 Flash Preview,无需更改应用逻辑。
批处理 + 缓存节省成本
使用批处理和上下文缓存降低重复成本,同时安全地扩展高业务量负载。
生产环境就绪
多模态输入、长上下文和工具支持覆盖了真实的生产级助手、分析和自动化工作流。
如何调用 Gemini 3 Flash Preview
选择 OpenAI SDK 或 Google 原生 API 格式,然后发送您的请求。
第 1 步 - 选择 API 格式
OpenAI SDK 格式:POST /v1/chat/completions,模型设为 "gemini-3-flash-preview"。原生 API 格式:POST /v1beta/models/gemini-3-flash-preview:{method},方法使用 generateContent 或 streamGenerateContent。
第 2 步 - 添加鉴权与输入
包含 Authorization: Bearer <token>。发送包含文本或多模态部分(图像、视频、音频、PDF)的消息/内容。
第 3 步 - 流式传输或规模化
启用流式传输以获得实时用户体验,或使用 X-Async-Mode 返回任务 ID。结合批处理和缓存,实现高性价比的大规模运行。
技术规格
gemini-3-flash-preview 的官方模型能力
1,048,576 输入 Token
高达 1,048,576 个输入 Token 和 65,536 个输出 Token。
多模态输入
支持文本、图像、视频、音频和 PDF 输入,并返回文本输出。
思考 + 结构化输出
支持思考和结构化输出,以获得可靠的、机器可读的结果。
函数调用 + 工具
支持函数调用、代码执行和文件搜索。
缓存 + 批处理
支持上下文缓存和批处理 API,适用于重复性或大规模负载。
搜索接地 + URL 上下文
支持搜索接地和 URL 上下文(不支持 Google Maps 接地)。
Gemini 3 Flash Preview API 常见问题
Everything you need to know about the product and billing.


