Seedance 2.0 API — 即将上线Get early access

Gemini 3 Flash Preview API

通过 EvoLink 访问 Google 的 Gemini 3 Flash Preview (gemini-3-flash-preview),兼容 OpenAI SDK 并支持原生 Gemini API。发送文本、图像、视频、音频和 PDF 输入,具备 1,048,576 Token 的上下文窗口,并为生产负载提供缓存和批处理选项。
Run With API
Using coding CLIs? Run Gemini 3 Flash via EvoCode — One API for Code Agents & CLIs. (View Docs)
$

定价

方案上下文窗口最大输出输入输出缓存读取
Gemini 3 Flash1.05M65.5K
200.0K$0.400-20%
$0.500官方价格
>200.0K$0.400-20%
$0.500官方价格
200.0K$2.40-20%
$3.00官方价格
>200.0K$2.40-20%
$3.00官方价格
200.0K$0.040-19%
$0.050官方价格
>200.0K$0.040-19%
$0.050官方价格
Gemini 3 Flash (Beta)1.05M65.5K
200.0K$0.130-74%
$0.500官方价格
>200.0K$0.130-74%
$0.500官方价格
200.0K$0.780-74%
$3.00官方价格
>200.0K$0.780-74%
$3.00官方价格
200.0K$0.013-74%
$0.050官方价格
>200.0K$0.013-74%
$0.050官方价格

定价说明: 价格单位:USD / 1M tokens

缓存命中: 适用于缓存的提示词 Tokens 价格。

在 EvoLink 上运行 Gemini 3 Flash 有两种方式,您可以选择适合您需求的层级。

  • · Gemini 3 Flash: 默认层级,适合生产环境的可靠性和可预测的可用性。
  • · Gemini 3 Flash (Beta): 低成本层级,尽力而为的可用性;推荐用于可接受重试的工作负载。

EvoLink 上的 Gemini 3 Flash Preview API

Gemini 3 Flash Preview 为速度和规模而生,能够理解文本、图像、视频、音频和 PDF,并处理海量上下文(高达 1M Token)。它为实时助手、文档理解和媒体分析提供清晰、可靠的回答。

Gemini 3 Flash Preview API 展示

利用 Gemini 3 Flash Preview 可以构建什么?

多模态输入,可靠的文本输出

单次请求可以包含文本、图像、视频、音频或 PDF,并返回文本输出。这使得总结会议、审查媒体内容以及提取结构化洞察变得简单,无需独立的处理流水线。

多模态输入展示

支持长会话的 1M Token 上下文

单次请求可处理高达 1,048,576 个输入 Token 和 65,536 个输出 Token。这让您能够在单一连贯的上下文中保留长文档、代码库或多轮对话。

长上下文展示

工具、接地(Grounding)与推理

通过函数调用、代码执行、文件搜索、搜索接地和 URL 上下文使用思考和结构化输出。支持批处理 API 和缓存,以实现规模化和成本控制。

工具能力展示

为什么为 Gemini 3 Flash Preview 选择 EvoLink

通过 OpenAI SDK 格式或 Google 原生 API 格式运行 gemini-3-flash-preview,享受官方 Gemini 能力和定价。

一次集成,两种格式

以 OpenAI SDK 或原生 Gemini 格式调用 Gemini 3 Flash Preview,无需更改应用逻辑。

批处理 + 缓存节省成本

使用批处理和上下文缓存降低重复成本,同时安全地扩展高业务量负载。

生产环境就绪

多模态输入、长上下文和工具支持覆盖了真实的生产级助手、分析和自动化工作流。

如何调用 Gemini 3 Flash Preview

选择 OpenAI SDK 或 Google 原生 API 格式,然后发送您的请求。

1

第 1 步 - 选择 API 格式

OpenAI SDK 格式:POST /v1/chat/completions,模型设为 "gemini-3-flash-preview"。原生 API 格式:POST /v1beta/models/gemini-3-flash-preview:{method},方法使用 generateContent 或 streamGenerateContent。

2

第 2 步 - 添加鉴权与输入

包含 Authorization: Bearer <token>。发送包含文本或多模态部分(图像、视频、音频、PDF)的消息/内容。

3

第 3 步 - 流式传输或规模化

启用流式传输以获得实时用户体验,或使用 X-Async-Mode 返回任务 ID。结合批处理和缓存,实现高性价比的大规模运行。

技术规格

gemini-3-flash-preview 的官方模型能力

上下文

1,048,576 输入 Token

高达 1,048,576 个输入 Token 和 65,536 个输出 Token。

多模态

多模态输入

支持文本、图像、视频、音频和 PDF 输入,并返回文本输出。

推理

思考 + 结构化输出

支持思考和结构化输出,以获得可靠的、机器可读的结果。

工具

函数调用 + 工具

支持函数调用、代码执行和文件搜索。

规模

缓存 + 批处理

支持上下文缓存和批处理 API,适用于重复性或大规模负载。

接地

搜索接地 + URL 上下文

支持搜索接地和 URL 上下文(不支持 Google Maps 接地)。

Gemini 3 Flash Preview API 常见问题

Everything you need to know about the product and billing.

Gemini 3 Flash 是一款兼顾速度、规模和强大推理能力的均衡模型。它专为日常任务、智能体编程以及多模态、长上下文理解而设计,是生产负载的理想默认选择。
官方预览版模型名称为 "gemini-3-flash-preview"。请在请求中使用此确切标识符。
Gemini 3 Flash Preview 支持文本、图像、视频、音频和 PDF 输入,并返回文本输出。这使得在单一工作流中进行混合媒体总结、提取和问答成为可能。
它支持高达 1,048,576 个输入 Token 和 65,536 个输出 Token,为长文档、代码库或多轮会话提供了巨大的上下文窗口。
它支持函数调用、结构化输出、代码执行、文件搜索、思考、上下文缓存和批处理 API。支持搜索接地和 URL 上下文,以及多模态函数响应和带图像的代码执行。
不支持图像生成、音频生成和 Live API。该模型也不支持 Google Maps 接地。
最新更新列为 2025 年 12 月,知识截止日期为 2025 年 1 月。
EvoLink 支持 OpenAI SDK 格式 (POST /v1/chat/completions) 和 Google 原生 API 格式 (POST /v1beta/models/gemini-3-flash-preview:{method}),使用 generateContent 或 streamGenerateContent。请在请求标头中添加 Authorization: Bearer <token>。