Gemini 3 Flash Preview API
谷歌最快的前沿模型,速度优势达 3 倍。原生支持音频输入,可配置推理深度,世界级 Agent 能力,价格不到 Pro 的 25%。
Gemini 3 Flash Preview API - 速度与智能的完美结合
部署 gemini-3-flash-preview,可配置推理深度,原生支持音频。通过 EvoLink 获得 SWE-bench 78% 的性能,同时速度快 3 倍。

Gemini 3 Flash Preview API 核心能力
为什么通过 EvoLink 集成 Gemini 3 Flash
以极低成本获得最快的前沿 AI 模型。我们优化路由和缓存,为您的 AI 工作负载提供最大价值。
无与伦比的速度
推理速度比竞品快 3 倍,非常适合实时应用和面向用户的产品。
一流的 Agent 性能
SWE-bench Verified 得分 78% - 所有模型中 Agent 编码任务的最高分。
成本效益
价格不到 Gemini 3 Pro 的 25%,同时保持前沿性能。输入 $0.50/1M,输出 $3/1M tokens。
如何使用 Gemini 3 Flash Preview API
配置推理深度,处理音频,通过 EvoLink 部署。
步骤 1 - 配置模型
选择 'gemini-3-flash-preview' 并根据任务复杂度设置 `thinking_level`:'minimal' 追求速度,'high' 用于复杂推理。
步骤 2 - 处理输入
直接发送文本、图片、视频、PDF 或音频文件。音频无需转写 - 模型原生处理。
步骤 3 - 部署与扩展
通过 EvoLink 路由,自动获得缓存和负载均衡。优化定价可节省高达 20%。
技术规格
Gemini 3 Flash Preview API 的高级功能
1M Token 窗口
单次请求处理整个代码库、长文档或数小时的音视频内容。
推理层级
可配置推理深度:minimal、low、medium、high。按请求平衡速度与准确性。
原生音频
音频输入 $1/1M tokens。上传录音即可获得智能分析。
SWE-bench 78%
一流的 Agent 编码性能。在该基准测试上甚至超越 Gemini 3 Pro。
GPQA Diamond 90.4%
博士级推理能力,解决研究生水平的科学问题。
上下文缓存
Cache Write/Hit 仅 $0.05/1M tokens。大幅降低重复上下文的成本。
Gemini 3 Flash 与竞品对比
速度与智能的最佳性价比
| Model | Duration | Resolution | Price | Strength |
|---|---|---|---|---|
| Gemini 3 Flash Preview | N/A | 可配置推理 | $0.50/$3 (1M tokens) | 快 3 倍,SWE-bench 78%,原生音频,不到 Pro 25% 成本。 |
| Gemini 3 Pro Preview | N/A | 深度思考模式 | $2/$12 (1M tokens) | 最大推理深度,Agent 思维签名。 |
| Claude Sonnet 4.5 | N/A | 扩展思考 | $3/$15 | 强大编码能力,详细响应,混合推理。 |
Gemini 3 Flash API 常见问题
Everything you need to know about the product and billing.


