Gemini 3 Flash Preview API

谷歌最快的前沿模型,速度优势达 3 倍。原生支持音频输入,可配置推理深度,世界级 Agent 能力,价格不到 Pro 的 25%。

Gemini 3 Flash Preview API - 速度与智能的完美结合

部署 gemini-3-flash-preview,可配置推理深度,原生支持音频。通过 EvoLink 获得 SWE-bench 78% 的性能,同时速度快 3 倍。

Gemini 3 Flash Preview

Gemini 3 Flash Preview API 核心能力

极速推理

比前代模型快 3 倍,同时保持前沿级智能水平。

速度基准测试

原生音频输入

直接处理音频录音,无需转写中间件。分析会议、播客和讲座内容。

音频处理

可配置推理深度

通过调整推理层级(minimal 到 high)平衡速度和推理深度。

推理层级

为什么通过 EvoLink 集成 Gemini 3 Flash

以极低成本获得最快的前沿 AI 模型。我们优化路由和缓存,为您的 AI 工作负载提供最大价值。

无与伦比的速度

推理速度比竞品快 3 倍,非常适合实时应用和面向用户的产品。

一流的 Agent 性能

SWE-bench Verified 得分 78% - 所有模型中 Agent 编码任务的最高分。

成本效益

价格不到 Gemini 3 Pro 的 25%,同时保持前沿性能。输入 $0.50/1M,输出 $3/1M tokens。

如何使用 Gemini 3 Flash Preview API

配置推理深度,处理音频,通过 EvoLink 部署。

1

步骤 1 - 配置模型

选择 'gemini-3-flash-preview' 并根据任务复杂度设置 `thinking_level`:'minimal' 追求速度,'high' 用于复杂推理。

2

步骤 2 - 处理输入

直接发送文本、图片、视频、PDF 或音频文件。音频无需转写 - 模型原生处理。

3

步骤 3 - 部署与扩展

通过 EvoLink 路由,自动获得缓存和负载均衡。优化定价可节省高达 20%。

技术规格

Gemini 3 Flash Preview API 的高级功能

上下文

1M Token 窗口

单次请求处理整个代码库、长文档或数小时的音视频内容。

推理

推理层级

可配置推理深度:minimal、low、medium、high。按请求平衡速度与准确性。

多模态

原生音频

音频输入 $1/1M tokens。上传录音即可获得智能分析。

性能

SWE-bench 78%

一流的 Agent 编码性能。在该基准测试上甚至超越 Gemini 3 Pro。

智能

GPQA Diamond 90.4%

博士级推理能力,解决研究生水平的科学问题。

成本

上下文缓存

Cache Write/Hit 仅 $0.05/1M tokens。大幅降低重复上下文的成本。

Gemini 3 Flash 与竞品对比

速度与智能的最佳性价比

ModelDurationResolutionPriceStrength
Gemini 3 Flash PreviewN/A可配置推理$0.50/$3 (1M tokens)快 3 倍,SWE-bench 78%,原生音频,不到 Pro 25% 成本。
Gemini 3 Pro PreviewN/A深度思考模式$2/$12 (1M tokens)最大推理深度,Agent 思维签名。
Claude Sonnet 4.5N/A扩展思考$3/$15强大编码能力,详细响应,混合推理。

Gemini 3 Flash API 常见问题

Everything you need to know about the product and billing.

输入 tokens 价格 $0.50/1M,输出 tokens 价格 $3/1M,音频输入价格 $1/1M。上下文缓存(write/hit)仅 $0.05/1M tokens。这不到 Gemini 3 Pro 定价的 25%。
Flash 快 3 倍且便宜 75%。它在 Agent 编码方面实际上超越 Pro(SWE-bench 78%)。对速度要求高的应用使用 Flash;需要最深推理能力的复杂任务使用 Pro。
可以设置 thinking_level 为 'minimal'、'low'、'medium' 或 'high'。Minimal 最快但推理基础,high 提供最深分析但耗时更长。根据任务复杂度选择。
直接将音频文件上传到 API - 无需转写步骤。模型原生处理音频,可以分析内容、检测知识盲点、创建测验等。
1,048,576 tokens(约 1M)。这允许在单次请求中处理超长文档、完整代码库或数小时的音视频内容。