GPT-5.4 API
GPT-5.4 API
首个具备原生 computer use 的通用模型,支持 1.05M 上下文、128K 最大输出,并具备更高 token 效率。

计费规则
- 输入/输出按每 1M tokens 计费。
- 缓存输入享受 90% 折扣。
- 输入超过 272K:整轮会话按输入 2x、输出 1.5x 计费。
- 区域处理(数据驻留)加收 10%。
- reasoning tokens 计入输出。
定价
| 方案 | 上下文窗口 | 最大输出 | 输入 | 输出 | 缓存读取 |
|---|---|---|---|---|---|
| GPT-5.4 | 1.05M | 128.0K | $2.00-20% $2.50官方价格 | $12.00-20% $15.00官方价格 | $0.200-20% $0.250官方价格 |
| GPT-5.4 (Beta) | 1.05M | 128.0K | $0.650-74% $2.50官方价格 | $3.90-74% $15.00官方价格 | $0.065-74% $0.250官方价格 |
定价说明: 价格单位:USD / 1M tokens
缓存命中: 适用于缓存的提示词 Tokens 价格。
在 EvoLink 上运行 GPT-5.4 有两种方式,您可以选择适合您需求的层级。
- · GPT-5.4: 默认层级,适合生产环境的可靠性和可预测的可用性。
- · GPT-5.4 (Beta): 低成本层级,尽力而为的可用性;推荐用于可接受重试的工作负载。
| 模型 | 计费项 | 官方价格 | EvoLink | Credits |
|---|---|---|---|---|
| GPT-5.4 | Input (Standard) | $2.50 / 1M | TBA | TBA |
| GPT-5.4 | Input (Cached) | $0.25 / 1M | TBA | TBA |
| GPT-5.4 | Input (>272K Prompt Tier) | $5.00 / 1M | TBA | TBA |
| GPT-5.4 | Output (Standard) | $15.00 / 1M | TBA | TBA |
| GPT-5.4 | Output (>272K Prompt Tier) | $22.50 / 1M | TBA | TBA |
若该模型不可用,系统会自动切换到当前可用且更低价的选项,以尽量保障 99.9% 可用性与更优成本。
核心能力
原生 computer use:首个可直接操作电脑的通用模型
GPT-5.4 是首个具备原生、SOTA 级 computer-use 能力的通用模型。它可通过截图与键鼠指令完成点击、输入与软件导航,无需额外专用模型。在 OSWorld-Verified 上,GPT-5.4 达到 75.0%,高于人类 72.4%。

1.05M 上下文 + 更高 token 效率
单次请求即可处理完整代码库、整本书级文档或数月对话历史。相比 GPT-5.2 的 400K 上下文提升至 2.6x。同时 GPT-5.4 在同类问题上通常消耗更少 token,带来更低实际成本与更快速度。

可调推理深度
支持 none、low、medium、high、xhigh 五档推理强度。面对最难任务,可提高推理强度以获取更深层推理。GDPval 达 83.0%(覆盖 44 个职业任务),对比 GPT-5.2 的 70.9%。

为什么开发者选择 GPT-5.4
更强能力、更广工具、更低落地门槛。
完整工具生态 + Tool Search
web search、file search、image gen、code interpreter、hosted shell、computer use、MCP、tool search 均可原生接入。Tool Search 可帮助代理在大型连接器生态中自动找到并调用合适工具。
更好结果,更少 tokens
GPT-5.4 是更高 token 效率的推理模型。与 GPT-5.2 相比,很多同类任务消耗更少 token,常见场景下可带来更快速度与更低有效任务成本。
一把密钥,零配置
通过 EvoLink 一把 API key 即可接入 GPT-5.4。多数从 GPT-5.2 迁移的场景只需替换一个 model 字符串。
如何接入
三步完成从接入到生产监控。
获取 API Key
在 EvoLink 免费注册并生成 API key,可立即用于 GPT-5.4 与 47+ 模型。
发送请求
POST 请求中将 model 设为 "gpt-5.4",并提交 messages 与可选参数。
部署与监控
在控制台监控用量、成本与 reasoning token 消耗,并按需扩展生产工作流。
关键特性
面向生产环境的高价值能力集合。
1.05M Context Window
可容纳完整代码库与书籍级长文档。
128K Max Output
单次响应输出完整长文档与复杂实现。
Native Computer Use
通过截图 + 键鼠操作完成软件交互(OSWorld 75.0%,人类 72.4%)。
Tool Search
代理可自动发现并使用合适工具。
Token Efficiency
同类任务较 GPT-5.2 更省 tokens。
Prompt Caching
缓存输入按 $0.25/1M 计费(标准输入价的一折,节省 90%)。
基准对比:GPT-5.4 vs GPT-5.2
官方基准显示:GPT-5.4 在专业任务、工具使用、网页浏览与 computer use 上均有显著提升。
| 基准项 | GPT-5.4 | GPT-5.2 |
|---|---|---|
| GDPval | 83.0% | 70.9% |
| SWE-Bench Pro | 57.7% | 55.6% |
| OSWorld (Human: 72.4%) | 75.0% | 47.3% |
| Toolathlon | 54.6% | 46.3% |
| BrowseComp | 82.7% | 65.8% |
| MMMU-Pro | 81.2% | 79.5% |
| Factual errors per claim | 33% fewer | Baseline |
| Factual errors per response | 18% fewer | Baseline |
数据摘要
GPT-5.4
gpt-5.4-2026-03-05 | $2.50/$15/$0.25 | 1.05M/128K | 推理强度 none→xhigh | 全工具支持
GPT-5.4 Thinking
仅 ChatGPT 提供,不是独立 API 模型
相较 V1 的更新
- 补充 GPT-5.4 Thinking 说明(仅 ChatGPT 侧)。
- 将原生 computer use 提升为核心卖点(OSWorld 75.0% > 人类 72.4%)。
- 强化 token efficiency 叙述(更少 tokens = 更低有效成本)。
- 补充 Tool Search 能力说明。
- 新增 GPT-5.4 vs GPT-5.2 基准对比区块。
- 优化 SEO 标题与描述,更符合快速决策搜索意图。
常见问题
Everything you need to know about the product and billing.
相关阅读
这里汇总了发布信息、价格分析、竞品对比与迁移决策相关内部链接。