guide

GPT-5.4 发布时间（2026）：最新消息、泄露功能与开发者指南

Q: GPT-5.4 现在能在 OpenAI API 里直接用了么？

目前在 OpenRouter 已可见并可按公开价调用 openai/gpt-5.4。OpenAI 直连 API 的可用性与计费细节可能因账户层级和合同不同而变化。

Q: GPT-5.3 Instant 到底是 128K 还是 400K？

按 API alias gpt-5.3-chat-latest 页面口径，当前是 128K。

EvoLink Team

Product Team

2026年3月5日

8 分钟阅读

GPT-5.4 发布时间（2026）：最新消息、泄露功能与开发者指南

如果你在搜“GPT-5.4 什么时候发布”或“GPT-5.4 API 何时可用”，本质上是在做同一个决策：现在开工，还是等待新模型。

这篇文章把已确认信息、可信线索和未证实传闻分开，帮助你做更稳健的产品与技术决策。

更新（2026 年 3 月 5 日）： GPT-5.4 已在 OpenRouter 以 openai/gpt-5.4 上架，并公布价格（$2.50 / 1M 输入、$0.625 / 1M 缓存输入、$20.00 / 1M 输出）、1M 上下文、128K 最大输出。OpenAI 直连渠道与企业合同价格仍可能不同。

GPT-5.4 时间线（2026 年 2 月至 3 月）

2026-02-27： Codex PR #13050 新增原始分辨率图片支持，最初把最低模型版本设为 GPT-5.4。在 5 小时内经历 7 次 force push 后，阈值改为 GPT-5.3-Codex。该 PR 于 2026-03-03 合并。(来源：GitHub PR #13050)
2026-03-02： Codex PR #13212 新增 /fast 斜杠命令，最初描述为“为 GPT-5.4 切换 Fast 模式”，相关表述在 3 小时内被清理。(来源：Awesome Agents)
2026-03-02： 另有一条线索：OpenAI Codex 团队成员 Tibo 在 X 误发截图，显示 Codex 应用中 GPT-5.4 与 GPT-5.3-Codex 同时可选，随后很快删除。(来源：NxCode, eWeek)
2026-03-03： OpenAI 在 X 发布 “5.4 sooner than you think”。
2026-03-03： alpha-gpt-5.4 短暂出现在公开 API models endpoint，随后被移除。
2026-03-04： The Information 报道 GPT-5.4 可能包含超过 100 万 token 的上下文窗口，以及 “extreme” 思考模式。
2026-03-04： PiunikaWeb 报道 LMSYS Arena 上出现 GPT-5.4 活动迹象，暗示内部测试正在进行。
2026-03-05： OpenRouter 上架 openai/gpt-5.4，并公开 token 价格与上下文/输出上限。

已确认 vs 未确认

项目	相对可引用信息	仍不确定	对业务的影响
可用性	OpenRouter 已上架 `openai/gpt-5.4`（2026-03-05）	OpenAI 直连层级是否完全一致	影响上线与采购节奏
上下文窗口	OpenRouter 标注 1M 上下文	跨渠道一致性与满载质量表现	影响长上下文架构
extreme 模式	媒体提及高算力推理模式	定价、延迟、可用层级	影响成本与体验
API 价格	OpenRouter 公示 $2.50 输入 / $20 输出（含缓存输入价）	OpenAI 直连与企业合同细则	影响预算和毛利

现在上线还是等待？

更适合现在用 GPT-5.2 上线的场景：

你要在 1-2 周内上线。
400K 上下文已经够用。
你更看重延迟而不是极限推理深度。

更适合现在就以受控流量引入 GPT-5.4的场景：

你的核心能力现在就依赖 1M 上下文。
你可以并行跑质量/延迟/成本评测。
你已有模型路由与回退策略，能接受早期波动。

推荐策略：保留 GPT-5.2 作为稳定基线，把 GPT-5.4 先接入小流量，评测通过后再逐步放量。

开发者准备清单（早期上架期）

1. 先做模型无关路由

将推理入口收敛到内部统一接口，后续切模只改配置不改业务代码。

2. 提前建设 Eval 套件

覆盖真实高难任务、长上下文案例、回归测试和单任务成本。

3. 先定义“变好”的标准

建议固定：任务质量、P95 延迟、每任务成本、领域幻觉率。

EvoLink 接入建议

GPT-5.4 已在 OpenRouter 公开上架后，EvoLink 接入可优先验证以下基线：

可用性与高并发稳定性
延迟基线（P50 / P95）
错误处理与回退行为
相对 GPT-5.2 的质量增益与成本增量

当前 EvoLink 页面可见 GPT-5.2 参考价格：$1.40/1M 输入、$11.20/1M 输出。GPT-5.4 的 EvoLink 最终价格请以正式价格页为准。

GPT-5 家族快照（API 口径）

模型	日期	上下文窗口	定位	EvoLink 价格
GPT-5.3 Instant	2026-03-03	128K（`gpt-5.3-chat-latest`）	日常任务高响应	N/A
GPT-5.2 Thinking	2025-12-11	400K	深度推理	$1.40/1M 输入
GPT-5.2-Codex	2025-12-18（OpenAI 发布）/ 2026-01-14（Copilot GA）	400K	Agent 编码	$1.40/1M 输入
GPT-5.1	2025-11	400K	通用模型	$1.00/1M 输入
GPT-5.4	2026-03（OpenRouter 上架）	1M（OpenRouter 标注）	旗舰升级	EvoLink 待定

FAQ

GPT-5.4 官方发布日期确定了吗？

GPT-5.4 已在 2026 年 3 月 5 日于 OpenRouter 上架。OpenAI 直连渠道的放量节奏仍可能因账号层级不同而存在差异。

GPT-5.4 现在能在 OpenAI API 里直接用了么？

目前在 OpenRouter 已可见并可按公开价调用 openai/gpt-5.4。OpenAI 直连 API 的可用性与计费细节可能因账户层级和合同不同而变化。

GPT-5.4 会比 GPT-5.2 更贵吗？

按当前 OpenRouter 公示价，GPT-5.4 高于 GPT-5.2。实际成本仍需结合你的 token 结构与缓存命中率评估。

GPT-5.3 Instant 到底是 128K 还是 400K？

按 API alias gpt-5.3-chat-latest 页面口径，当前是 128K。

为什么有人写 GPT-5.2 是 256K？

很多情况下 256K 是评测档位，不等于模型最大上下文上限。

GPT-5.2 升级到 GPT-5.4，生产环境怎么迁移更稳？

建议采用模型无关路由、按模型做 feature flag、先跑领域 Eval，再按流量比例灰度切换。

`gpt-5.3-chat-latest` 会自动变成 GPT-5.4 吗？

不要默认会自动升级。生产环境建议固定明确的模型 ID，避免不可控变化。

GPT-5.4 对长上下文 RAG 是“必然提升”吗？

不必然。上下文变大只是条件之一，检索质量、切片策略和评测体系同样关键。

2026 年 3 月，应该等 GPT-5.4 还是先用 GPT-5.2 上线？

如果你要尽快上线，优先用 GPT-5.2 并预留快速切模路径通常更务实；只有强依赖 1M+ 上下文时才更建议等待。

最后核对时间：2026 年 3 月 5 日

所有文章

#gpt-5.4 #openai api #发布时间 #开发者指南 #上下文窗口

GPT-5.4 发布时间（2026）：最新消息、泄露功能与开发者指南

GPT-5.4 发布时间（2026）：最新消息、泄露功能与开发者指南

GPT-5.4 时间线（2026 年 2 月至 3 月）

已确认 vs 未确认

现在上线还是等待？