
GPT-5.4 发布时间(2026):最新消息、泄露功能与开发者指南

GPT-5.4 发布时间(2026):最新消息、泄露功能与开发者指南
如果你在搜“GPT-5.4 什么时候发布”或“GPT-5.4 API 何时可用”,本质上是在做同一个决策:现在开工,还是等待新模型。
这篇文章把已确认信息、可信线索和未证实传闻分开,帮助你做更稳健的产品与技术决策。
openai/gpt-5.4 上架,并公布价格($2.50 / 1M 输入、$0.625 / 1M 缓存输入、$20.00 / 1M 输出)、1M 上下文、128K 最大输出。OpenAI 直连渠道与企业合同价格仍可能不同。GPT-5.4 时间线(2026 年 2 月至 3 月)
- 2026-02-27: Codex PR #13050 新增原始分辨率图片支持,最初把最低模型版本设为 GPT-5.4。在 5 小时内经历 7 次 force push 后,阈值改为 GPT-5.3-Codex。该 PR 于 2026-03-03 合并。(来源:GitHub PR #13050)
- 2026-03-02: Codex PR #13212 新增
/fast斜杠命令,最初描述为“为 GPT-5.4 切换 Fast 模式”,相关表述在 3 小时内被清理。(来源:Awesome Agents) - 2026-03-02: 另有一条线索:OpenAI Codex 团队成员 Tibo 在 X 误发截图,显示 Codex 应用中 GPT-5.4 与 GPT-5.3-Codex 同时可选,随后很快删除。(来源:NxCode, eWeek)
- 2026-03-03: OpenAI 在 X 发布 “5.4 sooner than you think”。
- 2026-03-03:
alpha-gpt-5.4短暂出现在公开 API models endpoint,随后被移除。 - 2026-03-04: The Information 报道 GPT-5.4 可能包含超过 100 万 token 的上下文窗口,以及 “extreme” 思考模式。
- 2026-03-04: PiunikaWeb 报道 LMSYS Arena 上出现 GPT-5.4 活动迹象,暗示内部测试正在进行。
- 2026-03-05: OpenRouter 上架
openai/gpt-5.4,并公开 token 价格与上下文/输出上限。
已确认 vs 未确认
| 项目 | 相对可引用信息 | 仍不确定 | 对业务的影响 |
|---|---|---|---|
| 可用性 | OpenRouter 已上架 openai/gpt-5.4(2026-03-05) | OpenAI 直连层级是否完全一致 | 影响上线与采购节奏 |
| 上下文窗口 | OpenRouter 标注 1M 上下文 | 跨渠道一致性与满载质量表现 | 影响长上下文架构 |
| extreme 模式 | 媒体提及高算力推理模式 | 定价、延迟、可用层级 | 影响成本与体验 |
| API 价格 | OpenRouter 公示 $2.50 输入 / $20 输出(含缓存输入价) | OpenAI 直连与企业合同细则 | 影响预算和毛利 |
现在上线还是等待?
- 你要在 1-2 周内上线。
- 400K 上下文已经够用。
- 你更看重延迟而不是极限推理深度。
- 你的核心能力现在就依赖 1M 上下文。
- 你可以并行跑质量/延迟/成本评测。
- 你已有模型路由与回退策略,能接受早期波动。
推荐策略:保留 GPT-5.2 作为稳定基线,把 GPT-5.4 先接入小流量,评测通过后再逐步放量。
开发者准备清单(早期上架期)
1. 先做模型无关路由
将推理入口收敛到内部统一接口,后续切模只改配置不改业务代码。
2. 提前建设 Eval 套件
覆盖真实高难任务、长上下文案例、回归测试和单任务成本。
3. 先定义“变好”的标准
建议固定:任务质量、P95 延迟、每任务成本、领域幻觉率。
EvoLink 接入建议
GPT-5.4 已在 OpenRouter 公开上架后,EvoLink 接入可优先验证以下基线:
- 可用性与高并发稳定性
- 延迟基线(P50 / P95)
- 错误处理与回退行为
- 相对 GPT-5.2 的质量增益与成本增量
$1.40/1M 输入、$11.20/1M 输出。GPT-5.4 的 EvoLink 最终价格请以正式价格页为准。GPT-5 家族快照(API 口径)
| 模型 | 日期 | 上下文窗口 | 定位 | EvoLink 价格 |
|---|---|---|---|---|
| GPT-5.3 Instant | 2026-03-03 | 128K(gpt-5.3-chat-latest) | 日常任务高响应 | N/A |
| GPT-5.2 Thinking | 2025-12-11 | 400K | 深度推理 | $1.40/1M 输入 |
| GPT-5.2-Codex | 2025-12-18(OpenAI 发布)/ 2026-01-14(Copilot GA) | 400K | Agent 编码 | $1.40/1M 输入 |
| GPT-5.1 | 2025-11 | 400K | 通用模型 | $1.00/1M 输入 |
| GPT-5.4 | 2026-03(OpenRouter 上架) | 1M(OpenRouter 标注) | 旗舰升级 | EvoLink 待定 |
FAQ
GPT-5.4 官方发布日期确定了吗?
GPT-5.4 已在 2026 年 3 月 5 日于 OpenRouter 上架。OpenAI 直连渠道的放量节奏仍可能因账号层级不同而存在差异。
GPT-5.4 现在能在 OpenAI API 里直接用了么?
openai/gpt-5.4。OpenAI 直连 API 的可用性与计费细节可能因账户层级和合同不同而变化。GPT-5.4 会比 GPT-5.2 更贵吗?
按当前 OpenRouter 公示价,GPT-5.4 高于 GPT-5.2。实际成本仍需结合你的 token 结构与缓存命中率评估。
GPT-5.3 Instant 到底是 128K 还是 400K?
gpt-5.3-chat-latest 页面口径,当前是 128K。为什么有人写 GPT-5.2 是 256K?
很多情况下 256K 是评测档位,不等于模型最大上下文上限。
GPT-5.2 升级到 GPT-5.4,生产环境怎么迁移更稳?
建议采用模型无关路由、按模型做 feature flag、先跑领域 Eval,再按流量比例灰度切换。
gpt-5.3-chat-latest 会自动变成 GPT-5.4 吗?
不要默认会自动升级。生产环境建议固定明确的模型 ID,避免不可控变化。
GPT-5.4 对长上下文 RAG 是“必然提升”吗?
不必然。上下文变大只是条件之一,检索质量、切片策略和评测体系同样关键。
2026 年 3 月,应该等 GPT-5.4 还是先用 GPT-5.2 上线?
如果你要尽快上线,优先用 GPT-5.2 并预留快速切模路径通常更务实;只有强依赖 1M+ 上下文时才更建议等待。


