GPT-5.4 API
GPT-5.4 API
El primer modelo general con computer use nativo, 1.05M de contexto, 128K de salida máxima y mejor eficiencia de tokens.

Reglas de facturación
- Input/output se facturan por 1M tokens.
- Input en caché: 90% de descuento.
- Si supera 272K input: toda la sesión se factura a 2x input y 1.5x output.
- Procesamiento regional: recargo del 10%.
- Los reasoning tokens cuentan como output.
PRICING
| PLAN | CONTEXT WINDOW | MAX OUTPUT | INPUT | OUTPUT | CACHE READ |
|---|---|---|---|---|---|
| GPT-5.4 | 1.05M | 128.0K | $2.00-20% $2.50Official Price | $12.00-20% $15.00Official Price | $0.200-20% $0.250Official Price |
| GPT-5.4 (Beta) | 1.05M | 128.0K | $0.650-74% $2.50Official Price | $3.90-74% $15.00Official Price | $0.065-74% $0.250Official Price |
Pricing Note: Price unit: USD / 1M tokens
Cache Hit: Price applies to cached prompt tokens.
Two ways to run GPT-5.4 — pick the tier that matches your workload.
- · GPT-5.4: the default tier for production reliability and predictable availability.
- · GPT-5.4 (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.
| Modelo | Métrica | Oficial | EvoLink | Credits |
|---|---|---|---|---|
| GPT-5.4 | Input (Standard) | $2.50 / 1M | TBA | TBA |
| GPT-5.4 | Input (Cached) | $0.25 / 1M | TBA | TBA |
| GPT-5.4 | Input (>272K Prompt Tier) | $5.00 / 1M | TBA | TBA |
| GPT-5.4 | Output (Standard) | $15.00 / 1M | TBA | TBA |
| GPT-5.4 | Output (>272K Prompt Tier) | $22.50 / 1M | TBA | TBA |
Si no está disponible, cambiamos automáticamente a la opción disponible más barata para mantener 99.9% de uptime al mejor precio posible.
Capacidades
Computer use nativo: primer modelo general que opera computadoras
GPT-5.4 puede hacer clic, escribir y navegar software usando capturas de pantalla y comandos de teclado/ratón, sin un modelo especializado aparte. En OSWorld-Verified, GPT-5.4 alcanza 75.0%, superando el rendimiento humano (72.4%).

Contexto de 1.05M con mejor eficiencia de tokens
Procesa repositorios completos, documentos muy largos o meses de historial en una sola solicitud. Son 2.6x frente a los 400K de GPT-5.2. Además, GPT-5.4 suele usar menos tokens para tareas equivalentes.

Razonamiento ajustable
Cinco niveles de razonamiento: none, low, medium, high y xhigh. Para problemas más difíciles, se puede aumentar el esfuerzo para un razonamiento más profundo. GDPval: 83.0% frente a 70.9% de GPT-5.2.

Por qué los desarrolladores eligen GPT-5.4
Capacidad frontier, ecosistema de herramientas y una integración práctica.
Ecosistema completo de herramientas con Tool Search
Incluye web search, file search, image gen, code interpreter, hosted shell, computer use, MCP y tool search. Tool Search ayuda a los agentes a elegir automáticamente la herramienta correcta.
Mejores resultados con menos tokens
GPT-5.4 es más eficiente en tokens. Aunque el precio por token sea mayor que GPT-5.2, el costo real por tarea suele ser similar o menor.
Una sola clave, cero configuración
Accede a GPT-5.4 con una sola API key de EvoLink. Migrar desde GPT-5.2 suele requerir solo cambiar la cadena del modelo.
Cómo integrar
Tres pasos para pasar a producción.
Obtén tu API key
Regístrate en EvoLink y genera tu clave. Funciona de inmediato con GPT-5.4 y más de 47 modelos.
Envía tu solicitud
Haz POST con model "gpt-5.4", tu arreglo messages y parámetros opcionales.
Despliega y monitorea
Monitorea uso, costos y tokens de razonamiento en el dashboard.
Funciones clave
Capacidades centrales para agentes y flujos de trabajo en producción.
1.05M Context Window
Permite procesar repos completos y documentos extensos.
128K Max Output
Genera respuestas largas y completas en una sola pasada.
Native Computer Use
Opera computadoras vía capturas + teclado/ratón (OSWorld 75.0%, humano 72.4%).
Tool Search
Los agentes encuentran automáticamente las herramientas adecuadas.
Token Efficiency
Menor consumo de tokens que GPT-5.2 en muchos problemas equivalentes.
Prompt Caching
Entrada cacheada a $0.25/1M (90% de descuento).
Benchmarks: GPT-5.4 vs GPT-5.2
Los benchmarks verificados muestran mejoras en trabajo profesional, uso de herramientas, navegación web y computer use.
| Benchmark | GPT-5.4 | GPT-5.2 |
|---|---|---|
| GDPval | 83.0% | 70.9% |
| SWE-Bench Pro | 57.7% | 55.6% |
| OSWorld (Human: 72.4%) | 75.0% | 47.3% |
| Toolathlon | 54.6% | 46.3% |
| BrowseComp | 82.7% | 65.8% |
| MMMU-Pro | 81.2% | 79.5% |
| Factual errors per claim | 33% fewer | Baseline |
| Factual errors per response | 18% fewer | Baseline |
Resumen de datos
GPT-5.4
gpt-5.4-2026-03-05 | $2.50/$15/$0.25 | 1.05M/128K | reasoning none→xhigh | all tools
GPT-5.4 Thinking
Solo en ChatGPT, no es un modelo API separado
Qué cambió desde V1
- Se añadió aclaración sobre GPT-5.4 Thinking (solo ChatGPT).
- Native computer use se movió como capacidad principal.
- Se reforzó el mensaje de eficiencia de tokens.
- Se añadieron detalles de Tool Search.
- Se añadió benchmark comparativo con GPT-5.2.
- Se actualizó SEO title/description para intención quick start.
Preguntas frecuentes
Everything you need to know about the product and billing.
Recursos relacionados
Enlaces internos a notas de lanzamiento, análisis de precios, comparativas y migración.