GPT-5.4 API
GPT-5.4 API
Das erste General-Purpose-Modell mit nativem Computer Use, 1.05M Kontext, 128K Max-Output und deutlich besserer Token-Effizienz.

Abrechnungsregeln
- Input/Output werden pro 1M Tokens berechnet.
- Cache-Input: 90% Rabatt.
- Bei >272K Input: gesamte Session mit 2x Input und 1.5x Output.
- Regionale Verarbeitung: 10% Aufschlag.
- Reasoning-Tokens zählen als Output.
PRICING
| PLAN | CONTEXT WINDOW | MAX OUTPUT | INPUT | OUTPUT | CACHE READ |
|---|---|---|---|---|---|
| GPT-5.4 | 1.05M | 128.0K | $2.00-20% $2.50Official Price | $12.00-20% $15.00Official Price | $0.200-20% $0.250Official Price |
| GPT-5.4 (Beta) | 1.05M | 128.0K | $0.650-74% $2.50Official Price | $3.90-74% $15.00Official Price | $0.065-74% $0.250Official Price |
Pricing Note: Price unit: USD / 1M tokens
Cache Hit: Price applies to cached prompt tokens.
Two ways to run GPT-5.4 — pick the tier that matches your workload.
- · GPT-5.4: the default tier for production reliability and predictable availability.
- · GPT-5.4 (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.
| Modell | Metrik | Offiziell | EvoLink | Credits |
|---|---|---|---|---|
| GPT-5.4 | Input (Standard) | $2.50 / 1M | TBA | TBA |
| GPT-5.4 | Input (Cached) | $0.25 / 1M | TBA | TBA |
| GPT-5.4 | Input (>272K Prompt Tier) | $5.00 / 1M | TBA | TBA |
| GPT-5.4 | Output (Standard) | $15.00 / 1M | TBA | TBA |
| GPT-5.4 | Output (>272K Prompt Tier) | $22.50 / 1M | TBA | TBA |
Bei Ausfall wird automatisch auf die nächstgünstige verfügbare Option umgestellt, für 99.9% Uptime zum bestmöglichen Preis.
Capabilities
Native Computer Use: erstes General-Purpose-Modell, das Computer bedient
GPT-5.4 kann per Screenshot sowie Maus- und Tastaturaktionen klicken, tippen und Software navigieren, ohne separates Spezialmodell. In OSWorld-Verified erreicht GPT-5.4 75.0% und liegt damit über Menschen mit 72.4%.

1.05M Kontext mit besserer Token-Effizienz
Verarbeiten Sie ganze Codebases, buchlange Dokumente oder Monate an Verlauf in einer Anfrage. Gegenüber GPT-5.2 (400K) sind das 2.6x Kontext. Zusätzlich benötigt GPT-5.4 für ähnliche Aufgaben oft weniger Tokens.

Tiefes Reasoning mit Effort-Stufen
Fünf Reasoning-Level: none, low, medium, high, xhigh. Für härteste Aufgaben kann der Effort erhöht werden. GDPval: 83.0% (über 44 Berufe) vs GPT-5.2 mit 70.9%.

Warum Entwickler GPT-5.4 wählen
Frontier-Leistung plus pragmatische Integration über EvoLink.
Vollständiges Tool-Ökosystem mit Tool Search
Web Search, File Search, Image Gen, Code Interpreter, Hosted Shell, Computer Use, MCP und Tool Search sind nativ verfügbar. Tool Search hilft Agenten, passende Tools automatisch zu finden.
Bessere Ergebnisse mit weniger Tokens
GPT-5.4 ist sehr token-effizient. Trotz höherem Preis pro Token als GPT-5.2 ist die effektive Kosten pro Task oft ähnlich oder niedriger.
Ein Key, kein Setup
GPT-5.4 mit einem EvoLink API-Key. Migration von GPT-5.2 ist oft ein One-Line-Change beim model-Wert.
So integrieren Sie
In drei Schritten von API-Key bis Monitoring.
API-Key holen
Registrieren Sie sich bei EvoLink und erstellen Sie Ihren API-Key. Funktioniert sofort für GPT-5.4 und 47+ Modelle.
Request senden
Senden Sie POST mit model "gpt-5.4" plus messages und optionalen Parametern.
Deployen und überwachen
Überwachen Sie Usage, Kosten und Reasoning-Tokens im Dashboard.
Hauptfunktionen
Wichtige Fähigkeiten für produktive Agent- und Entwickler-Workflows.
1.05M Context Window
Geeignet für komplette Repositories und sehr lange Dokumente.
128K Max Output
Lange Ergebnisse in einer Antwort ohne häufige Fortsetzungen.
Native Computer Use
Steuert Computer über Screenshots plus Maus/Tastatur (OSWorld 75.0%, Mensch 72.4%).
Tool Search
Agenten finden automatisch die richtigen Tools.
Token Efficiency
Für viele Aufgaben weniger Token-Verbrauch als GPT-5.2.
Prompt Caching
Cache-Input kostet $0.25 pro 1M Tokens (90% günstiger).
Benchmarks: GPT-5.4 vs GPT-5.2
Verifizierte Benchmarks zeigen bessere Leistung bei professionellen Aufgaben, Tool-Nutzung, Browsing und Computer Use.
| Benchmark | GPT-5.4 | GPT-5.2 |
|---|---|---|
| GDPval | 83.0% | 70.9% |
| SWE-Bench Pro | 57.7% | 55.6% |
| OSWorld (Human: 72.4%) | 75.0% | 47.3% |
| Toolathlon | 54.6% | 46.3% |
| BrowseComp | 82.7% | 65.8% |
| MMMU-Pro | 81.2% | 79.5% |
| Factual errors per claim | 33% fewer | Baseline |
| Factual errors per response | 18% fewer | Baseline |
Datenübersicht
GPT-5.4
gpt-5.4-2026-03-05 | $2.50/$15/$0.25 | 1.05M/128K | reasoning none→xhigh | all tools
GPT-5.4 Thinking
Nur in ChatGPT, kein separates API-Modell
Änderungen gegenüber V1
- GPT-5.4 Thinking klarer eingeordnet (ChatGPT-only).
- Native Computer Use als Kernfähigkeit hervorgehoben.
- Token-Effizienz als zentrale Kostenbotschaft ergänzt.
- Tool Search klarer dokumentiert.
- Benchmark-Block gegen GPT-5.2 ergänzt.
- SEO-Title/Description für schnellere Kaufentscheidung überarbeitet.
Häufige Fragen
Everything you need to know about the product and billing.
Verwandte Ressourcen
Interne Links zu Release-Infos, Pricing-Analysen, Vergleichen und Migrationsentscheidungen.