GPT-5.4 API
GPT-5.4 API
네이티브 computer use, 1.05M 컨텍스트, 128K 최대 출력, 그리고 향상된 token 효율을 갖춘 최초의 범용 모델입니다.

과금 규칙
- 입력/출력은 1M tokens 단위로 과금됩니다.
- 캐시 입력은 90% 할인됩니다.
- 입력이 272K를 초과하면 전체 세션이 입력 2x, 출력 1.5x로 과금됩니다.
- 리전 처리에는 10% 추가 요금이 적용됩니다.
- reasoning tokens는 출력으로 과금됩니다.
PRICING
| PLAN | CONTEXT WINDOW | MAX OUTPUT | INPUT | OUTPUT | CACHE READ |
|---|---|---|---|---|---|
| GPT-5.4 | 1.05M | 128.0K | $2.00-20% $2.50Official Price | $12.00-20% $15.00Official Price | $0.200-20% $0.250Official Price |
| GPT-5.4 (Beta) | 1.05M | 128.0K | $0.650-74% $2.50Official Price | $3.90-74% $15.00Official Price | $0.065-74% $0.250Official Price |
Pricing Note: Price unit: USD / 1M tokens
Cache Hit: Price applies to cached prompt tokens.
Two ways to run GPT-5.4 — pick the tier that matches your workload.
- · GPT-5.4: the default tier for production reliability and predictable availability.
- · GPT-5.4 (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.
| 모델 | 항목 | 공식 | EvoLink | Credits |
|---|---|---|---|---|
| GPT-5.4 | Input (Standard) | $2.50 / 1M | TBA | TBA |
| GPT-5.4 | Input (Cached) | $0.25 / 1M | TBA | TBA |
| GPT-5.4 | Input (>272K Prompt Tier) | $5.00 / 1M | TBA | TBA |
| GPT-5.4 | Output (Standard) | $15.00 / 1M | TBA | TBA |
| GPT-5.4 | Output (>272K Prompt Tier) | $22.50 / 1M | TBA | TBA |
장애 시 사용 가능한 더 저렴한 대체 경로로 자동 전환하여 99.9% 가용성과 최적 가격을 목표로 합니다.
핵심 역량
네이티브 computer use: 컴퓨터를 직접 조작하는 첫 범용 모델
GPT-5.4는 스크린샷과 키보드/마우스 명령으로 클릭, 입력, 소프트웨어 탐색을 수행합니다. 별도 특화 모델 없이 작동합니다. OSWorld-Verified에서 75.0%를 기록해 인간(72.4%)을 상회합니다.

1.05M 컨텍스트 + 더 나은 token 효율
전체 코드베이스, 장문 문서, 수개월 대화 이력을 단일 요청에서 처리합니다. GPT-5.2의 400K 대비 2.6배이며, 유사 난이도 문제에서 token 소비를 크게 줄일 수 있습니다.

조절 가능한 추론 강도
추론 강도는 none, low, medium, high, xhigh의 5단계를 지원합니다. 가장 어려운 문제에서는 추론 강도를 높여 더 깊은 추론이 가능합니다. GDPval은 83.0%(GPT-5.2는 70.9%).

개발자가 GPT-5.4를 선택하는 이유
프런티어 성능과 실전 통합성을 함께 제공합니다.
Tool Search를 포함한 풀 툴 생태계
web search, file search, image gen, code interpreter, hosted shell, computer use, MCP, tool search를 네이티브 지원합니다. Tool Search는 대규모 커넥터 환경에서 적절한 도구를 자동 선택하도록 돕습니다.
더 나은 결과, 더 적은 tokens
GPT-5.4는 token 효율이 높아 많은 작업에서 GPT-5.2 대비 token 사용량이 감소합니다. 단가가 더 높아도 작업당 실효 비용은 비슷하거나 더 낮아질 수 있습니다.
한 개의 키, 제로 셋업
EvoLink API 키 하나로 GPT-5.4를 사용합니다. GPT-5.2에서의 마이그레이션은 model 문자열 변경 한 줄로 끝나는 경우가 많습니다.
연동 방법
3단계로 프로덕션 적용까지 완료합니다.
API 키 발급
EvoLink 가입 후 API 키를 발급하세요. GPT-5.4 및 47+ 모델에 즉시 사용 가능합니다.
요청 전송
model을 "gpt-5.4"로 설정하고 messages 배열 및 옵션 파라미터와 함께 POST 요청을 보냅니다.
배포 및 모니터링
대시보드에서 사용량, 비용, reasoning token을 모니터링합니다.
주요 기능
프로덕션 에이전트 워크플로에 필요한 핵심 기능입니다.
1.05M Context Window
전체 리포지토리와 장문 문서를 한 번에 처리합니다.
128K Max Output
긴 문서도 단일 응답으로 생성 가능합니다.
Native Computer Use
스크린샷 + 키보드/마우스로 컴퓨터 조작(OSWorld 75.0%, 인간 72.4%).
Tool Search
에이전트가 적합한 도구를 자동으로 찾고 사용합니다.
Token Efficiency
동등 문제에서 GPT-5.2보다 token 사용량을 줄일 수 있습니다.
Prompt Caching
캐시 입력은 $0.25/1M (90% 할인).
벤치마크: GPT-5.4 vs GPT-5.2
검증된 벤치마크에서 전문 업무, 도구 사용, 웹 탐색, computer use 성능 향상이 확인되었습니다.
| 벤치마크 | GPT-5.4 | GPT-5.2 |
|---|---|---|
| GDPval | 83.0% | 70.9% |
| SWE-Bench Pro | 57.7% | 55.6% |
| OSWorld (Human: 72.4%) | 75.0% | 47.3% |
| Toolathlon | 54.6% | 46.3% |
| BrowseComp | 82.7% | 65.8% |
| MMMU-Pro | 81.2% | 79.5% |
| Factual errors per claim | 33% fewer | Baseline |
| Factual errors per response | 18% fewer | Baseline |
데이터 요약
GPT-5.4
gpt-5.4-2026-03-05 | $2.50/$15/$0.25 | 1.05M/128K | reasoning none→xhigh | all tools
GPT-5.4 Thinking
ChatGPT 전용이며, 별도 API 모델이 아닙니다
V1 대비 변경 사항
- GPT-5.4 Thinking 관련 설명을 추가했습니다.
- Native computer use를 핵심 역량으로 재배치했습니다.
- token 효율 메시지를 강화했습니다.
- Tool Search 설명을 추가했습니다.
- GPT-5.4 vs GPT-5.2 벤치마크 비교를 추가했습니다.
- 빠른 도입 검색 의도에 맞게 SEO 문구를 업데이트했습니다.
자주 묻는 질문
Everything you need to know about the product and billing.
관련 리소스
릴리스 정보, 가격 분석, 비교, 마이그레이션 의사결정 관련 내부 링크입니다.