
GPT-5.5 API 요금 가이드 2026: 비용, 캐시 입력 & 장문 컨텍스트 요금

GPT-5.5 API 요금 가이드 2026: 비용, 캐시 입력 & 장문 컨텍스트 요금
GPT-5.5 API 요금표
| 과금 항목 | EvoLink 가격 | 비고 |
|---|---|---|
| 표준 입력 | $4.00 / 100만 토큰 | 프롬프트, 시스템 지시, 대화 기록, 기타 입력 텍스트 |
| 출력 | $24.00 / 100만 토큰 | 표시되는 응답 토큰, 추론 토큰이 포함될 수 있음 |
| 캐시 입력 | $0.40 / 100만 토큰 | 재사용되는 프롬프트/컨텍스트 세그먼트에 할인 요금 적용 |
| 장문 컨텍스트 입력 | $8.00 / 100만 토큰 | 입력이 272K 토큰 초과 시 적용 |
| 장문 컨텍스트 출력 | $36.00 / 100만 토큰 | 동일 장문 컨텍스트 세션에서 적용 |
| 컨텍스트 윈도우 | 100만 토큰 | 큰 프롬프트가 임계값을 넘을 때 장문 컨텍스트 과금 규칙에 유의 |
| 최대 출력 | 128K 토큰 | 출력 한도이며, 보장되는 응답 길이가 아님 |
GPT-5.5 과금 방식
GPT-5.5 과금에는 입력, 출력, 캐시 입력의 세 가지 토큰 카테고리가 있습니다.
캐시 입력 예시
애플리케이션이 50K 토큰의 고정 지시 및 문서 블록을 매번 전송한다고 가정합니다.
| 요청 유형 | 계산 | 비용 |
|---|---|---|
| 최초 요청 (캐시 없음) | 50K × $4.00 / 100만 | $0.20 |
| 이후 요청 (캐시 적용) | 50K × $0.40 / 100만 | $0.02 |
이 차이가 안정적인 프롬프트 설계가 중요한 이유입니다. 재사용 가능한 지시는 요청 간에 완전히 동일하게 유지하고, 길고 안정적인 컨텍스트는 일관되게 재사용 가능한 위치에 배치하세요.
272K 토큰 초과 시 장문 컨텍스트 요금
GPT-5.5는 대용량 컨텍스트 윈도우를 지원하지만, 장문 컨텍스트 프롬프트에는 별도의 비용 계획이 필요합니다. EvoLink에서 입력이 272K 토큰을 초과할 때 장문 컨텍스트 요금은 다음과 같습니다.
| GPT-5.5 등급 | 입력 | 출력 |
|---|---|---|
| 표준 요금 | $4.00 / 100만 | $24.00 / 100만 |
| 장문 컨텍스트 요금 | $8.00 / 100만 | $36.00 / 100만 |
장문 컨텍스트 요금은 272K을 초과한 토큰만이 아니라 세션 전체에 적용됩니다. 300K 입력 토큰을 보내면 300K 전체가 장문 컨텍스트 입력 요금으로 과금됩니다.
장문 컨텍스트 비용 예시
300K 입력 / 20K 출력 요청:
| 항목 | 계산 | 비용 |
|---|---|---|
| 입력 | 300K × $8.00 / 100만 | $2.40 |
| 출력 | 20K × $36.00 / 100만 | $0.72 |
| 합계 | $2.40 + $0.72 | $3.12 |
같은 요청이 장문 컨텍스트 임계값 이하라면 표준 요금으로 $1.68입니다. 반드시 컨텍스트를 잘게 나눠야 한다는 뜻이 아니라, 한 번의 전체 컨텍스트 요청에 추가 비용을 지불할 가치가 있는지 판단하라는 뜻입니다.
GPT-5.5 API 비용 예시
아래 예시는 비용 계획의 참고용입니다. 실제 청구액은 프롬프트 길이, 출력 길이, 캐시 적중률, 재시도 횟수, 추론 토큰 생성 여부에 따라 달라집니다.
| 시나리오 | 입력 | 출력 | 적용 요금 | 예상 비용 |
|---|---|---|---|---|
| 고객 지원 응답 | 2K | 500 | 표준 | $0.020 |
| 코드 리뷰 | 20K | 5K | 표준 | $0.200 |
| 리포지토리 분석 | 300K | 20K | 장문 컨텍스트 | $3.120 |
비용 계산:
- 2K 입력 + 500 출력 =
(2,000 × $4 / 100만) + (500 × $24 / 100만)= $0.020 - 20K 입력 + 5K 출력 =
(20,000 × $4 / 100만) + (5,000 × $24 / 100만)= $0.200 - 300K 입력 + 20K 출력 =
(300,000 × $8 / 100만) + (20,000 × $36 / 100만)= $3.120
GPT-5.5 vs GPT-5.4 요금 비교
GPT-5.5는 프리미엄 라우트, GPT-5.4는 가성비 좋은 플래그십 라우트입니다. 여기서는 간단히 비교하며, 상세 비교는 GPT-5.5 vs GPT-5.4 전용 글을 참고하세요.
| 모델 | 입력 | 출력 | 캐시 입력 | 컨텍스트 |
|---|---|---|---|---|
| GPT-5.5 | $4.00 / 100만 | $24.00 / 100만 | $0.40 / 100만 | 100만 |
| GPT-5.4 | $2.00 / 100만 | $12.00 / 100만 | $0.20 / 100만 | 105만 |
장문 컨텍스트를 저렴하게 사용하려면 GPT-5.4를 선택하세요. 추론 부하가 높거나, 품질이 중요하거나, 재시도 비용이 큰 작업에는 GPT-5.5를 테스트해 볼 가치가 있습니다.
GPT-5.5를 써야 할 때
GPT-5.5는 모든 요청의 기본값이 아닙니다. 작업 가치가 프리미엄 요금을 정당화하는 시나리오에서 사용해야 합니다.
적합한 경우
- 오답 비용이 큰 복잡한 추론 작업
- 전체 코드베이스 분석, 아키텍처 리뷰, 멀티 파일 디버깅
- 다수 문서를 아우르는 리서치 종합
- 계획 품질이 재시도를 줄이는 에이전트 워크플로
- 수작업 수정을 최소화해야 하는 고가치 출력
적합하지 않은 경우
- 단순 분류
- 대량 요약
- 경량 정보 추출
- 마진이 낮은 콘텐츠 생성
- 저렴한 모델이면 충분한 프로토타이핑
실용적인 원칙은 간단합니다. 더 나은 추론이 실패, 재시도, 사람의 검토를 줄일 수 있다면 GPT-5.5, 루틴 작업이라면 저렴한 GPT 라우트를 사용하세요.
GPT-5.5 API 비용을 줄이는 방법
1. 안정적인 프롬프트를 캐시하기
시스템 프롬프트, 정책, 도구 설명, 문서 블록을 요청 간에 고정하세요. 캐시 입력은 $0.40 / 100만 토큰, 표준 입력은 $4.00 / 100만 토큰입니다.
2. 단순 작업은 다른 모델로 라우팅
모든 요청을 GPT-5.5에 보낼 필요는 없습니다. 단순 작업에는 저비용 GPT 라우트를 사용하고, GPT-5.5는 에스컬레이션이나 고가치 추론에 한정하세요.
def select_model(task_complexity: str) -> str:
if task_complexity == "simple":
return "gpt-5.1"
if task_complexity == "standard":
return "gpt-5.2"
if task_complexity == "long_context":
return "gpt-5.4"
return "gpt-5.5"3. 불필요한 장문 컨텍스트 요청 피하기
프롬프트가 272K 토큰 근처라면, 검색, 요약, 청킹으로 응답 품질을 해치지 않으면서 요청 크기를 줄일 수 있는지 확인하세요.
4. 성공 작업당 비용 추적
토큰당 비용은 하나의 지표일 뿐입니다. 재시도 횟수, 검증 실패율, 사람의 리뷰 시간, 레이턴시, 최종 성공률을 추적하세요. 더 비싼 모델이라도 반복 실패를 방지하면 총비용이 낮아질 수 있습니다. 단, 본인의 워크플로에서 실측해야 합니다.
5. GPT-5.5를 에스컬레이션 라우트로 사용
흔한 패턴은 GPT-5.2 또는 GPT-5.4로 먼저 처리한 후, 검증 실패, 신뢰도 저하, 사용자의 심층 분석 요청 시에만 GPT-5.5로 에스컬레이션하는 것입니다.
자주 묻는 질문
GPT-5.5 API 요금은 얼마인가요?
EvoLink에서 GPT-5.5는 입력 $4.00 / 100만 토큰, 출력 $24.00 / 100만 토큰, 캐시 입력 $0.40 / 100만 토큰입니다. 272K 토큰 초과 시 장문 컨텍스트 요금은 입력 $8.00, 출력 $36.00 / 100만 토큰입니다.
GPT-5.5 캐시 입력 요금은 얼마인가요?
EvoLink에서 GPT-5.5 캐시 입력 요금은 $0.40 / 100만 토큰입니다. 안정적인 지시, 문서, 도구 정의, 대화 템플릿을 반복 전송할 때 유용합니다.
입력이 272K 토큰을 초과하면 어떻게 되나요?
입력이 272K 토큰을 초과하면 EvoLink에서 GPT-5.5 장문 컨텍스트 요금이 적용됩니다. 입력 $8.00 / 100만 토큰, 출력 $36.00 / 100만 토큰으로, 세션 전체에 적용됩니다.
GPT-5.5가 GPT-5.4보다 비싼가요?
네. EvoLink에서 GPT-5.5는 $4.00 / $24.00 (100만 입력/출력 토큰), GPT-5.4는 $2.00 / $12.00입니다.
코딩에 GPT-5.5를 쓸 가치가 있나요?
멀티 파일 디버깅, 리포지토리 분석, 아키텍처 리뷰, 에이전틱 코딩 워크플로 등 복잡한 코딩 작업에는 GPT-5.5를 테스트할 가치가 있습니다. 단순 코드 완성이나 소규모 편집에는 저비용 GPT 라우트가 더 효율적입니다.
OpenAI 호환 API로 GPT-5.5를 사용할 수 있나요?
네. EvoLink은 OpenAI 호환 통합 경로를 제공하므로, 대부분의 팀은 base URL, API 키, 모델 값만 변경하면 마이그레이션할 수 있습니다.
from openai import OpenAI
client = OpenAI(
api_key="your-evolink-api-key",
base_url="https://api.evolink.ai/v1"
)
response = client.chat.completions.create(
model="gpt-5.5",
messages=[
{"role": "user", "content": "이 코드베이스의 주요 위험 요소를 요약해 주세요."}
]
)GPT-5.5와 다른 GPT 모델을 어디서 비교할 수 있나요?
먼저 요금을 파악하고, 본인의 작업에서 테스트하세요
GPT-5.5는 프리미엄 라우트이므로, 올바른 질문은 "토큰당 얼마인가"가 아니라 "성공 작업당 얼마인가"입니다.
소규모 테스트 세트로 시작하여 재시도 횟수와 리뷰 시간을 측정하고, GPT-5.5를 GPT-5.4 또는 GPT-5.2와 비교한 후, 결과에 실질적 차이를 만드는 워크플로에 GPT-5.5를 투입하세요.


