HappyHorse 1.0 정식 출시지금 사용하기
GPT-5.5 API 요금 가이드 2026: 비용, 캐시 입력 & 장문 컨텍스트 요금
guide

GPT-5.5 API 요금 가이드 2026: 비용, 캐시 입력 & 장문 컨텍스트 요금

EvoLink Team
EvoLink Team
Product Team
2026년 4월 26일
15분 소요

GPT-5.5 API 요금 가이드 2026: 비용, 캐시 입력 & 장문 컨텍스트 요금

EvoLink에서 GPT-5.5 API 요금은 입력 $4.00 / 100만 토큰, 출력 $24.00 / 100만 토큰, 캐시 입력 $0.40 / 100만 토큰입니다. 입력이 272K 토큰을 초과하는 세션에서는 장문 컨텍스트 요금이 적용되어 입력 $8.00, 출력 $36.00 / 100만 토큰이 됩니다.
이 가이드는 GPT-5.5 요금만 다룹니다. GPT 전체 모델 비교가 필요하다면 GPT-5 API 요금 비교를 참고하세요.
요금 참고: 이 글의 GPT-5.5 가격은 2026년 4월 26일 기준 EvoLink 표시 가격입니다. OpenAI 공식 요금을 인용할 때는 OpenAI 공식 페이지를 별도로 확인하세요.

GPT-5.5 API 요금표

과금 항목EvoLink 가격비고
표준 입력$4.00 / 100만 토큰프롬프트, 시스템 지시, 대화 기록, 기타 입력 텍스트
출력$24.00 / 100만 토큰표시되는 응답 토큰, 추론 토큰이 포함될 수 있음
캐시 입력$0.40 / 100만 토큰재사용되는 프롬프트/컨텍스트 세그먼트에 할인 요금 적용
장문 컨텍스트 입력$8.00 / 100만 토큰입력이 272K 토큰 초과 시 적용
장문 컨텍스트 출력$36.00 / 100만 토큰동일 장문 컨텍스트 세션에서 적용
컨텍스트 윈도우100만 토큰큰 프롬프트가 임계값을 넘을 때 장문 컨텍스트 과금 규칙에 유의
최대 출력128K 토큰출력 한도이며, 보장되는 응답 길이가 아님
가장 중요한 과금 규칙은 272K 임계값입니다. GPT-5.5는 100만 토큰 컨텍스트 윈도우를 지원하지만, 프롬프트가 너무 크면 전체 세션이 장문 컨텍스트 요금으로 전환됩니다.

GPT-5.5 과금 방식

GPT-5.5 과금에는 입력, 출력, 캐시 입력의 세 가지 토큰 카테고리가 있습니다.

입력 토큰은 모델에 보내는 모든 토큰입니다. 사용자 프롬프트, 시스템 메시지, 이전 대화, 검색된 문서, 코드 스니펫, 도구 지시가 포함됩니다.
출력 토큰은 모델이 생성하는 토큰입니다. 추론 모델의 경우, API 응답 및 모델 설정에 따라 표시 텍스트 외에 추론 토큰이 포함될 수 있습니다.
캐시 입력 토큰은 반복되는 입력 세그먼트로, 할인 요금이 적용됩니다. 동일한 시스템 프롬프트, 정책 블록, 도구 설명, 문서 팩, 대화 템플릿을 반복 전송할 때 캐싱이 큰 효과를 발휘합니다.

캐시 입력 예시

애플리케이션이 50K 토큰의 고정 지시 및 문서 블록을 매번 전송한다고 가정합니다.

요청 유형계산비용
최초 요청 (캐시 없음)50K × $4.00 / 100만$0.20
이후 요청 (캐시 적용)50K × $0.40 / 100만$0.02

이 차이가 안정적인 프롬프트 설계가 중요한 이유입니다. 재사용 가능한 지시는 요청 간에 완전히 동일하게 유지하고, 길고 안정적인 컨텍스트는 일관되게 재사용 가능한 위치에 배치하세요.

272K 토큰 초과 시 장문 컨텍스트 요금

GPT-5.5는 대용량 컨텍스트 윈도우를 지원하지만, 장문 컨텍스트 프롬프트에는 별도의 비용 계획이 필요합니다. EvoLink에서 입력이 272K 토큰을 초과할 때 장문 컨텍스트 요금은 다음과 같습니다.

GPT-5.5 등급입력출력
표준 요금$4.00 / 100만$24.00 / 100만
장문 컨텍스트 요금$8.00 / 100만$36.00 / 100만

장문 컨텍스트 요금은 272K을 초과한 토큰만이 아니라 세션 전체에 적용됩니다. 300K 입력 토큰을 보내면 300K 전체가 장문 컨텍스트 입력 요금으로 과금됩니다.

장문 컨텍스트 비용 예시

300K 입력 / 20K 출력 요청:

항목계산비용
입력300K × $8.00 / 100만$2.40
출력20K × $36.00 / 100만$0.72
합계$2.40 + $0.72$3.12

같은 요청이 장문 컨텍스트 임계값 이하라면 표준 요금으로 $1.68입니다. 반드시 컨텍스트를 잘게 나눠야 한다는 뜻이 아니라, 한 번의 전체 컨텍스트 요청에 추가 비용을 지불할 가치가 있는지 판단하라는 뜻입니다.

GPT-5.5 API 비용 예시

아래 예시는 비용 계획의 참고용입니다. 실제 청구액은 프롬프트 길이, 출력 길이, 캐시 적중률, 재시도 횟수, 추론 토큰 생성 여부에 따라 달라집니다.

시나리오입력출력적용 요금예상 비용
고객 지원 응답2K500표준$0.020
코드 리뷰20K5K표준$0.200
리포지토리 분석300K20K장문 컨텍스트$3.120

비용 계산:

  • 2K 입력 + 500 출력 = (2,000 × $4 / 100만) + (500 × $24 / 100만) = $0.020
  • 20K 입력 + 5K 출력 = (20,000 × $4 / 100만) + (5,000 × $24 / 100만) = $0.200
  • 300K 입력 + 20K 출력 = (300,000 × $8 / 100만) + (20,000 × $36 / 100만) = $3.120

GPT-5.5 vs GPT-5.4 요금 비교

GPT-5.5는 프리미엄 라우트, GPT-5.4는 가성비 좋은 플래그십 라우트입니다. 여기서는 간단히 비교하며, 상세 비교는 GPT-5.5 vs GPT-5.4 전용 글을 참고하세요.

모델입력출력캐시 입력컨텍스트
GPT-5.5$4.00 / 100만$24.00 / 100만$0.40 / 100만100만
GPT-5.4$2.00 / 100만$12.00 / 100만$0.20 / 100만105만

장문 컨텍스트를 저렴하게 사용하려면 GPT-5.4를 선택하세요. 추론 부하가 높거나, 품질이 중요하거나, 재시도 비용이 큰 작업에는 GPT-5.5를 테스트해 볼 가치가 있습니다.

GPT-5.5를 써야 할 때

GPT-5.5는 모든 요청의 기본값이 아닙니다. 작업 가치가 프리미엄 요금을 정당화하는 시나리오에서 사용해야 합니다.

적합한 경우

  • 오답 비용이 큰 복잡한 추론 작업
  • 전체 코드베이스 분석, 아키텍처 리뷰, 멀티 파일 디버깅
  • 다수 문서를 아우르는 리서치 종합
  • 계획 품질이 재시도를 줄이는 에이전트 워크플로
  • 수작업 수정을 최소화해야 하는 고가치 출력

적합하지 않은 경우

  • 단순 분류
  • 대량 요약
  • 경량 정보 추출
  • 마진이 낮은 콘텐츠 생성
  • 저렴한 모델이면 충분한 프로토타이핑

실용적인 원칙은 간단합니다. 더 나은 추론이 실패, 재시도, 사람의 검토를 줄일 수 있다면 GPT-5.5, 루틴 작업이라면 저렴한 GPT 라우트를 사용하세요.

GPT-5.5 API 비용을 줄이는 방법

1. 안정적인 프롬프트를 캐시하기

시스템 프롬프트, 정책, 도구 설명, 문서 블록을 요청 간에 고정하세요. 캐시 입력은 $0.40 / 100만 토큰, 표준 입력은 $4.00 / 100만 토큰입니다.

2. 단순 작업은 다른 모델로 라우팅

모든 요청을 GPT-5.5에 보낼 필요는 없습니다. 단순 작업에는 저비용 GPT 라우트를 사용하고, GPT-5.5는 에스컬레이션이나 고가치 추론에 한정하세요.

def select_model(task_complexity: str) -> str:
    if task_complexity == "simple":
        return "gpt-5.1"
    if task_complexity == "standard":
        return "gpt-5.2"
    if task_complexity == "long_context":
        return "gpt-5.4"
    return "gpt-5.5"

3. 불필요한 장문 컨텍스트 요청 피하기

프롬프트가 272K 토큰 근처라면, 검색, 요약, 청킹으로 응답 품질을 해치지 않으면서 요청 크기를 줄일 수 있는지 확인하세요.

4. 성공 작업당 비용 추적

토큰당 비용은 하나의 지표일 뿐입니다. 재시도 횟수, 검증 실패율, 사람의 리뷰 시간, 레이턴시, 최종 성공률을 추적하세요. 더 비싼 모델이라도 반복 실패를 방지하면 총비용이 낮아질 수 있습니다. 단, 본인의 워크플로에서 실측해야 합니다.

5. GPT-5.5를 에스컬레이션 라우트로 사용

흔한 패턴은 GPT-5.2 또는 GPT-5.4로 먼저 처리한 후, 검증 실패, 신뢰도 저하, 사용자의 심층 분석 요청 시에만 GPT-5.5로 에스컬레이션하는 것입니다.

자주 묻는 질문

GPT-5.5 API 요금은 얼마인가요?

EvoLink에서 GPT-5.5는 입력 $4.00 / 100만 토큰, 출력 $24.00 / 100만 토큰, 캐시 입력 $0.40 / 100만 토큰입니다. 272K 토큰 초과 시 장문 컨텍스트 요금은 입력 $8.00, 출력 $36.00 / 100만 토큰입니다.

GPT-5.5 캐시 입력 요금은 얼마인가요?

EvoLink에서 GPT-5.5 캐시 입력 요금은 $0.40 / 100만 토큰입니다. 안정적인 지시, 문서, 도구 정의, 대화 템플릿을 반복 전송할 때 유용합니다.

입력이 272K 토큰을 초과하면 어떻게 되나요?

입력이 272K 토큰을 초과하면 EvoLink에서 GPT-5.5 장문 컨텍스트 요금이 적용됩니다. 입력 $8.00 / 100만 토큰, 출력 $36.00 / 100만 토큰으로, 세션 전체에 적용됩니다.

GPT-5.5가 GPT-5.4보다 비싼가요?

네. EvoLink에서 GPT-5.5는 $4.00 / $24.00 (100만 입력/출력 토큰), GPT-5.4는 $2.00 / $12.00입니다.

코딩에 GPT-5.5를 쓸 가치가 있나요?

멀티 파일 디버깅, 리포지토리 분석, 아키텍처 리뷰, 에이전틱 코딩 워크플로 등 복잡한 코딩 작업에는 GPT-5.5를 테스트할 가치가 있습니다. 단순 코드 완성이나 소규모 편집에는 저비용 GPT 라우트가 더 효율적입니다.

OpenAI 호환 API로 GPT-5.5를 사용할 수 있나요?

네. EvoLink은 OpenAI 호환 통합 경로를 제공하므로, 대부분의 팀은 base URL, API 키, 모델 값만 변경하면 마이그레이션할 수 있습니다.

from openai import OpenAI

client = OpenAI(
    api_key="your-evolink-api-key",
    base_url="https://api.evolink.ai/v1"
)

response = client.chat.completions.create(
    model="gpt-5.5",
    messages=[
        {"role": "user", "content": "이 코드베이스의 주요 위험 요소를 요약해 주세요."}
    ]
)

GPT-5.5와 다른 GPT 모델을 어디서 비교할 수 있나요?

GPT 모델 패밀리 페이지에서 전체 라인업을 확인하거나, GPT-5 API 요금 비교에서 GPT-5.5, GPT-5.4, GPT-5.2, GPT-5.1 요금을 한눈에 볼 수 있습니다.

먼저 요금을 파악하고, 본인의 작업에서 테스트하세요

GPT-5.5는 프리미엄 라우트이므로, 올바른 질문은 "토큰당 얼마인가"가 아니라 "성공 작업당 얼마인가"입니다.

소규모 테스트 세트로 시작하여 재시도 횟수와 리뷰 시간을 측정하고, GPT-5.5를 GPT-5.4 또는 GPT-5.2와 비교한 후, 결과에 실질적 차이를 만드는 워크플로에 GPT-5.5를 투입하세요.

AI 비용을 89% 절감할 준비가 되셨나요?

오늘 EvoLink를 시작하고 지능형 API 라우팅의 힘을 경험해보세요.