GPT-5.1 시리즈(API)
EvoLink의 통합 API 게이트웨이를 통해 GPT-5.1 모델 제품군에 액세스하세요. GPT-5.1은 400k 컨텍스트, 128k 최대 출력 토큰 및 2024년 9월 30일 지식 컷오프를 지원합니다. 계정과 엔드포인트에서 지원하는 경우 스트리밍, 함수 호출, 구조화된 출력 및 프롬프트 캐싱을 활성화합니다.
PRICING
| PLAN | CONTEXT WINDOW | MAX OUTPUT | INPUT | OUTPUT | CACHE READ |
|---|---|---|---|---|---|
| GPT-5.1 | 400.0K | 128.0K | $1.00-20% $1.25Official Price | $8.00-20% $10.00Official Price | $0.104-17% $0.125Official Price |
| GPT-5.1 (Beta) | 400.0K | 128.0K | $0.325-74% $1.25Official Price | $2.60-74% $10.00Official Price | $0.033-74% $0.125Official Price |
Pricing Note: Price unit: USD / 1M tokens
Cache Hit: Price applies to cached prompt tokens.
Two ways to run GPT-5.1 — pick the tier that matches your workload.
- · GPT-5.1: the default tier for production reliability and predictable availability.
- · GPT-5.1 (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.
GPT-5.1 API로 구축 — 생산 준비 인텔리전스
신뢰할 수 있는 채팅 성능, 도구 사용 워크플로, 확장 가능한 긴 컨텍스트 처리를 위해 GPT-5.1 API을 사용하세요. 응답 또는 채팅 완료를 통해 통합하고, 스트리밍 및 구조화된 출력을 활성화하고, 릴리스 안정성을 위해 스냅샷을 고정합니다.

GPT-5.1 API은 무엇을 달성할 수 있나요?
대규모 상황 분석
GPT-5.1의 400k 컨텍스트 창과 최대 128k 출력 토큰을 사용하여 더 큰 입력과 더 긴 대화 기록을 처리합니다. 이는 과도한 수동 청크 없이 리포지토리 검토, 긴 문서 분석 또는 다단계 연구 실행에 유용합니다.

고급 추론
계획, 코딩 지원, 의사 결정 지원 등 다단계 사고가 필요한 문제의 경우 구성 가능한 추론 노력을 사용하세요. GPT-5.1은 없음, 낮음, 중간 및 높은 노력을 지원하므로 속도, 비용 및 깊이의 균형을 맞출 수 있습니다.

프롬프트 캐싱
프롬프트 캐싱은 1,024개 이상의 토큰에 대해 자동으로 활성화됩니다. 안정적인 접두사(시스템 프롬프트, 정책, 소수 예시)를 재사용하고 인메모리 또는 24시간 보존을 선택하여 반복 처리를 줄이고 처리량을 향상시킵니다.

개발자가 GPT-5.1을 선택하는 이유 API
GPT-5.1은 스냅샷과 별칭이 포함된 모델 제품군으로 안정적인 생산 동작과 명확한 업그레이드 경로를 제공합니다.
모델 패밀리 디자인
일관된 API 표면을 유지하면서 가능한 경우 gpt-5.1-chat-latest 또는 gpt-5.1-codex와 같은 채팅 지향 또는 코딩 지향 별칭을 사용하십시오.
실용적인 장기 컨텍스트 워크플로우
최대 128,000개의 출력 토큰을 포함하는 400,000개의 컨텍스트 창은 작업의 일관성을 유지하고 복잡한 청킹 파이프라인의 필요성을 줄여줍니다.
API 생산 통합 기능
스트리밍, 함수 호출, 구조화된 출력 및 프롬프트 캐싱은 GPT-5.1에서 지원되므로 모델이 실제 프로덕션 시스템에 적합합니다.
GPT-5.1 API 통합 방법
세 단계를 거쳐 EvoLink의 통합 게이트웨이를 통해 GPT-5.1 사용을 시작하세요.
1단계 - API 키 받기
계정을 만들고, API 키를 생성하고, 환경 변수를 구성하세요. 특정 GPT-5.1 변형에 대한 액세스는 사용 계층 및 조직 확인에 따라 달라질 수 있습니다.
2단계 - 클라이언트 구성
선호하는 SDK 또는 직접 HTTP 통화를 사용하세요. 기본 URL을 게이트웨이 엔드포인트로 설정하고 응답 또는 채팅 완료를 선택합니다. 대상으로 삼으려는 모델 별칭을 전달합니다(예: gpt-5.1 또는 gpt-5.1-chat-latest).
3단계 - 구축 시작
먼저 작은 테스트 요청을 보낸 다음 스트리밍, 함수 호출, 구조화된 출력 또는 캐싱을 추가하세요. Prompt_tokens_details.cached_tokens와 같은 응답 사용 필드를 모니터링하여 동작을 검증하세요.
핵심 API 기능
GPT-5.1 API의 기술 사양
긴 컨텍스트(사용 가능한 경우)
GPT-5.1에는 2024년 9월 30일 지식 마감과 함께 400,000개의 컨텍스트 창과 최대 128,000개의 출력 토큰이 나열되어 있습니다.
프롬프트 캐싱(지원되는 경우)
정확한 접두사가 일치하는 프롬프트 >= 1,024개 토큰에 대한 자동 캐싱. 프롬프트_cache_retention in_memory 또는 24시간을 사용하세요.
추론 지향 변형
구성 가능한 추론 노력(없음, 낮음, 중간, 높음)을 통해 요청당 속도, 비용 및 깊이를 절충할 수 있습니다.
기능/도구 호출
JSON 스키마 도구를 정의하고 구조화된 호출을 응답 및 채팅 완료와 같은 엔드포인트 전반에 걸쳐 시스템에 라우팅합니다.
구조화된 출력(사용 가능한 경우)
스키마 준수 JSON 응답은 GPT-5.1에서 지원됩니다. 구조화된 출력 형식에 대한 엔드포인트 지원을 확인합니다.
스트리밍
응답 또는 실시간과 같은 지원되는 엔드포인트를 통해 반응형 UI에 대한 부분 토큰을 스트리밍합니다.
GPT-5.1 API - FAQ
Everything you need to know about the product and billing.