Seedance 2.0 API — Coming SoonGet early access

GPT-5.1 시리즈(API)

EvoLink의 통합 API 게이트웨이를 통해 GPT-5.1 모델 제품군에 액세스하세요. GPT-5.1은 400k 컨텍스트, 128k 최대 출력 토큰 및 2024년 9월 30일 지식 컷오프를 지원합니다. 계정과 엔드포인트에서 지원하는 경우 스트리밍, 함수 호출, 구조화된 출력 및 프롬프트 캐싱을 활성화합니다.

Run With API
Using coding CLIs? Run GPT-5.1 via EvoCode — One API for Code Agents & CLIs. (View Docs)
$

PRICING

PLANCONTEXT WINDOWMAX OUTPUTINPUTOUTPUTCACHE READ
GPT-5.1400.0K128.0K
$1.00-20%
$1.25Official Price
$8.00-20%
$10.00Official Price
$0.104-17%
$0.125Official Price
GPT-5.1 (Beta)400.0K128.0K
$0.325-74%
$1.25Official Price
$2.60-74%
$10.00Official Price
$0.033-74%
$0.125Official Price

Pricing Note: Price unit: USD / 1M tokens

Cache Hit: Price applies to cached prompt tokens.

Two ways to run GPT-5.1 — pick the tier that matches your workload.

  • · GPT-5.1: the default tier for production reliability and predictable availability.
  • · GPT-5.1 (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.

GPT-5.1 API로 구축 — 생산 준비 인텔리전스

신뢰할 수 있는 채팅 성능, 도구 사용 워크플로, 확장 가능한 긴 컨텍스트 처리를 위해 GPT-5.1 API을 사용하세요. 응답 또는 채팅 완료를 통해 통합하고, 스트리밍 및 구조화된 출력을 활성화하고, 릴리스 안정성을 위해 스냅샷을 고정합니다.

GPT-5.1 API 시각화

GPT-5.1 API은 무엇을 달성할 수 있나요?

대규모 상황 분석

GPT-5.1의 400k 컨텍스트 창과 최대 128k 출력 토큰을 사용하여 더 큰 입력과 더 긴 대화 기록을 처리합니다. 이는 과도한 수동 청크 없이 리포지토리 검토, 긴 문서 분석 또는 다단계 연구 실행에 유용합니다.

대규모 컨텍스트 처리

고급 추론

계획, 코딩 지원, 의사 결정 지원 등 다단계 사고가 필요한 문제의 경우 구성 가능한 추론 노력을 사용하세요. GPT-5.1은 없음, 낮음, 중간 및 높은 노력을 지원하므로 속도, 비용 및 깊이의 균형을 맞출 수 있습니다.

고급 추론

프롬프트 캐싱

프롬프트 캐싱은 1,024개 이상의 토큰에 대해 자동으로 활성화됩니다. 안정적인 접두사(시스템 프롬프트, 정책, 소수 예시)를 재사용하고 인메모리 또는 24시간 보존을 선택하여 반복 처리를 줄이고 처리량을 향상시킵니다.

비용 최적화

개발자가 GPT-5.1을 선택하는 이유 API

GPT-5.1은 스냅샷과 별칭이 포함된 모델 제품군으로 안정적인 생산 동작과 명확한 업그레이드 경로를 제공합니다.

모델 패밀리 디자인

일관된 API 표면을 유지하면서 가능한 경우 gpt-5.1-chat-latest 또는 gpt-5.1-codex와 같은 채팅 지향 또는 코딩 지향 별칭을 사용하십시오.

실용적인 장기 컨텍스트 워크플로우

최대 128,000개의 출력 토큰을 포함하는 400,000개의 컨텍스트 창은 작업의 일관성을 유지하고 복잡한 청킹 파이프라인의 필요성을 줄여줍니다.

API 생산 통합 기능

스트리밍, 함수 호출, 구조화된 출력 및 프롬프트 캐싱은 GPT-5.1에서 지원되므로 모델이 실제 프로덕션 시스템에 적합합니다.

GPT-5.1 API 통합 방법

세 단계를 거쳐 EvoLink의 통합 게이트웨이를 통해 GPT-5.1 사용을 시작하세요.

1

1단계 - API 키 받기

계정을 만들고, API 키를 생성하고, 환경 변수를 구성하세요. 특정 GPT-5.1 변형에 대한 액세스는 사용 계층 및 조직 확인에 따라 달라질 수 있습니다.

2

2단계 - 클라이언트 구성

선호하는 SDK 또는 직접 HTTP 통화를 사용하세요. 기본 URL을 게이트웨이 엔드포인트로 설정하고 응답 또는 채팅 완료를 선택합니다. 대상으로 삼으려는 모델 별칭을 전달합니다(예: gpt-5.1 또는 gpt-5.1-chat-latest).

3

3단계 - 구축 시작

먼저 작은 테스트 요청을 보낸 다음 스트리밍, 함수 호출, 구조화된 출력 또는 캐싱을 추가하세요. Prompt_tokens_details.cached_tokens와 같은 응답 사용 필드를 모니터링하여 동작을 검증하세요.

핵심 API 기능

GPT-5.1 API의 기술 사양

용량

긴 컨텍스트(사용 가능한 경우)

GPT-5.1에는 2024년 9월 30일 지식 마감과 함께 400,000개의 컨텍스트 창과 최대 128,000개의 출력 토큰이 나열되어 있습니다.

능률

프롬프트 캐싱(지원되는 경우)

정확한 접두사가 일치하는 프롬프트 >= 1,024개 토큰에 대한 자동 캐싱. 프롬프트_cache_retention in_memory 또는 24시간을 사용하세요.

지능

추론 지향 변형

구성 가능한 추론 노력(없음, 낮음, 중간, 높음)을 통해 요청당 속도, 비용 및 깊이를 절충할 수 있습니다.

완성

기능/도구 호출

JSON 스키마 도구를 정의하고 구조화된 호출을 응답 및 채팅 완료와 같은 엔드포인트 전반에 걸쳐 시스템에 라우팅합니다.

신뢰할 수 있음

구조화된 출력(사용 가능한 경우)

스키마 준수 JSON 응답은 GPT-5.1에서 지원됩니다. 구조화된 출력 형식에 대한 엔드포인트 지원을 확인합니다.

성능

스트리밍

응답 또는 실시간과 같은 지원되는 엔드포인트를 통해 반응형 UI에 대한 부분 토큰을 스트리밍합니다.

GPT-5.1 API - FAQ

Everything you need to know about the product and billing.

OpenAI의 모델 문서에는 2024년 9월 30일 지식 마감과 함께 GPT-5.1에 대한 400,000개의 토큰 컨텍스트 창과 최대 128,000개의 최대 출력 토큰이 나열되어 있습니다. 대시보드와 모델 문서를 계정의 정보 소스로 사용하세요.
프롬프트 캐싱은 1,024개 이상의 토큰에 대해 자동으로 수행되며 정확한 접두사가 일치하는 경우에만 작동합니다. 프롬프트_cache_retention을 in_memory 또는 24h로 설정합니다. 캐시된 토큰은 Usage.prompt_tokens_details.cached_tokens에 표시되며 캐시 범위는 조직으로 지정됩니다.
GPT-5.1은 Reasoning.effort 값 없음(기본값), 낮음, 중간, 높음을 지원합니다. 지연 시간에 민감한 작업에는 더 적은 노력을 기울이고 더 심층적인 다단계 추론에는 더 많은 노력을 기울이십시오.
예. GPT-5.1은 스트리밍, 함수 호출 및 구조화된 출력을 지원합니다. 계정 및 엔드포인트 가용성에 따라 응답, 채팅 완료, 실시간, 도우미 및 배치와 같은 엔드포인트에서 사용할 수 있습니다.
캐시 적중에는 정확한 접두사 일치가 필요합니다. 시작 부분에 정적 지침과 예제를 배치하고 동적 사용자 데이터를 끝 부분으로 이동하며 도구 정의를 동일하게 유지합니다. 또한 Prompt_cache_key를 사용하여 라우팅에 영향을 주고 공유 접두사의 캐시 적중률을 향상시킬 수도 있습니다.
구조화된 출력은 JSON 스키마 준수를 시행하고 GPT-5.1은 구조화된 출력을 지원되는 것으로 나열합니다. 가용성은 여전히 ​​엔드포인트에 따라 달라질 수 있으므로 계정의 모델 문서에서 지원을 확인하세요.
스냅샷 모델 ID를 사용하여 특정 버전을 고정하고 엄격한 일관성이 필요한 경우 최신 별칭에 의존하지 마세요. GPT-5.1 모델 페이지에는 gpt-5.1-2025-11-13과 같은 스냅샷 ID가 나열되어 있습니다.
OpenAI에는 입력, 캐시된 입력 및 출력에 대한 1M 토큰당 GPT-5.1 가격이 나와 있습니다(예: $1.25 / $0.125 / $10.00). EvoLink을 통한 실제 가격은 경로, 요금제, 할인에 따라 달라질 수 있으므로 항상 가격표와 대시보드 사용량/청구 데이터를 정보 소스로 사용하세요.