Claude 소네트 4.0 API
Claude Sonnet 4.0 API은 강력한 추론, 안전한 출력 및 예측 가능한 비용이 필요한 생산 팀을 위해 설계된 균형 잡힌 고성능 모델입니다. 품질과 예산이 모두 중요한 지원 에이전트, 문서 분석 및 개발자 워크플로에 Claude Sonnet 4.0 API을 사용하세요.
PRICING
| PLAN | CONTEXT WINDOW | MAX OUTPUT | INPUT | OUTPUT | CACHE WRITE | CACHE READ |
|---|---|---|---|---|---|---|
| Claude Sonnet 4.0 | 200.0K | 64.0K | ≤200.0K$2.55-15% $3.00Official Price >200.0K$5.10-15% $6.00Official Price | ≤200.0K$12.75-15% $15.00Official Price >200.0K$19.125-15% $22.50Official Price | ≤200.0K$3.188-15% $3.75Official Price >200.0K$6.375-15% $7.50Official Price | ≤200.0K$0.256-15% $0.300Official Price >200.0K$0.511-15% $0.600Official Price |
| Claude Sonnet 4.0 (Beta) | 200.0K | 64.0K | ≤200.0K$0.780-74% $3.00Official Price >200.0K$1.56-74% $6.00Official Price | ≤200.0K$3.90-74% $15.00Official Price >200.0K$5.85-74% $22.50Official Price | ≤200.0K$0.975-74% $3.75Official Price >200.0K$1.95-74% $7.50Official Price | ≤200.0K$0.078-74% $0.300Official Price >200.0K$0.156-74% $0.600Official Price |
Server-side web search capability
Pricing Note: Price unit: USD / 1M tokens
Cache Hit: Price applies to cached prompt tokens.
Two ways to run Claude Sonnet 4.0 — pick the tier that matches your workload.
- · Claude Sonnet 4.0: the default tier for production reliability and predictable availability.
- · Claude Sonnet 4.0 (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.
Claude Sonnet 4.0 API — 생산을 위한 균형 잡힌 지능
Claude Sonnet 4.0 API을 사용하여 실제 팀과 실제 워크로드에 대한 강력한 추론과 실제 대기 시간을 결합하여 안정적인 AI 경험을 제공하세요.

Claude Sonnet 4.0 API로 무엇을 만들 수 있나요?
고객 지원 담당자
Claude Sonnet 4.0 API을 사용하여 티켓을 처음부터 끝까지 해결하는 지원 도우미를 만드세요. 브랜드 톤을 유지하고 오랜 고객 이력을 이해하며 도구를 호출하여 주문을 가져오거나 CRM 기록을 업데이트할 수 있습니다. 팀에서는 Claude Sonnet 4.0 API을 사용하여 처리 시간을 줄이고 해결 품질을 높이며 언어와 채널 전반에 걸쳐 일관된 응답을 유지합니다.

문서 분석 및 추출
Claude Sonnet 4.0 API를 사용하여 계약서, 보고서 및 로그를 구조화된 요약으로 전환하세요. 긴 컨텍스트 옵션을 사용하면 Claude Sonnet 4.0 API는 대용량 문서를 읽고 정확한 질문에 답하며 스키마에 맞는 JSON을 출력할 수 있습니다. 이는 정확성과 추적 가능한 요약이 필요한 규정 준수 검토, 지식 기반 및 분석 파이프라인에 이상적입니다.

개발자 부조종사 및 코드 검토
차이점을 검토하고, 수정 사항을 제안하고, 설계 선택을 설명하는 코딩 부조종사를 배송하세요. Claude Sonnet 4.0 API은 PR 요약, 리팩터링 및 아키텍처 지침을 확장하는 팀에 적합한 가격 책정 계층을 통해 일상적인 엔지니어링 작업에 Claude 4 추론을 제공합니다. Claude Sonnet 4.0 API을 사용하면 대규모 코드베이스 전반에 걸쳐 리뷰를 빠르고 유용하며 일관되게 유지할 수 있습니다.

팀이 Claude Sonnet 4.0 API을 선택하는 이유
Claude Sonnet 4.0 API은 프로덕션 AI의 기능, 비용 및 안정성의 균형을 유지합니다.
균형 잡힌 성능
일일 워크플로에 대한 실질적인 대기 시간을 갖춘 강력한 추론입니다.
명확한 비용 계획
캐싱 및 배치 옵션을 갖춘 투명한 기본 가격입니다.
생산 준비
도구 사용, 구조화된 출력 및 긴 컨텍스트 옵션.
Claude Sonnet 4.0 API 통합 방법
Claude Sonnet 4.0 API을 사용하면 API 키부터 생산 워크플로까지 몇 분 만에 완료됩니다.
1단계 - 인증
API 키를 생성하고, Sonnet 4 모델 별칭을 설정하고, 앱이나 백엔드에서 첫 번째 프롬프트를 보냅니다.
2단계 - 도구 추가
모델이 워크플로에 대해 구조화되고 실행 가능한 결과를 반환하도록 도구 및 JSON 스키마 입력을 정의합니다.
3단계 - 최적화
캐싱 또는 일괄 처리를 사용한 다음 Claude Sonnet 4.0 API을 확장하면서 사용량, 대기 시간 및 품질을 모니터링하세요.
Claude Sonnet 4.0 API 기능
실제 제품 요구 사항에 맞는 실용적인 기능
투명한 기본 가격
Claude Sonnet 4의 가격은 입력 토큰 백만 개당 3달러, 출력 토큰 백만 개당 15달러입니다. 이 명확한 기준은 팀이 비용을 예측하고 프로덕션 워크로드에 적합한 모델을 선택하는 데 도움이 됩니다.
신속한 캐싱 속도
프롬프트 캐싱은 별도의 속도를 사용합니다. 5분 캐시 쓰기는 기본 입력의 1.25배, 1시간 캐시 쓰기는 2배, 캐시 읽기는 0.1배입니다. 이는 시간이 지남에 따라 반복되는 컨텍스트를 훨씬 더 저렴하게 만듭니다.
100만 컨텍스트 베타 가격 책정
1M 컨텍스트 창은 사용 계층 4 또는 사용자 지정 비율 제한에 대한 베타 버전이며 Claude Sonnet 4 및 4.5에서만 사용할 수 있습니다. 200,000개가 넘는 입력 토큰을 요청하는 경우 프리미엄 요율(MTok당 입력 $6, 출력 $22.50)을 사용합니다.
일괄 처리 비용 절감
일괄 처리는 비동기 작업에 대한 입력 및 출력 토큰 모두에 대해 50% 할인을 제공하므로 대규모 수집 및 야간 자동화 비용을 낮출 수 있습니다.
JSON 스키마와 함께 도구 사용
도구 정의에는 JSON 스키마를 사용하여 매개변수를 정의하는 input_schema가 포함됩니다. 이를 통해 도구 호출을 예측 가능하게 유지하고 작업을 실행하거나 구조화된 데이터를 반환해야 하는 에이전트의 안정성을 향상시킵니다.
다중 모드 및 다국어
현재의 모든 Claude 모델은 텍스트 및 이미지 입력, 텍스트 출력, 다국어 기능 및 비전을 지원합니다. Claude 모델은 Anthropic API 및 AWS Bedrock, Google Vertex AI 및 Microsoft Foundry를 통해 사용할 수 있습니다.
자주 묻는 질문
Everything you need to know about the product and billing.