Claude Sonnet 4.0 API
L'API Claude Sonnet 4.0 est un modèle équilibré et performant, conçu pour les équipes production qui ont besoin d'un raisonnement solide, de sorties sûres et de coûts prévisibles. Utilisez l'API Claude Sonnet 4.0 pour des agents support, l'analyse de documents et les workflows dev où qualité et budget comptent.
PRICING
| PLAN | CONTEXT WINDOW | MAX OUTPUT | INPUT | OUTPUT | CACHE WRITE | CACHE READ |
|---|---|---|---|---|---|---|
| Claude Sonnet 4.0 | 200.0K | 64.0K | ≤200.0K$2.55-15% $3.00Official Price >200.0K$5.10-15% $6.00Official Price | ≤200.0K$12.75-15% $15.00Official Price >200.0K$19.125-15% $22.50Official Price | ≤200.0K$3.188-15% $3.75Official Price >200.0K$6.375-15% $7.50Official Price | ≤200.0K$0.256-15% $0.300Official Price >200.0K$0.511-15% $0.600Official Price |
| Claude Sonnet 4.0 (Beta) | 200.0K | 64.0K | ≤200.0K$0.780-74% $3.00Official Price >200.0K$1.56-74% $6.00Official Price | ≤200.0K$3.90-74% $15.00Official Price >200.0K$5.85-74% $22.50Official Price | ≤200.0K$0.975-74% $3.75Official Price >200.0K$1.95-74% $7.50Official Price | ≤200.0K$0.078-74% $0.300Official Price >200.0K$0.156-74% $0.600Official Price |
Server-side web search capability
Pricing Note: Price unit: USD / 1M tokens
Cache Hit: Price applies to cached prompt tokens.
Two ways to run Claude Sonnet 4.0 — pick the tier that matches your workload.
- · Claude Sonnet 4.0: the default tier for production reliability and predictable availability.
- · Claude Sonnet 4.0 (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.
Claude Sonnet 4.0 API — Intelligence équilibrée pour la production
Livrez des expériences IA fiables avec l'API Claude Sonnet 4.0, qui combine une latence pratique et un raisonnement solide pour des équipes et workloads réels.

Que pouvez-vous construire avec l'API Claude Sonnet 4.0 ?
Agents de support client
Créez des assistants support qui résolvent les tickets de bout en bout avec l'API Claude Sonnet 4.0. Elle maintient le ton de marque, comprend les historiques clients longs et peut appeler des outils pour récupérer des commandes ou mettre à jour le CRM. Les équipes utilisent l'API Claude Sonnet 4.0 pour réduire le temps de traitement, augmenter la qualité de résolution et garder des réponses cohérentes sur les langues et canaux.

Analyse et extraction de documents
Transformez contrats, rapports et logs en résumés structurés avec l'API Claude Sonnet 4.0. Avec les options de long contexte, l'API Claude Sonnet 4.0 peut lire de grands documents, répondre à des questions précises et sortir du JSON aligné sur votre schéma. Idéal pour les revues de conformité, bases de connaissances et pipelines d'analytics qui exigent précision et résumés traçables.

Copilotes développeurs et revue de code
Livrez des copilotes de code qui reviewent les diffs, proposent des corrections et expliquent les choix de design. L'API Claude Sonnet 4.0 apporte le raisonnement Claude 4 aux tâches d'ingénierie quotidiennes, avec un pricing adapté aux équipes qui scalent les résumés de PR, refactors et conseils d'architecture. Utilisez l'API Claude Sonnet 4.0 pour garder des reviews rapides, utiles et cohérentes sur de grandes bases de code.

Pourquoi les équipes choisissent l'API Claude Sonnet 4.0
L'API Claude Sonnet 4.0 équilibre capacité, coût et fiabilité pour l'IA en production.
Performance équilibrée
Raisonnement solide avec une latence pratique pour les workflows du quotidien.
Planification claire des coûts
Prix de base transparents avec options de caching et batch.
Prêt pour la production
Tool use, sorties structurées et options de long contexte.
Comment intégrer l'API Claude Sonnet 4.0
De la clé API aux workflows production en quelques minutes avec l'API Claude Sonnet 4.0.
Étape 1 — Authentifier
Créez une clé API, définissez l'alias du modèle Sonnet 4, et envoyez un premier prompt depuis votre app ou backend.
Étape 2 — Ajouter des tools
Définissez des tools et des entrées JSON Schema pour que le modèle renvoie des résultats structurés et actionnables pour votre workflow.
Étape 3 — Optimiser
Utilisez le caching ou le batch processing, puis surveillez l'usage, la latence et la qualité à mesure que vous scalez l'API Claude Sonnet 4.0.
Fonctionnalités de l'API Claude Sonnet 4.0
Des features pratiques qui correspondent aux besoins produit réels
Prix de base transparents
Claude Sonnet 4 est facturé 3 $ par million de tokens d'entrée et 15 $ par million de tokens de sortie. Cette base claire aide les équipes à prévoir les coûts et à choisir le bon modèle pour les workloads production.
Tarifs de prompt caching
Le prompt caching utilise des tarifs séparés : les écritures de cache 5 minutes sont à 1,25x l'entrée de base, les écritures 1 heure à 2x, et les lectures de cache à 0,1x. Cela rend le contexte répété bien moins cher dans le temps.
Tarifs bêta contexte 1M
La fenêtre de contexte 1M est en bêta pour le tier d'usage 4 ou des rate limits personnalisés et n'est disponible que pour Claude Sonnet 4 et 4.5. Les requêtes au-delà de 200K tokens d'entrée utilisent des tarifs premium : 6 $ input et 22,50 $ output par MTok.
Économies via batch processing
Le batch processing offre une remise de 50 % sur les tokens d'entrée et de sortie pour les jobs asynchrones, ce qui peut réduire les coûts d'ingestion à grande échelle et d'automatisation nocturne.
Tool use avec JSON Schema
Les définitions d'outils incluent un input_schema qui utilise JSON Schema pour définir les paramètres. Cela rend les appels d'outils prévisibles et améliore la fiabilité des agents qui doivent exécuter des actions ou renvoyer des données structurées.
Multimodal et multilingue
Tous les modèles Claude actuels supportent l'entrée texte et image, la sortie texte, les capacités multilingues et la vision. Les modèles Claude sont disponibles via l'API Anthropic et sur AWS Bedrock, Google Vertex AI et Microsoft Foundry.
Questions fréquentes
Everything you need to know about the product and billing.