Claude Sonnet 4.0 API
$2.550 - 5.100(~ 183.6 - 367.2 credits) per 1M input tokens; $12.750 - 19.125(~ 918 - 1377 credits) per 1M output tokens
$3.188 - 6.375(~ 229.5 - 459 credits) per 1M cache write tokens; $0.256 - 0.511(~ 18.4 - 36.8 credits) per 1M cache read tokens
Web search tool charged separately per request.
Stabilité maximale avec une disponibilité garantie de 99,9 %. Recommandé pour la production.
Le même endpoint API est utilisé pour toutes les versions. Seul le paramètre model change.
Claude Sonnet 4.0 API — Intelligence équilibrée pour la production
Livrez des expériences IA fiables avec l'API Claude Sonnet 4.0, qui combine une latence pratique et un raisonnement solide pour des équipes et workloads réels.

Que pouvez-vous construire avec l'API Claude Sonnet 4.0 ?
Agents de support client
Créez des assistants support qui résolvent les tickets de bout en bout avec l'API Claude Sonnet 4.0. Elle maintient le ton de marque, comprend les historiques clients longs et peut appeler des outils pour récupérer des commandes ou mettre à jour le CRM. Les équipes utilisent l'API Claude Sonnet 4.0 pour réduire le temps de traitement, augmenter la qualité de résolution et garder des réponses cohérentes sur les langues et canaux.

Analyse et extraction de documents
Transformez contrats, rapports et logs en résumés structurés avec l'API Claude Sonnet 4.0. Avec les options de long contexte, l'API Claude Sonnet 4.0 peut lire de grands documents, répondre à des questions précises et sortir du JSON aligné sur votre schéma. Idéal pour les revues de conformité, bases de connaissances et pipelines d'analytics qui exigent précision et résumés traçables.

Copilotes développeurs et revue de code
Livrez des copilotes de code qui reviewent les diffs, proposent des corrections et expliquent les choix de design. L'API Claude Sonnet 4.0 apporte le raisonnement Claude 4 aux tâches d'ingénierie quotidiennes, avec un pricing adapté aux équipes qui scalent les résumés de PR, refactors et conseils d'architecture. Utilisez l'API Claude Sonnet 4.0 pour garder des reviews rapides, utiles et cohérentes sur de grandes bases de code.

Pourquoi les équipes choisissent l'API Claude Sonnet 4.0
L'API Claude Sonnet 4.0 équilibre capacité, coût et fiabilité pour l'IA en production.
Performance équilibrée
Raisonnement solide avec une latence pratique pour les workflows du quotidien.
Planification claire des coûts
Prix de base transparents avec options de caching et batch.
Prêt pour la production
Tool use, sorties structurées et options de long contexte.
Comment intégrer l'API Claude Sonnet 4.0
De la clé API aux workflows production en quelques minutes avec l'API Claude Sonnet 4.0.
Étape 1 — Authentifier
Créez une clé API, définissez l'alias du modèle Sonnet 4, et envoyez un premier prompt depuis votre app ou backend.
Étape 2 — Ajouter des tools
Définissez des tools et des entrées JSON Schema pour que le modèle renvoie des résultats structurés et actionnables pour votre workflow.
Étape 3 — Optimiser
Utilisez le caching ou le batch processing, puis surveillez l'usage, la latence et la qualité à mesure que vous scalez l'API Claude Sonnet 4.0.
Fonctionnalités de l'API Claude Sonnet 4.0
Des features pratiques qui correspondent aux besoins produit réels
Prix de base transparents
Claude Sonnet 4 est facturé 3 $ par million de tokens d'entrée et 15 $ par million de tokens de sortie. Cette base claire aide les équipes à prévoir les coûts et à choisir le bon modèle pour les workloads production.
Tarifs de prompt caching
Le prompt caching utilise des tarifs séparés : les écritures de cache 5 minutes sont à 1,25x l'entrée de base, les écritures 1 heure à 2x, et les lectures de cache à 0,1x. Cela rend le contexte répété bien moins cher dans le temps.
Tarifs bêta contexte 1M
La fenêtre de contexte 1M est en bêta pour le tier d'usage 4 ou des rate limits personnalisés et n'est disponible que pour Claude Sonnet 4 et 4.5. Les requêtes au-delà de 200K tokens d'entrée utilisent des tarifs premium : 6 $ input et 22,50 $ output par MTok.
Économies via batch processing
Le batch processing offre une remise de 50 % sur les tokens d'entrée et de sortie pour les jobs asynchrones, ce qui peut réduire les coûts d'ingestion à grande échelle et d'automatisation nocturne.
Tool use avec JSON Schema
Les définitions d'outils incluent un input_schema qui utilise JSON Schema pour définir les paramètres. Cela rend les appels d'outils prévisibles et améliore la fiabilité des agents qui doivent exécuter des actions ou renvoyer des données structurées.
Multimodal et multilingue
Tous les modèles Claude actuels supportent l'entrée texte et image, la sortie texte, les capacités multilingues et la vision. Les modèles Claude sont disponibles via l'API Anthropic et sur AWS Bedrock, Google Vertex AI et Microsoft Foundry.
Tous les modèles Claude API
EvoLink fournit un accès API unifié à toute la famille de modèles Claude — Opus pour l’intelligence de pointe, Sonnet pour l’équilibre quotidien, Haiku pour la vitesse et l’échelle. Tous les modèles partagent le même endpoint API EvoLink. Changez de modèle avec un seul paramètre.
Questions fréquentes
Everything you need to know about the product and billing.