Seedance 2.0 API — Coming SoonGet early access

Claude Sonnet 4.0 API

L'API Claude Sonnet 4.0 est un modèle équilibré et performant, conçu pour les équipes production qui ont besoin d'un raisonnement solide, de sorties sûres et de coûts prévisibles. Utilisez l'API Claude Sonnet 4.0 pour des agents support, l'analyse de documents et les workflows dev où qualité et budget comptent.

Run With API
Using coding CLIs? Run Claude 4.0 Sonnet via EvoCode — One API for Code Agents & CLIs. (View Docs)
$

PRICING

PLANCONTEXT WINDOWMAX OUTPUTINPUTOUTPUTCACHE WRITECACHE READ
Claude Sonnet 4.0200.0K64.0K
200.0K$2.55-15%
$3.00Official Price
>200.0K$5.10-15%
$6.00Official Price
200.0K$12.75-15%
$15.00Official Price
>200.0K$19.125-15%
$22.50Official Price
200.0K$3.188-15%
$3.75Official Price
>200.0K$6.375-15%
$7.50Official Price
200.0K$0.256-15%
$0.300Official Price
>200.0K$0.511-15%
$0.600Official Price
Claude Sonnet 4.0 (Beta)200.0K64.0K
200.0K$0.780-74%
$3.00Official Price
>200.0K$1.56-74%
$6.00Official Price
200.0K$3.90-74%
$15.00Official Price
>200.0K$5.85-74%
$22.50Official Price
200.0K$0.975-74%
$3.75Official Price
>200.0K$1.95-74%
$7.50Official Price
200.0K$0.078-74%
$0.300Official Price
>200.0K$0.156-74%
$0.600Official Price
Web Search Tool

Server-side web search capability

$0.011/search

Pricing Note: Price unit: USD / 1M tokens

Cache Hit: Price applies to cached prompt tokens.

Two ways to run Claude Sonnet 4.0 — pick the tier that matches your workload.

  • · Claude Sonnet 4.0: the default tier for production reliability and predictable availability.
  • · Claude Sonnet 4.0 (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.

Claude Sonnet 4.0 API — Intelligence équilibrée pour la production

Livrez des expériences IA fiables avec l'API Claude Sonnet 4.0, qui combine une latence pratique et un raisonnement solide pour des équipes et workloads réels.

Hero showcase d'une fonctionnalité de modèle IA 1

Que pouvez-vous construire avec l'API Claude Sonnet 4.0 ?

Agents de support client

Créez des assistants support qui résolvent les tickets de bout en bout avec l'API Claude Sonnet 4.0. Elle maintient le ton de marque, comprend les historiques clients longs et peut appeler des outils pour récupérer des commandes ou mettre à jour le CRM. Les équipes utilisent l'API Claude Sonnet 4.0 pour réduire le temps de traitement, augmenter la qualité de résolution et garder des réponses cohérentes sur les langues et canaux.

Support showcase d'une fonctionnalité de modèle IA 2

Analyse et extraction de documents

Transformez contrats, rapports et logs en résumés structurés avec l'API Claude Sonnet 4.0. Avec les options de long contexte, l'API Claude Sonnet 4.0 peut lire de grands documents, répondre à des questions précises et sortir du JSON aligné sur votre schéma. Idéal pour les revues de conformité, bases de connaissances et pipelines d'analytics qui exigent précision et résumés traçables.

Documents showcase d'une fonctionnalité de modèle IA 3

Copilotes développeurs et revue de code

Livrez des copilotes de code qui reviewent les diffs, proposent des corrections et expliquent les choix de design. L'API Claude Sonnet 4.0 apporte le raisonnement Claude 4 aux tâches d'ingénierie quotidiennes, avec un pricing adapté aux équipes qui scalent les résumés de PR, refactors et conseils d'architecture. Utilisez l'API Claude Sonnet 4.0 pour garder des reviews rapides, utiles et cohérentes sur de grandes bases de code.

Coding showcase d'une fonctionnalité de modèle IA 4

Pourquoi les équipes choisissent l'API Claude Sonnet 4.0

L'API Claude Sonnet 4.0 équilibre capacité, coût et fiabilité pour l'IA en production.

Performance équilibrée

Raisonnement solide avec une latence pratique pour les workflows du quotidien.

Planification claire des coûts

Prix de base transparents avec options de caching et batch.

Prêt pour la production

Tool use, sorties structurées et options de long contexte.

Comment intégrer l'API Claude Sonnet 4.0

De la clé API aux workflows production en quelques minutes avec l'API Claude Sonnet 4.0.

1

Étape 1 — Authentifier

Créez une clé API, définissez l'alias du modèle Sonnet 4, et envoyez un premier prompt depuis votre app ou backend.

2

Étape 2 — Ajouter des tools

Définissez des tools et des entrées JSON Schema pour que le modèle renvoie des résultats structurés et actionnables pour votre workflow.

3

Étape 3 — Optimiser

Utilisez le caching ou le batch processing, puis surveillez l'usage, la latence et la qualité à mesure que vous scalez l'API Claude Sonnet 4.0.

Fonctionnalités de l'API Claude Sonnet 4.0

Des features pratiques qui correspondent aux besoins produit réels

Cost

Prix de base transparents

Claude Sonnet 4 est facturé 3 $ par million de tokens d'entrée et 15 $ par million de tokens de sortie. Cette base claire aide les équipes à prévoir les coûts et à choisir le bon modèle pour les workloads production.

Caching

Tarifs de prompt caching

Le prompt caching utilise des tarifs séparés : les écritures de cache 5 minutes sont à 1,25x l'entrée de base, les écritures 1 heure à 2x, et les lectures de cache à 0,1x. Cela rend le contexte répété bien moins cher dans le temps.

Context

Tarifs bêta contexte 1M

La fenêtre de contexte 1M est en bêta pour le tier d'usage 4 ou des rate limits personnalisés et n'est disponible que pour Claude Sonnet 4 et 4.5. Les requêtes au-delà de 200K tokens d'entrée utilisent des tarifs premium : 6 $ input et 22,50 $ output par MTok.

Efficiency

Économies via batch processing

Le batch processing offre une remise de 50 % sur les tokens d'entrée et de sortie pour les jobs asynchrones, ce qui peut réduire les coûts d'ingestion à grande échelle et d'automatisation nocturne.

Tools

Tool use avec JSON Schema

Les définitions d'outils incluent un input_schema qui utilise JSON Schema pour définir les paramètres. Cela rend les appels d'outils prévisibles et améliore la fiabilité des agents qui doivent exécuter des actions ou renvoyer des données structurées.

Platforms

Multimodal et multilingue

Tous les modèles Claude actuels supportent l'entrée texte et image, la sortie texte, les capacités multilingues et la vision. Les modèles Claude sont disponibles via l'API Anthropic et sur AWS Bedrock, Google Vertex AI et Microsoft Foundry.

Questions fréquentes

Everything you need to know about the product and billing.

L'API Claude Sonnet 4.0 est positionnée comme un modèle équilibré et performant pour les équipes production qui ont besoin d'un raisonnement solide sans coût premium. C'est un défaut pratique pour les agents de support client, l'analyse de documents et les copilotes dev qui doivent rester précis et fiables à l'échelle. L'API Claude Sonnet 4.0 convient aussi aux équipes qui prévoient d'ajouter progressivement le tool use, des sorties structurées et des workflows long contexte, tout en gardant une latence et des coûts prévisibles au quotidien.
Claude Sonnet 4 est facturé 3 $ par million de tokens d'entrée et 15 $ par million de tokens de sortie. Le prompt caching utilise des tarifs séparés pour les écritures et lectures de cache, et le batch processing applique une remise de 50 % sur l'entrée et la sortie pour les jobs asynchrones. Si vous activez la bêta contexte 1M et que votre requête dépasse 200K tokens d'entrée, des tarifs premium long contexte s'appliquent. Confirmez toujours les tarifs actuels sur la page officielle avant tout budget final.
Claude Sonnet 4 supporte une fenêtre de contexte de 1M tokens en bêta pour les organisations en tier d'usage 4 ou avec des rate limits personnalisés, et cette option 1M n'est disponible que pour Claude Sonnet 4 et 4.5. Les requêtes au-dessus de 200K tokens d'entrée sont facturées à des tarifs premium long contexte, tandis que les prompts plus petits utilisent les prix standards. Cela rend l'API Claude Sonnet 4.0 adaptée aux grands documents, longues conversations et reviews multi-fichiers qui exigeraient sinon du chunking.
Oui. L'API Claude Sonnet 4.0 supporte le tool use, et chaque définition d'outil inclut un input_schema qui suit JSON Schema pour définir les paramètres. Cela rend les appels d'outils prévisibles, plus simples à valider et plus sûrs à automatiser. Les définitions d'outils et les appels d'outils comptent dans l'usage de tokens ; incluez-les dans vos estimations de coût. Pour des agents qui doivent récupérer des données ou déclencher des actions, des entrées d'outils basées sur des schémas réduisent les erreurs de parsing et améliorent la fiabilité.
Le prompt caching réduit le coût du contexte répété en séparant les tarifs de write et read. D'après la page pricing, les écritures de cache 5 minutes sont à 1,25x, les écritures 1 heure à 2x et les lectures à 0,1x. C'est utile lorsque vous réutilisez de longs prompts système, des politiques ou des documents statiques sur de nombreuses requêtes. Pour les workflows à haut volume, le caching peut réduire la dépense totale tout en conservant une qualité de sortie cohérente.
Oui. Anthropic indique que tous les modèles Claude actuels supportent l'entrée texte et image, la sortie texte, les capacités multilingues et la vision. Cela signifie que l'API Claude Sonnet 4.0 peut interpréter des captures d'écran, graphiques ou documents scannés et répondre dans plusieurs langues. Si votre workflow inclut des données visuelles, cela maintient l'analyse et le reporting dans un seul modèle plutôt que de changer de fournisseur, ce qui est utile pour les équipes globales de support et d'analytics.
Les modèles Claude sont disponibles via l'API Anthropic et sur des plateformes tierces comme AWS Bedrock, Google Vertex AI et Microsoft Foundry. Cela donne aux équipes des options pour l'approvisionnement, la résidence des données et l'alignement infrastructure. Si vous déployez sur plusieurs plateformes, standardisez les prompts et les checks d'évaluation pour que l'API Claude Sonnet 4.0 se comporte de manière cohérente entre régions et environnements.