Claude Sonnet 4.0 API
Die Claude Sonnet 4.0 API ist ein ausgewogenes, leistungsstarkes Modell für Produktionsteams, die starkes Reasoning, sichere Outputs und planbare Kosten benötigen. Nutzen Sie die Claude Sonnet 4.0 API für Support-Agents, Dokumentanalyse und Entwickler-Workflows, bei denen Qualität und Budget gleichermaßen zählen.
PRICING
| PLAN | CONTEXT WINDOW | MAX OUTPUT | INPUT | OUTPUT | CACHE WRITE | CACHE READ |
|---|---|---|---|---|---|---|
| Claude Sonnet 4.0 | 200.0K | 64.0K | ≤200.0K$2.55-15% $3.00Official Price >200.0K$5.10-15% $6.00Official Price | ≤200.0K$12.75-15% $15.00Official Price >200.0K$19.125-15% $22.50Official Price | ≤200.0K$3.188-15% $3.75Official Price >200.0K$6.375-15% $7.50Official Price | ≤200.0K$0.256-15% $0.300Official Price >200.0K$0.511-15% $0.600Official Price |
| Claude Sonnet 4.0 (Beta) | 200.0K | 64.0K | ≤200.0K$0.780-74% $3.00Official Price >200.0K$1.56-74% $6.00Official Price | ≤200.0K$3.90-74% $15.00Official Price >200.0K$5.85-74% $22.50Official Price | ≤200.0K$0.975-74% $3.75Official Price >200.0K$1.95-74% $7.50Official Price | ≤200.0K$0.078-74% $0.300Official Price >200.0K$0.156-74% $0.600Official Price |
Server-side web search capability
Pricing Note: Price unit: USD / 1M tokens
Cache Hit: Price applies to cached prompt tokens.
Two ways to run Claude Sonnet 4.0 — pick the tier that matches your workload.
- · Claude Sonnet 4.0: the default tier for production reliability and predictable availability.
- · Claude Sonnet 4.0 (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.
Claude Sonnet 4.0 API — Ausgewogene Intelligenz für die Produktion
Liefern Sie zuverlässige KI-Erlebnisse mit der Claude Sonnet 4.0 API, die praktische Latenz mit starkem Reasoning für reale Teams und Workloads kombiniert.

Was können Sie mit der Claude Sonnet 4.0 API bauen?
Customer-Support-Agents
Erstellen Sie Support-Assistenten, die Tickets end-to-end mit der Claude Sonnet 4.0 API lösen. Sie hält den Brand-Ton, versteht lange Kundenhistorien und kann Tools aufrufen, um Bestellungen abzurufen oder CRM-Einträge zu aktualisieren. Teams nutzen die Claude Sonnet 4.0 API, um Bearbeitungszeit zu senken, die Lösungsqualität zu erhöhen und Antworten über Sprachen und Kanäle hinweg konsistent zu halten.

Dokumentanalyse und Extraktion
Verwandeln Sie Verträge, Reports und Logs mit der Claude Sonnet 4.0 API in strukturierte Summaries. Mit Long-Context-Optionen kann die Claude Sonnet 4.0 API große Dokumente lesen, präzise Fragen beantworten und JSON ausgeben, das zu Ihrem Schema passt. Ideal für Compliance-Reviews, Knowledge Bases und Analytics-Pipelines, die Genauigkeit und nachvollziehbare Summaries benötigen.

Developer Copilots und Code Review
Liefern Sie Coding-Copilots, die Diffs reviewen, Fixes vorschlagen und Designentscheidungen erklären. Die Claude Sonnet 4.0 API bringt Claude-4-Reasoning in den Alltag von Engineering-Teams – mit einer Preisstufe, die das Skalieren von PR-Summaries, Refactors und Architekturberatung ermöglicht. Nutzen Sie die Claude Sonnet 4.0 API, um Reviews schnell, hilfreich und konsistent über große Codebasen hinweg zu halten.

Warum Teams die Claude Sonnet 4.0 API wählen
Die Claude Sonnet 4.0 API balanciert Fähigkeit, Kosten und Zuverlässigkeit für Production AI.
Ausgewogene Performance
Starkes Reasoning bei praktischer Latenz für tägliche Workflows.
Klare Kostenplanung
Transparente Basispreise mit Caching- und Batch-Optionen.
Produktionsreife
Tool Use, strukturierte Outputs und Long-Context-Optionen.
So integrieren Sie die Claude Sonnet 4.0 API
Vom API-Key zu produktiven Workflows in Minuten mit der Claude Sonnet 4.0 API.
Schritt 1 — Authentifizieren
Erstellen Sie einen API-Key, setzen Sie das Sonnet-4-Model-Alias und senden Sie den ersten Prompt aus Ihrer App oder Ihrem Backend.
Schritt 2 — Tools hinzufügen
Definieren Sie Tools und JSON-Schema-Inputs, damit das Modell strukturierte, umsetzbare Ergebnisse für Ihren Workflow liefert.
Schritt 3 — Optimieren
Nutzen Sie Caching oder Batch-Processing und überwachen Sie Usage, Latenz und Qualität, während Sie die Claude Sonnet 4.0 API skalieren.
Claude Sonnet 4.0 API Features
Praktische Features, die zu realen Produktanforderungen passen
Transparente Basispreise
Claude Sonnet 4 kostet 3 USD pro 1 Mio. Input-Tokens und 15 USD pro 1 Mio. Output-Tokens. Diese klare Basis hilft Teams, Kosten zu planen und das richtige Modell für Produktions-Workloads zu wählen.
Prompt-Caching-Raten
Prompt Caching nutzt separate Raten: 5-Minuten-Cache-Writes sind 1,25x des Basis-Inputs, 1-Stunden-Cache-Writes sind 2x, und Cache-Reads sind 0,1x. Das macht wiederholten Kontext über Zeit deutlich günstiger.
1M-Context-Beta-Preise
Das 1M-Kontextfenster ist in Beta für Usage Tier 4 oder Custom Rate Limits und nur für Claude Sonnet 4 und 4.5 verfügbar. Requests über 200K Input-Token nutzen Premium-Raten: 6 USD Input und 22,50 USD Output pro MTok.
Batch-Processing-Savings
Batch Processing bietet 50 % Rabatt auf Input- und Output-Tokens für asynchrone Jobs, was die Kosten für große Ingestion und nächtliche Automation senken kann.
Tool Use mit JSON Schema
Tool-Definitionen enthalten ein input_schema, das JSON Schema verwendet, um Parameter zu definieren. Das hält Tool Calls vorhersehbar und verbessert die Zuverlässigkeit für Agents, die Aktionen ausführen oder strukturierte Daten liefern müssen.
Multimodal und multilingual
Alle aktuellen Claude-Modelle unterstützen Text- und Bildinput, Text-Output, multilingualen Fähigkeiten und Vision. Claude-Modelle sind über die Anthropic API sowie auf AWS Bedrock, Google Vertex AI und Microsoft Foundry verfügbar.
Häufige Fragen
Everything you need to know about the product and billing.