Seedance 2.0 API — Coming SoonGet early access

Claude Sonnet 4.0 API

Die Claude Sonnet 4.0 API ist ein ausgewogenes, leistungsstarkes Modell für Produktionsteams, die starkes Reasoning, sichere Outputs und planbare Kosten benötigen. Nutzen Sie die Claude Sonnet 4.0 API für Support-Agents, Dokumentanalyse und Entwickler-Workflows, bei denen Qualität und Budget gleichermaßen zählen.

Run With API
Using coding CLIs? Run Claude 4.0 Sonnet via EvoCode — One API for Code Agents & CLIs. (View Docs)
$

PRICING

PLANCONTEXT WINDOWMAX OUTPUTINPUTOUTPUTCACHE WRITECACHE READ
Claude Sonnet 4.0200.0K64.0K
200.0K$2.55-15%
$3.00Official Price
>200.0K$5.10-15%
$6.00Official Price
200.0K$12.75-15%
$15.00Official Price
>200.0K$19.125-15%
$22.50Official Price
200.0K$3.188-15%
$3.75Official Price
>200.0K$6.375-15%
$7.50Official Price
200.0K$0.256-15%
$0.300Official Price
>200.0K$0.511-15%
$0.600Official Price
Claude Sonnet 4.0 (Beta)200.0K64.0K
200.0K$0.780-74%
$3.00Official Price
>200.0K$1.56-74%
$6.00Official Price
200.0K$3.90-74%
$15.00Official Price
>200.0K$5.85-74%
$22.50Official Price
200.0K$0.975-74%
$3.75Official Price
>200.0K$1.95-74%
$7.50Official Price
200.0K$0.078-74%
$0.300Official Price
>200.0K$0.156-74%
$0.600Official Price
Web Search Tool

Server-side web search capability

$0.011/search

Pricing Note: Price unit: USD / 1M tokens

Cache Hit: Price applies to cached prompt tokens.

Two ways to run Claude Sonnet 4.0 — pick the tier that matches your workload.

  • · Claude Sonnet 4.0: the default tier for production reliability and predictable availability.
  • · Claude Sonnet 4.0 (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.

Claude Sonnet 4.0 API — Ausgewogene Intelligenz für die Produktion

Liefern Sie zuverlässige KI-Erlebnisse mit der Claude Sonnet 4.0 API, die praktische Latenz mit starkem Reasoning für reale Teams und Workloads kombiniert.

Hero-Showcase eines KI-Modell-Features 1

Was können Sie mit der Claude Sonnet 4.0 API bauen?

Customer-Support-Agents

Erstellen Sie Support-Assistenten, die Tickets end-to-end mit der Claude Sonnet 4.0 API lösen. Sie hält den Brand-Ton, versteht lange Kundenhistorien und kann Tools aufrufen, um Bestellungen abzurufen oder CRM-Einträge zu aktualisieren. Teams nutzen die Claude Sonnet 4.0 API, um Bearbeitungszeit zu senken, die Lösungsqualität zu erhöhen und Antworten über Sprachen und Kanäle hinweg konsistent zu halten.

Support-Showcase eines KI-Modell-Features 2

Dokumentanalyse und Extraktion

Verwandeln Sie Verträge, Reports und Logs mit der Claude Sonnet 4.0 API in strukturierte Summaries. Mit Long-Context-Optionen kann die Claude Sonnet 4.0 API große Dokumente lesen, präzise Fragen beantworten und JSON ausgeben, das zu Ihrem Schema passt. Ideal für Compliance-Reviews, Knowledge Bases und Analytics-Pipelines, die Genauigkeit und nachvollziehbare Summaries benötigen.

Dokumente-Showcase eines KI-Modell-Features 3

Developer Copilots und Code Review

Liefern Sie Coding-Copilots, die Diffs reviewen, Fixes vorschlagen und Designentscheidungen erklären. Die Claude Sonnet 4.0 API bringt Claude-4-Reasoning in den Alltag von Engineering-Teams – mit einer Preisstufe, die das Skalieren von PR-Summaries, Refactors und Architekturberatung ermöglicht. Nutzen Sie die Claude Sonnet 4.0 API, um Reviews schnell, hilfreich und konsistent über große Codebasen hinweg zu halten.

Coding-Showcase eines KI-Modell-Features 4

Warum Teams die Claude Sonnet 4.0 API wählen

Die Claude Sonnet 4.0 API balanciert Fähigkeit, Kosten und Zuverlässigkeit für Production AI.

Ausgewogene Performance

Starkes Reasoning bei praktischer Latenz für tägliche Workflows.

Klare Kostenplanung

Transparente Basispreise mit Caching- und Batch-Optionen.

Produktionsreife

Tool Use, strukturierte Outputs und Long-Context-Optionen.

So integrieren Sie die Claude Sonnet 4.0 API

Vom API-Key zu produktiven Workflows in Minuten mit der Claude Sonnet 4.0 API.

1

Schritt 1 — Authentifizieren

Erstellen Sie einen API-Key, setzen Sie das Sonnet-4-Model-Alias und senden Sie den ersten Prompt aus Ihrer App oder Ihrem Backend.

2

Schritt 2 — Tools hinzufügen

Definieren Sie Tools und JSON-Schema-Inputs, damit das Modell strukturierte, umsetzbare Ergebnisse für Ihren Workflow liefert.

3

Schritt 3 — Optimieren

Nutzen Sie Caching oder Batch-Processing und überwachen Sie Usage, Latenz und Qualität, während Sie die Claude Sonnet 4.0 API skalieren.

Claude Sonnet 4.0 API Features

Praktische Features, die zu realen Produktanforderungen passen

Cost

Transparente Basispreise

Claude Sonnet 4 kostet 3 USD pro 1 Mio. Input-Tokens und 15 USD pro 1 Mio. Output-Tokens. Diese klare Basis hilft Teams, Kosten zu planen und das richtige Modell für Produktions-Workloads zu wählen.

Caching

Prompt-Caching-Raten

Prompt Caching nutzt separate Raten: 5-Minuten-Cache-Writes sind 1,25x des Basis-Inputs, 1-Stunden-Cache-Writes sind 2x, und Cache-Reads sind 0,1x. Das macht wiederholten Kontext über Zeit deutlich günstiger.

Context

1M-Context-Beta-Preise

Das 1M-Kontextfenster ist in Beta für Usage Tier 4 oder Custom Rate Limits und nur für Claude Sonnet 4 und 4.5 verfügbar. Requests über 200K Input-Token nutzen Premium-Raten: 6 USD Input und 22,50 USD Output pro MTok.

Efficiency

Batch-Processing-Savings

Batch Processing bietet 50 % Rabatt auf Input- und Output-Tokens für asynchrone Jobs, was die Kosten für große Ingestion und nächtliche Automation senken kann.

Tools

Tool Use mit JSON Schema

Tool-Definitionen enthalten ein input_schema, das JSON Schema verwendet, um Parameter zu definieren. Das hält Tool Calls vorhersehbar und verbessert die Zuverlässigkeit für Agents, die Aktionen ausführen oder strukturierte Daten liefern müssen.

Platforms

Multimodal und multilingual

Alle aktuellen Claude-Modelle unterstützen Text- und Bildinput, Text-Output, multilingualen Fähigkeiten und Vision. Claude-Modelle sind über die Anthropic API sowie auf AWS Bedrock, Google Vertex AI und Microsoft Foundry verfügbar.

Häufige Fragen

Everything you need to know about the product and billing.

Die Claude Sonnet 4.0 API ist als ausgewogenes High-Performance-Modell für Produktionsteams positioniert, die starkes Reasoning ohne Premiumkosten benötigen. Sie ist ein praktischer Default für Customer-Support-Agents, Dokumentanalyse und Developer-Copilots, die skalierbar genau und zuverlässig bleiben müssen. Die Claude Sonnet 4.0 API passt außerdem zu Teams, die über Zeit Tool Use, strukturierte Outputs und Long-Context-Workflows hinzufügen wollen, während Latenz und Spend für den Alltag planbar bleiben.
Claude Sonnet 4 kostet 3 USD pro 1 Mio. Input-Tokens und 15 USD pro 1 Mio. Output-Tokens. Prompt Caching nutzt separate Raten für Cache-Writes und Cache-Reads, und Batch Processing gewährt 50 % Rabatt auf Input und Output bei asynchronen Jobs. Wenn Sie die 1M-Context-Beta aktivieren und Ihre Anfrage 200K Input-Tokens überschreitet, gelten Premium-Long-Context-Raten. Bestätigen Sie die aktuellen Preise vor finaler Budgetierung stets auf der offiziellen Pricing-Seite.
Claude Sonnet 4 unterstützt ein 1M-Token-Kontextfenster in Beta für Organisationen in Usage Tier 4 oder mit Custom Rate Limits, und diese 1M-Option ist nur für Claude Sonnet 4 und 4.5 verfügbar. Requests über 200K Input-Token werden mit Premium-Long-Context-Raten abgerechnet, kleinere Prompts mit Standardpreisen. Das macht die Claude Sonnet 4.0 API passend für große Dokumente, lange Konversationen und Multi-File-Reviews, die sonst Chunking erfordern würden.
Ja. Die Claude Sonnet 4.0 API unterstützt Tool Use, und jede Tool-Definition enthält ein input_schema, das JSON Schema nutzt, um Parameter zu definieren. Das macht Tool Calls vorhersehbar, einfacher zu validieren und sicherer zu automatisieren. Tool-Definitionen und Tool Calls zählen zum Tokenverbrauch, also berücksichtigen Sie sie in Kostenschätzungen. Für Agents, die Daten abrufen oder Aktionen auslösen müssen, reduzieren schema-basierte Tool-Inputs Parsing-Fehler und erhöhen die Zuverlässigkeit.
Prompt Caching senkt die Kosten für wiederholten Kontext, indem Cache-Writes und Cache-Reads getrennt bepreist werden. Laut Pricing-Seite liegen 5-Minuten-Cache-Writes bei 1,25x, 1-Stunden-Cache-Writes bei 2x und Cache-Reads bei 0,1x. Das ist nützlich, wenn Sie lange System-Prompts, Policies oder statische Dokumente über viele Requests hinweg wiederverwenden. Bei High-Volume-Workflows kann Caching die Gesamtkosten senken, während die Output-Qualität konsistent bleibt.
Ja. Anthropic gibt an, dass alle aktuellen Claude-Modelle Text- und Bildinput, Text-Output, multilanguage Fähigkeiten und Vision unterstützen. Damit kann die Claude Sonnet 4.0 API Screenshots, Charts oder gescannte Dokumente interpretieren und in mehreren Sprachen antworten. Wenn Ihr Workflow visuelle Daten enthält, bleibt Analyse und Reporting in einem Modell statt Provider zu wechseln – hilfreich für globale Support- und Analytics-Teams.
Claude-Modelle sind über die Anthropic API sowie auf Drittplattformen wie AWS Bedrock, Google Vertex AI und Microsoft Foundry verfügbar. Das gibt Teams Optionen für Procurement, Data Residency und Infrastruktur-Alignment. Wenn Sie über mehrere Plattformen deployen, standardisieren Sie Prompts und Evaluationschecks, damit die Claude Sonnet 4.0 API über Regionen und Umgebungen hinweg konsistent funktioniert.