Claude Sonnet 4.0 API
$2.550 - 5.100(~ 183.6 - 367.2 credits) per 1M input tokens; $12.750 - 19.125(~ 918 - 1377 credits) per 1M output tokens
$3.188 - 6.375(~ 229.5 - 459 credits) per 1M cache write tokens; $0.256 - 0.511(~ 18.4 - 36.8 credits) per 1M cache read tokens
Web search tool charged separately per request.
Höchste Stabilität mit garantierter 99,9% Verfügbarkeit. Empfohlen für Produktionsumgebungen.
Für alle Versionen wird derselbe API-Endpunkt verwendet. Nur der model-Parameter unterscheidet sich.
Claude Sonnet 4.0 API — Ausgewogene Intelligenz für die Produktion
Liefern Sie zuverlässige KI-Erlebnisse mit der Claude Sonnet 4.0 API, die praktische Latenz mit starkem Reasoning für reale Teams und Workloads kombiniert.

Was können Sie mit der Claude Sonnet 4.0 API bauen?
Customer-Support-Agents
Erstellen Sie Support-Assistenten, die Tickets end-to-end mit der Claude Sonnet 4.0 API lösen. Sie hält den Brand-Ton, versteht lange Kundenhistorien und kann Tools aufrufen, um Bestellungen abzurufen oder CRM-Einträge zu aktualisieren. Teams nutzen die Claude Sonnet 4.0 API, um Bearbeitungszeit zu senken, die Lösungsqualität zu erhöhen und Antworten über Sprachen und Kanäle hinweg konsistent zu halten.

Dokumentanalyse und Extraktion
Verwandeln Sie Verträge, Reports und Logs mit der Claude Sonnet 4.0 API in strukturierte Summaries. Mit Long-Context-Optionen kann die Claude Sonnet 4.0 API große Dokumente lesen, präzise Fragen beantworten und JSON ausgeben, das zu Ihrem Schema passt. Ideal für Compliance-Reviews, Knowledge Bases und Analytics-Pipelines, die Genauigkeit und nachvollziehbare Summaries benötigen.

Developer Copilots und Code Review
Liefern Sie Coding-Copilots, die Diffs reviewen, Fixes vorschlagen und Designentscheidungen erklären. Die Claude Sonnet 4.0 API bringt Claude-4-Reasoning in den Alltag von Engineering-Teams – mit einer Preisstufe, die das Skalieren von PR-Summaries, Refactors und Architekturberatung ermöglicht. Nutzen Sie die Claude Sonnet 4.0 API, um Reviews schnell, hilfreich und konsistent über große Codebasen hinweg zu halten.

Warum Teams die Claude Sonnet 4.0 API wählen
Die Claude Sonnet 4.0 API balanciert Fähigkeit, Kosten und Zuverlässigkeit für Production AI.
Ausgewogene Performance
Starkes Reasoning bei praktischer Latenz für tägliche Workflows.
Klare Kostenplanung
Transparente Basispreise mit Caching- und Batch-Optionen.
Produktionsreife
Tool Use, strukturierte Outputs und Long-Context-Optionen.
So integrieren Sie die Claude Sonnet 4.0 API
Vom API-Key zu produktiven Workflows in Minuten mit der Claude Sonnet 4.0 API.
Schritt 1 — Authentifizieren
Erstellen Sie einen API-Key, setzen Sie das Sonnet-4-Model-Alias und senden Sie den ersten Prompt aus Ihrer App oder Ihrem Backend.
Schritt 2 — Tools hinzufügen
Definieren Sie Tools und JSON-Schema-Inputs, damit das Modell strukturierte, umsetzbare Ergebnisse für Ihren Workflow liefert.
Schritt 3 — Optimieren
Nutzen Sie Caching oder Batch-Processing und überwachen Sie Usage, Latenz und Qualität, während Sie die Claude Sonnet 4.0 API skalieren.
Claude Sonnet 4.0 API Features
Praktische Features, die zu realen Produktanforderungen passen
Transparente Basispreise
Claude Sonnet 4 kostet 3 USD pro 1 Mio. Input-Tokens und 15 USD pro 1 Mio. Output-Tokens. Diese klare Basis hilft Teams, Kosten zu planen und das richtige Modell für Produktions-Workloads zu wählen.
Prompt-Caching-Raten
Prompt Caching nutzt separate Raten: 5-Minuten-Cache-Writes sind 1,25x des Basis-Inputs, 1-Stunden-Cache-Writes sind 2x, und Cache-Reads sind 0,1x. Das macht wiederholten Kontext über Zeit deutlich günstiger.
1M-Context-Beta-Preise
Das 1M-Kontextfenster ist in Beta für Usage Tier 4 oder Custom Rate Limits und nur für Claude Sonnet 4 und 4.5 verfügbar. Requests über 200K Input-Token nutzen Premium-Raten: 6 USD Input und 22,50 USD Output pro MTok.
Batch-Processing-Savings
Batch Processing bietet 50 % Rabatt auf Input- und Output-Tokens für asynchrone Jobs, was die Kosten für große Ingestion und nächtliche Automation senken kann.
Tool Use mit JSON Schema
Tool-Definitionen enthalten ein input_schema, das JSON Schema verwendet, um Parameter zu definieren. Das hält Tool Calls vorhersehbar und verbessert die Zuverlässigkeit für Agents, die Aktionen ausführen oder strukturierte Daten liefern müssen.
Multimodal und multilingual
Alle aktuellen Claude-Modelle unterstützen Text- und Bildinput, Text-Output, multilingualen Fähigkeiten und Vision. Claude-Modelle sind über die Anthropic API sowie auf AWS Bedrock, Google Vertex AI und Microsoft Foundry verfügbar.
Alle Claude API-Modelle
EvoLink bietet einheitlichen API-Zugang zur gesamten Claude-Modellfamilie — Opus für Flaggschiff-Intelligenz, Sonnet für die tägliche Balance, Haiku für Geschwindigkeit und Skalierung. Alle Modelle teilen denselben EvoLink API-Endpunkt. Wechseln Sie Modelle mit einem Parameter.
Häufige Fragen
Everything you need to know about the product and billing.