HappyHorse 1.0 kommt baldMehr erfahren
Claude API Preise 2026: Kosten für Opus, Sonnet und Haiku pro Million Tokens
guide

Claude API Preise 2026: Kosten für Opus, Sonnet und Haiku pro Million Tokens

EvoLink Team
EvoLink Team
Product Team
9. April 2026
9 Min. Lesezeit

Zuletzt aktualisiert: 9. April 2026 · Offizielle Anbieterpreise anhand der Anthropic-Preisdokumentation verifiziert. Die EvoLink-Routenpreise spiegeln die aktuellen, auf der Website unterstützten Kanalpreise wider und können von der direkten Anthropic-Abrechnung abweichen.

Zusammenfassung

Die Claude API-Preise hängen davon ab, welches Modell Sie wählen und welchen Preisbereich Sie meinen. Dieser Leitfaden unterscheidet:

  • Offizielle Anthropic API-Preise
  • Long-Context- / Caching- / Batch-Preisregeln
  • Aktuelle EvoLink-Routenpreise, sofern verfügbar

Hier sind die aktuellen offiziellen Grundpreise pro Million Tokens (MTok):

ModellEingabeAusgabeIdeal für
Claude Opus 4.6$5.00$25.00Flaggschiff-Reasoning, komplexes Coding, Agenten
Claude Opus 4.5$5.00$25.00Vorherige Flaggschiff-Generation, stabile versionierte ID
Claude Opus 4.1$15.00$75.00Agentisches Coding, Multi-Datei-Refactoring
Claude Sonnet 4.6$3.00$15.00Beste Balance aus Geschwindigkeit/Kosten/Intelligenz
Claude Sonnet 4.5$3.00$15.00Empfohlener Standard, starkes Coding
Claude Sonnet 4.0$3.00$15.00Produktions-Workloads, 1M-Kontext-Beta
Claude Haiku 4.5$1.00$5.00Schnellstes, günstigstes — Hochvolumen-Workloads

Wenn Sie direkte Anbieterpreise mit Gateway-Preisen vergleichen, sind die offiziellen Anthropic-Tarife die Grundlage. EvoLink kann niedrigere routenspezifische Preise für dieselbe Claude-Familie anbieten, aber das ist ein separater Preisbereich im Vergleich zur direkten Anthropic-Abrechnung.


Claude Opus 4.6 Preise

Claude Opus 4.6 ist Anthropics neuestes Flaggschiff — das intelligenteste Claude-Modell mit hybridem Reasoning, extended thinking und dem effort-Parameter zur Kosten-/Qualitätssteuerung.
KomponentePreis (pro MTok)
Eingabe-Tokens$5.00
Ausgabe-Tokens$25.00
Cache-Schreiben (5 Min.)$6.25
Cache-Schreiben (1 Stunde)$10.00
Cache-Lesen$0.50 (0,1x Eingabe)
Batch-Eingabe$2.50 (50% Rabatt)
Batch-Ausgabe$12.50 (50% Rabatt)
Kontextfenster: 1M Tokens zu Standard-Anthropic-Preisen Maximale Ausgabe: 64K Tokens Modell-ID: claude-opus-4-6

Wann sich das Opus 4.6-Premium lohnt

  • Komplexes mehrstufiges Coding (80,8% SWE-bench Verified)
  • Agenten-Orchestrierung mit Tool-Nutzung
  • Forschungssynthese mit extended thinking
  • Aufgaben, bei denen Qualität wichtiger ist als Geschwindigkeit

Claude Opus 4.5 Preise

Claude Opus 4.5 hat die gleichen Preise wie Opus 4.6 und ist eine stabile Option der vorherigen Generation mit einer fixierten versionierten ID.
KomponentePreis (pro MTok)
Eingabe-Tokens$5.00
Ausgabe-Tokens$25.00
Cache-Schreiben (5 Min.)$6.25
Cache-Lesen$0.50
Modell-ID: claude-opus-4-5-20250514

Claude Opus 4.1 Preise

Claude Opus 4.1 ist teurer als Opus 4.5/4.6, liefert aber 74,5% SWE-bench mit spezialisierter Stärke beim Multi-Datei-Refactoring.
KomponentePreis (pro MTok)
Eingabe-Tokens$15.00
Ausgabe-Tokens$75.00
Cache-Schreiben (5 Min.)$18.75
Cache-Lesen$1.50
Modell-ID: claude-opus-4-1-20250805

Lohnt sich Opus 4.1 noch?

Opus 4.1 kostet pro Token 3x mehr als Opus 4.6. Verwenden Sie es nur, wenn Ihr Workflow speziell von den älteren Routencharakteristiken profitiert oder Sie eine fixierte Version für die Kompatibilität benötigen. Für die meisten neuen Workloads ist Opus 4.6 mit $5/$25 die bessere Wahl.


Claude Sonnet 4.6 Preise

Claude Sonnet 4.6 bietet die beste Balance aus Geschwindigkeit, Intelligenz und Kosten — mit 128K maximaler Ausgabe (doppelt so viel wie Opus) und extended thinking-Unterstützung.
KomponentePreis (pro MTok)
Eingabe-Tokens$3.00
Ausgabe-Tokens$15.00
Cache-Schreiben (5 Min.)$3.75
Cache-Lesen$0.30
Batch-Eingabe$1.50 (50% Rabatt)
Batch-Ausgabe$7.50 (50% Rabatt)
Kontextfenster: 1M Tokens zu Standard-Anthropic-Preisen Maximale Ausgabe: 128K Tokens Modell-ID: claude-sonnet-4-6

Claude Sonnet 4.5 Preise

Claude Sonnet 4.5 ist Anthropics empfohlenes Standardmodell — bisher bestes Coding-Modell mit starken Agenten-Fähigkeiten.
KomponentePreis (pro MTok)
Eingabe-Tokens$3.00
Ausgabe-Tokens$15.00
Cache-Schreiben (5 Min.)$3.75
Cache-Lesen$0.30
Kontextfenster: 200K Tokens, wobei die 1M-Long-Context-Preise separat behandelt werden Modell-ID: claude-sonnet-4-5-20250929

Claude Sonnet 4.0 Preise

Claude Sonnet 4.0 teilt die Sonnet-Stufen-Preise und verwendet weiterhin separate Long-Context-Preise über 200K Tokens.
KomponentePreis (pro MTok)
Eingabe-Tokens$3.00
Ausgabe-Tokens$15.00
Eingabe (>200K, 1M-Beta)$6.00
Ausgabe (>200K, 1M-Beta)$22.50
Cache-Schreiben (5 Min.)$3.75
Cache-Lesen$0.30
Modell-ID: claude-sonnet-4-0-20250514

Claude Haiku 4.5 Preise

Claude Haiku 4.5 ist das schnellste und günstigste Claude 4-Modell — erreicht Sonnet 4-Niveau beim Coding zu einem Bruchteil der Kosten.
KomponentePreis (pro MTok)
Eingabe-Tokens$1.00
Ausgabe-Tokens$5.00
Cache-Schreiben (5 Min.)$1.25
Cache-Lesen$0.10
Batch-Eingabe$0.50 (50% Rabatt)
Batch-Ausgabe$2.50 (50% Rabatt)
Kontextfenster: 200K Tokens Modell-ID: claude-haiku-4-5-20251001

Wann Sie Haiku statt Sonnet wählen sollten

  • Free-Tier-Produkte, bei denen die Kosten pro Anfrage wichtig sind
  • Parallelisierte Sub-Agenten und Hochvolumen-Pipelines
  • Latenzempfindliche Chat- und Support-Agenten
  • Aufgaben, bei denen Sonnet 4-Qualität ausreicht (73,3% SWE-bench)

Kostenvergleich: Claude vs GPT vs Gemini

Wie schneiden die Claude-Preise im Vergleich zu anderen Frontier-Modellen ab? Hier ein direkter Vergleich:

ModellEingabe/MTokAusgabe/MTokKontextMax. Ausgabe
Claude Opus 4.6$5.00$25.001M64K
Claude Sonnet 4.6$3.00$15.001M128K
Claude Haiku 4.5$1.00$5.00200K
GPT-5.4$2.50$20.001M128K
GPT-5.2$1.75$14.00400K128K
Gemini 3.1 Pro$2.00$12.001M64K
Einen detaillierten Modell-für-Modell-Vergleich finden Sie unter GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 Pro.

So senken Sie Ihre Claude API-Kosten

1. Prompt-Caching nutzen

Wenn Sie System-Prompts oder langen Kontext über mehrere Anfragen hinweg wiederverwenden, kann Caching die Eingabekosten um bis zu 90% senken. Cache-Lesevorgänge werden mit 0,1x des Basis-Eingabepreises berechnet.

2. Batch-Verarbeitung nutzen

Batch API bietet 50% Rabatt auf sowohl Eingabe- als auch Ausgabe-Tokens für asynchrone Aufträge. Ideal für nächtliche Automatisierung, Datenverarbeitung und nicht-echtzeitkritische Workloads.

3. Die richtige Modellstufe wählen

Verwenden Sie nicht Opus für Aufgaben, die Sonnet bewältigen kann. Verwenden Sie nicht Sonnet für Aufgaben, die Haiku bewältigen kann. Passen Sie die Modellfähigkeit an die Aufgabenkomplexität an.

EvoLink listet derzeit Claude-Routenpreise unter den direkten Anthropic-Tarifen für einige Stufen. Das sind kanalspezifische Preise, kein Ersatz für Anthropics offizielle Preisseite:
  • Claude Opus 4.6: ab $4.50/MTok Eingabe (−10%)
  • Claude Sonnet 4.6: ab $2.70/MTok Eingabe (−10%)
  • Claude Haiku 4.5: ab $0.90/MTok Eingabe (−10%)

Verwenden Sie die direkten Anthropic-Preise bei der Budgetierung für herstellernative Nutzung. Verwenden Sie die EvoLink-Routenpreise, wenn Sie Claude speziell über EvoLinks OpenAI-kompatiblen Endpunkt kaufen möchten.

5. Überwachen und Budgets festlegen

Nutzen Sie Anthropics Nutzungs-Dashboard oder EvoLinks integrierte Überwachung, um Ausgaben nach Modell zu verfolgen, Benachrichtigungen einzurichten und unerwartete Rechnungen zu vermeiden.


FAQ

Wie viel kostet die Claude API?

Die Claude API-Preise variieren je nach Modell. Bei Anthropics offizieller API-Preisgestaltung beginnt Haiku 4.5 bei $1/$5 pro Million Tokens, Sonnet 4.6 liegt bei $3/$15 und Opus 4.6 bei $5/$25. Prompt-Caching und Batch-Verarbeitung können die effektiven Kosten weiter senken. Alle Angaben hier beziehen sich auf pro Million Tokens, Stand 9. April 2026.

Welches ist das günstigste Claude API-Modell?

Claude Haiku 4.5 mit $1 Eingabe / $5 Ausgabe pro Million Tokens. Es ist das kostengünstigste aktuelle Claude-Modell für Hochvolumen-Produktions-Workloads.

Ist die Claude API kostenlos?

Es gibt keine dauerhafte kostenlose Claude API-Stufe für den Produktionseinsatz. Anthropics API-Preisgestaltung ist nutzungsbasiert, und die Verfügbarkeit von Probe- oder Werbeguthaben sollte auf Anthropics aktuellen Abrechnungsseiten überprüft werden. EvoLink bewirbt außerdem kostenlose Testguthaben für neue Konten in der aktuellen Website-Kommunikation.

Wie schneiden die Claude-Preise im Vergleich zu GPT ab?

Claude Sonnet 4.6 ($3/$15) liegt bei den direkten Anbieterpreisen über GPT-5.2 ($1.75/$14) und Gemini 3.1 Pro ($2/$12), während Claude Opus 4.6 ($5/$25) die Premium-Claude-Stufe darstellt. Über EvoLink können Routenpreise diese Lücke verkleinern, aber diese Preise sollten separat von der offiziellen Anthropic-Abrechnung betrachtet werden.

Was ist Prompt-Caching und wie viel spart es?

Prompt-Caching ermöglicht es Ihnen, häufig gesendeten Kontext (System-Prompts, Dokumente) über mehrere Anfragen hinweg wiederzuverwenden. Cache-Schreibvorgänge kosten das 1,25-fache des Basis-Eingabepreises, aber Cache-Lesevorgänge kosten nur das 0,1-fache — das spart bis zu 90% bei wiederholten Eingabe-Tokens. Dies ist besonders wertvoll für Agenten und Chatbots mit langen System-Prompts.

Hat Claude Batch-Verarbeitungsrabatte?

Ja. Anthropics Batch API bietet 50% Rabatt auf sowohl Eingabe- als auch Ausgabe-Tokens. Aufträge werden innerhalb von 24 Stunden asynchron verarbeitet. Dies ist ideal für Datenpipelines, Inhaltsgenerierung und alle Workloads, die keine Echtzeit-Antworten benötigen.

Wo kann ich die Claude API zum besten Preis nutzen?

EvoLink bewirbt derzeit Claude-Routenpreise unter den offiziellen Anthropic-Tarifen über seinen OpenAI-kompatiblen Endpunkt. Wenn Sie Claude über EvoLink statt direkt bei Anthropic kaufen möchten, ist das die routenspezifische Preisseite zum Vergleichen.

Bereit, Claude in Ihr Produkt zu integrieren? EvoLink gibt Ihnen Zugang zu jedem Claude-Modell über einen einzigen OpenAI-kompatiblen Endpunkt — mit vergünstigten Routenpreisen, integriertem Rate-Limit-Handling und Nutzungsüberwachung.


Preise stammen von anthropic.com/pricing, Stand April 2026. Preise können sich ändern — überprüfen Sie immer die aktuellen Preise vor der endgültigen Budgetierung.

Bereit, Ihre KI-Kosten um 89 % zu senken?

Starten Sie noch heute mit EvoLink und erleben Sie die Vorteile intelligenter API-Routing.