MiniMax-M3 API

Nutzen Sie MiniMax-M3 über EvoLink mit einem API-Schlüssel auf sowohl OpenAI-kompatiblen (/v1/chat/completions) als auch Anthropic-Messages-Endpunkten (/v1/messages). Mit ~1M Kontext, Deep Thinking, multimodaler Eingabe und Prompt-Caching eignet es sich für Coding Agents, Repo-Q&A, Dokumentenanalyse und Claude-Code-artige Workflows ab $0.49/1M Input-Tokens.

Modelltyp:

Preis:

$0.494 - 0.988(~ 33.6 - 67.2 credits) pro 1 Mio. Input-Tokens; $1.976 - 3.953(~ 134.4 - 268.8 credits) pro 1 Mio. Output-Tokens

$0.618 - 1.235(~ 42 - 84 credits) pro 1 Mio. Cache-Write-Tokens; $0.099 - 0.197(~ 6.7 - 13.4 credits) pro 1 Mio. Cache-Read-Tokens

Kontext über 512K Tokens wird mit dem 2-fachen offiziellen Tarif berechnet (Long-Context-Stufe, kein Rabatt). Unterstützt Thinking, multimodale Eingabe (Bild/Video/PDF) und Prompt-Caching.

Stabiler verwalteter Zugriff für Produktions-Workloads. Empfohlen, wenn Sie Dashboard-Abrechnung, API-Key-Kontrolle und planbares Integrationsverhalten benötigen.

Für alle Versionen wird derselbe API-Endpunkt verwendet. Nur der model-Parameter unterscheidet sich.

PRICING

PLAN	CONTEXT WINDOW	MAX OUTPUT	INPUT	OUTPUT	CACHE WRITE	CACHE READ
MiniMax-M3	1,000,000	131,072	≤524.3K$0.495-20% (33.6 Credits) >524.3K$1.236 (84 Credits)	≤524.3K$1.977-20% (134.4 Credits) >524.3K$4.942 (336 Credits)	≤524.3K$0.618-20% (42 Credits) >524.3K$1.545 (105 Credits)	≤524.3K$0.099-20% (6.7 Credits) >524.3K$0.248 (16.8 Credits)

Pricing Note: Prices show both USD and Credits. Units default to / 1M tokens unless noted separately.

Cache Hit: Price applies to cached prompt tokens.

MiniMax-M3 API

Routen Sie MiniMax-M3 über EvoLink für Coding Agents, Repo-Q&A, Research und multimodale Dokumentenanalyse mit einem ~1M-Kontextfenster, Deep Thinking und Prompt-Caching. Verbinden Sie sich über OpenAI-kompatible oder Anthropic-Messages-Endpunkte, mit Preisen ab $0.49/1M Input-Tokens.

Zugang und Workflow-Fit

Best fit

Coding Agents

Model ID

MiniMax-M3

Zugang

OpenAI + Anthropic

Kontext

1M Fenster

Input

$0.49/1M

Integriert

Thinking + multimodal + Caching

Preise ansehen Gateway-Setup für Coding-CLIs MiniMax-M3 Launch-Details

Was können Sie mit der MiniMax-M3 API entwickeln?

Coding Agents & Claude-Code-Workflows

Entwickeln Sie Coding-Copilots und Agents, die Repo-Q&A, Code-Generierung und Review bewältigen. Da MiniMax-M3 einen nativen Anthropic-Messages-Endpunkt bereitstellt, lässt es sich direkt in Claude-Code-artige CLIs und Agent-Frameworks integrieren, während Deep Thinking mehrstufiges Reasoning in einer einzigen API übernimmt.

Jetzt entwickeln

Use-Case-Showcase der MiniMax-M3 API für Coding

Multimodales Verständnis

Übergeben Sie Bilder, Videos und PDF-Dokumente direkt zusammen mit Text an MiniMax-M3. Nutzen Sie es für visuelle Q&A, Screenshot-zu-Code, Diagramm- und Dokumentenverständnis sowie Video-Zusammenfassung, ohne ein separates Vision-Modell in Ihren Stack einzubinden.

Multimodal erkunden

Use-Case-Showcase der MiniMax-M3 API für Multimodal

Long-Context-Dokumentenverarbeitung

Verarbeiten Sie Verträge, Berichte, Codebasen und große Wissensbasen ohne aggressives Chunking. Das ~1M-Kontextfenster eignet sich für strukturierte Zusammenfassungen, Extraktions-Pipelines und Vergleichsaufgaben, während Prompt-Caching wiederholte lange Präfixe bezahlbar hält.

Dokumente verarbeiten

Use-Case-Showcase der MiniMax-M3 API für Dokumente

Warum Teams die MiniMax-M3 API wählen

Teams wählen MiniMax-M3 auf EvoLink, wenn sie multimodales Long-Context-Reasoning, Dual-Protokoll-Zugang und vorhersehbare Token-Preise benötigen, ohne eine anbieterspezifische Integration aufzubauen.

Dual-Endpunkt-Zugang

Rufen Sie MiniMax-M3 über den OpenAI-kompatiblen Endpunkt oder den nativen Anthropic-Messages-Endpunkt mit einem EvoLink-Schlüssel auf. Bestehender OpenAI-SDK-Code und Claude-Code-artige Clients funktionieren beide, ohne dass Sie Ihren Integrationspfad neu aufbauen müssen.

Vorhersehbare Produktionskosten

Transparente Token-Preise erleichtern die Budgetierung: Input ab $0.49/1M, Output ab $1.98/1M und Cache-Reads ab etwa $0.10/1M für wiederholte Prompts. Kontext über 512K wird in einer 2×-Long-Context-Stufe abgerechnet.

Thinking, Multimodal und Caching

Nutzen Sie ~1M Kontext für große Prompts, aktivieren Sie Deep Thinking für komplexes Reasoning, übergeben Sie Bild-/Video-/PDF-Eingaben direkt und verlassen Sie sich auf Prompt-Caching, um die Kosten für wiederholten Kontext zu senken.

MiniMax-M3 vs MiniMax-M2.5: welches Modell passt?

Dies ist eine Modellwahlhilfe, kein Benchmark-Vergleich. M2.5 bleibt ein günstigeres MiniMax-Fallback-Modell, während M3 die stärkere Wahl für anspruchsvollere agentische und multimodale Workloads ist.

Entscheidungspunkt	MiniMax-M2.5	MiniMax-M3
Modellrolle	Günstigeres MiniMax-Fallback-Modell für textlastige Workloads	Primäre MiniMax-Option für fortgeschrittene agentische Workloads
Best fit	Repo-Q&A, Dokumentanalyse, Research und kostenkritische Textaufgaben	Coding Agents, Claude-Code-ähnliche CLIs, multimodales Reasoning und Full-Repo-Analyse
Kontextfenster	204K Kontext	~1M Kontext mit 2x-Tier über 512K
Input-Abdeckung	Textfokussiertes Modell mit Websuche und Prompt Caching	Text plus Bild-, Video- und PDF-Input mit Thinking und Caching
Endpoint-Fit	OpenAI-kompatibler Zugang	OpenAI-kompatibel plus nativer Anthropic-Messages-Zugang
Kostenrolle	Wenn Stückkosten wichtiger sind als maximale Capability	Wenn stärkeres Reasoning, längerer Kontext oder multimodaler Input das Upgrade rechtfertigen

MiniMax-M2.5 ansehen Vollständigen Vergleich lesen Bei MiniMax-M3 bleiben

So integrieren Sie die MiniMax-M3 API

Behalten Sie Ihren bestehenden OpenAI- oder Anthropic-Client bei, richten Sie ihn auf EvoLink aus, setzen Sie das Modell auf MiniMax-M3 und nutzen Sie dieselbe Route für Coding-Agent-, Multimodal- und Long-Context-Workflows.

Schritt 1 — Authentifizierung

Erstellen Sie einen EvoLink-API-Schlüssel und setzen Sie die EvoLink-Base-URL. Verwenden Sie Bearer-Authentifizierung für den OpenAI-kompatiblen Endpunkt oder x-api-key für den Anthropic-Messages-Endpunkt.

Schritt 2 — Pflichtfelder setzen

Senden Sie `model: MiniMax-M3` mit Ihrem `messages`-Array. Verwenden Sie stabile System-Prompts und Präfixe wieder, um bei wiederholten Workloads vom Prompt-Caching zu profitieren.

Schritt 3 — Outputs optimieren

Passen Sie temperature, top_p, max_tokens und stream wie gewohnt an. Aktivieren Sie `thinking` für tiefes Reasoning und hängen Sie Bild-, Video- oder PDF-Content-Blöcke für multimodale Anfragen an.

MiniMax-M3 API Features für Produktionsteams

Konkrete Steuerungen und Deployment-Signale statt generischer Modellübersicht

Thinking

Deep-Thinking-Modus

Aktivieren Sie Thinking für Mathematik, Logik und komplexe mehrstufige Analyse. Das Reasoning wird als separates Feld oder Content-Block bereitgestellt, sodass Sie die Gedankenkette in Ihrem Produkt anzeigen oder ausblenden können.

Kontext

~1M Kontextfenster

Passen Sie ganze Codebasen, lange Dokumente und Multi-Turn-Kontext in eine Anfrage, bevor Sie zu aggressivem Chunking oder Multi-Pass-Orchestrierung greifen.

Multimodal

Multimodale Eingabe

Übergeben Sie Bild-, Video- und PDF-Eingaben zusammen mit Text für visuelle Q&A, Dokumentenverständnis und Video-Zusammenfassung in derselben Text-API.

Kompatibilität

OpenAI- + Anthropic-kompatibel

Verbinden Sie sich über das OpenAI SDK via /v1/chat/completions oder das Anthropic SDK via /v1/messages, indem Sie die Base-URL und den Modellnamen ändern — kein Integrations-Neuaufbau erforderlich.

Caching

Prompt-Caching

Wiederholte Präfixe und System-Prompts werden zu einem niedrigeren Cache-Read-Tarif abgerechnet, was wiederkehrenden Agent-Workflows und hochvolumigem Produktions-Traffic hilft.

Preise

Long-Context-Stufenpreise

Anfragen bis 512K Kontext nutzen den Basistarif; über 512K werden Tokens in einer 2×-Long-Context-Stufe abgerechnet, sodass die Kosten vorhersehbar mit der Prompt-Größe skalieren.

MiniMax-M3 API FAQs

Everything you need to know about the product and billing.

Die Preise für MiniMax-M3 auf EvoLink beginnen bei etwa $0.49 pro 1M Input-Tokens und $1.98 pro 1M Output-Tokens. Cache-Reads beginnen bei etwa $0.10 pro 1M Tokens, was hilft, wenn Sie lange System-Prompts oder stabile Präfixe wiederverwenden. Anfragen mit mehr als 512K Kontext werden in einer 2×-Long-Context-Stufe abgerechnet.

MiniMax-M3 eignet sich besonders für Coding Agents, Claude-Code-artige CLIs, Repo-Q&A, multimodales Verständnis (Bild, Video, PDF), Research-Workflows und Long-Document-Analyse, die von ~1M Kontext, Deep Thinking und Prompt-Caching profitieren.

MiniMax-M3 unterstützt ein Kontextfenster von etwa 1M Tokens. Anfragen bis 512K Kontext werden zum Basistarif abgerechnet, und Tokens jenseits dieser Schwelle werden in einer 2×-Long-Context-Stufe abgerechnet.

Ja. MiniMax-M3 akzeptiert Bild-, Video- und PDF-Eingaben zusammen mit Text, unterstützt einen Deep-Thinking-Modus für komplexes Reasoning und unterstützt Prompt-Caching, sodass wiederholte Präfixe zu einem niedrigeren Cache-Read-Tarif abgerechnet werden.

Ja. EvoLink stellt MiniMax-M3 sowohl auf einem OpenAI-kompatiblen Endpunkt (/v1/chat/completions) als auch auf einem Anthropic-Messages-Endpunkt (/v1/messages) bereit. Ändern Sie die Base-URL und setzen Sie das Modell auf MiniMax-M3, um entweder das OpenAI SDK oder das Anthropic SDK zu verwenden.

Normalerweise ja. Da MiniMax-M3 einen nativen Anthropic-Messages-Endpunkt bereitstellt, passt es direkt zu Claude-Code-artigen CLIs und Agent-Frameworks, und der OpenAI-kompatible Endpunkt deckt Editor-Tools und interne Agents ab. Für angrenzende Setup-Muster siehe One Gateway for 3 Coding CLIs und Gateway vs Direct APIs.

Verwenden Sie das Modell-Enum `MiniMax-M3` im Request-Body. EvoLink leitet die Anfrage über den optimalen Provider zum MiniMax-M3-Modell.