Produktlaunch

MiniMax-M3 API auf EvoLink: Preise, ID & 1M Kontext

EvoLink Team

Product Team

1. Juni 2026

6 Min. Lesezeit

MiniMax M3 hat begonnen, die Aufmerksamkeit von Entwicklern auf sich zu ziehen, nachdem öffentliche Diskussionen es als LLM der nächsten Generation für Coding Agents, Long-Context-Workflows, multimodales Reasoning und kosteneffizienten Produktiveinsatz beschrieben haben.

Für Teams, die auf EvoLink aufbauen, lautet die entscheidende praktische Frage: Kann man MiniMax M3 heute über eine API aufrufen, und sollte man bereits Produktions-Workloads darauf planen?

Stand 1. Juni 2026 lautet die Antwort: ja. MiniMax M3 ist am 1. Juni 2026 auf EvoLink live gegangen. Entwickler können M3 jetzt über den OpenAI-kompatiblen Endpoint /v1/chat/completions sowie über den nativen Anthropic Messages /v1/messages-Endpoint nutzen, der für Claude-Code-ähnliche CLIs geeignet ist.

Jetzt verfügbar — sofort ausprobieren: MiniMax-M3 API

MiniMax M3 Status auf einen Blick

Thema	Status per 1. Juni 2026	Bedeutung für Entwickler
Öffentliches Release-Signal	Bestätigt	M3 ist auf EvoLink gestartet
EvoLink-Routenverfügbarkeit	Live	Entwickler können M3 über EvoLink nutzen
Model ID	`MiniMax-M3`	Direkt in SDK-Aufrufen und Routing-Konfiguration verwenden
Preise	Siehe Landingpage (Input ab ~$0.70/1M)	Auf der MiniMax-M3-Seite verfügbar
Kontextlänge	ca. 1M Tokens (>512K mit 2× Long-Context-Abrechnung)	Long-Context-Workloads sind bis 1M planbar
Multimodale Unterstützung	Unterstützt (Bild/Video/PDF)	Multimodale Eingaben können produktiv genutzt werden
Dual-Endpoint	OpenAI `/v1/chat/completions` + Anthropic `/v1/messages`	Claude-Code-ähnliche CLIs können nativ angebunden werden
Hugging Face / Open-Model-Status	Nicht in den offiziellen MiniMaxAI-Modellen gelistet	Keine Annahmen zu Gewichten oder Lizenzbedingungen treffen

MiniMax M3 ist seit dem 1. Juni 2026 auf EvoLink live. Sofort ausprobieren: MiniMax-M3 API.

Warum Entwickler MiniMax M3 beobachten

Das Interesse an MiniMax M3 ist leicht nachzuvollziehen. Das öffentliche Signal positioniert M3 rund um mehrere Aspekte, die Produktiv-AI-Teams wichtig sind:

Coding und agentic Workloads, bei denen Modelle planen, bearbeiten, Tools aufrufen und sich von Fehlern erholen müssen.
Long-Context-Aufgaben wie vollständige Codebase-Analysen, umfangreiche Verträge, lange Dokumente und Multi-File-Reasoning.
MiniMax Sparse Attention (MSA) als gemeldete Architekturrichtung für effizientere Verarbeitung sehr langer Kontexte.
Natives multimodales Reasoning für Computer-Use-Agents und Produktoberflächen.
Günstigeres Frontier-Model-Routing, da EvoLink veröffentlichte Tokenpreise für M3 zusammen mit Fallback-Routen bereitstellt.

Genau für diese Art von Workloads ist ein einheitliches API-Gateway entscheidend. Ein Team möchte M3 evaluieren, sobald es verfügbar ist, braucht aber gleichzeitig Fallback-Optionen, Kostenkontrolle und die Möglichkeit, Modelle zu wechseln, ohne Anwendungscode umzuschreiben.

Was weiterhin separate MiniMax-Technikdokumentation benötigt

Ein frühes öffentliches Signal stammte aus einem Social-Media-Post, der Skyler Miao zugeschrieben wird und M3 als LLM der nächsten Generation mit MiniMax Sparse Attention für Coding und agentic Tasks beschreibt. Mit dem Launch auf EvoLink sind die für API-Nutzer wesentlichen Eckdaten nun bestätigt; einige tiefergehende technische Behauptungen warten weiterhin auf offizielle MiniMax-Dokumentation.

Behauptung	Status
1M Kontext	Bestätigt: ca. 1M Tokens (>512K mit 2× Long-Context-Abrechnung)
Natives multimodales Reasoning	Bestätigt: Eingabe von Bild, Video und PDF unterstützt
Preise	Bestätigt: Input ~$0.70/1M, Output ~$2.80/1M, Cache Read ~$0.14/1M (≤512K)
MiniMax Sparse Attention-Architektur	Technische MiniMax-Dokumentation oder Release Notes ausstehend
SOTA-Performance für Coding und agentic Tasks	Offizielle Benchmarks plus unabhängige Evaluation im Produktivbetrieb ausstehend
Open-Model-Positionierung	Offizielles Repository, Modellgewichte und Lizenzbedingungen ausstehend

Diese Unterscheidung bleibt wichtig: Model ID, Preise, Kontextlimits und Modalitäten sind für den Produktiveinsatz bestätigt, während architektonische Details wie MSA und Open-Model-Bedingungen weiterhin auf offizielle Quellen warten.

API-Verfügbarkeit, Model ID und Preise

Für API-Nutzer sind die wichtigsten Informationen jetzt bestätigt:

Element	Aktueller Status	Warum es wichtig ist
API-Verfügbarkeit	Live auf EvoLink	Entwickler können M3 sofort aufrufen
Model ID	`MiniMax-M3`	Erforderlich für SDK-Aufrufe, Routing-Konfiguration und Beispiele
Preise	Input ~$0.70/1M, Output ~$2.80/1M, Cache Read ~$0.14/1M (≤512K)	Erforderlich für Budgetplanung und Kostenvergleich
Endpoints	OpenAI `/v1/chat/completions` + Anthropic `/v1/messages`	Erforderlich für SDK-Anbindung und Claude-Code-ähnliche CLIs
Streaming- und Tool-Verhalten	Unterstützt	Erforderlich für Coding Agents, CLIs und langlebige Workflows

MiniMax M3 ist am 1. Juni 2026 auf EvoLink live gegangen. Die vollständigen Details finden Sie auf der MiniMax-M3-Seite.

Was EvoLink-Nutzer jetzt tun können

MiniMax M3 ist seit dem 1. Juni 2026 auf EvoLink live. So legen Sie los:

Verwenden Sie die Model ID MiniMax-M3 direkt in Ihren SDK-Aufrufen und Ihrer Routing-Konfiguration.
Behalten Sie Ihre bestehende OpenAI-kompatible Integration bei — M3 funktioniert über den /v1/chat/completions-Endpoint und dasselbe SDK-Setup; für Claude-Code-ähnliche CLIs steht zusätzlich der native Anthropic Messages /v1/messages-Endpoint bereit.
Nutzen Sie multimodale Eingaben (Bild, Video, PDF) und Prompt-Caching, um Kosten zu senken.
Halten Sie Fallback-Routen bereit — für weitere MiniMax-Family-Workloads bleibt MiniMax-M2.5 auf EvoLink eine bestätigte Route für Coding Agents, Repository-Q&A und Long-Context-Workflows.

Wann MiniMax M3 zur Evaluation bereitsteht

MiniMax M3 ist seit dem 1. Juni 2026 auf EvoLink live und sofort einsatzbereit. Die bestätigten Details:

Model ID: MiniMax-M3
Preise: Input ~$0.70/1M, Output ~$2.80/1M, Cache Read ~$0.14/1M (≤512K, darüber 2× Long-Context-Abrechnung)
Kontext: ca. 1M Tokens (>512K mit 2× Long-Context-Abrechnung)
Unterstützte Modalitäten: Text plus multimodale Eingabe (Bild/Video/PDF)
Dual-Endpoint: OpenAI /v1/chat/completions + Anthropic /v1/messages, inkl. Streaming und Tool Use
Deep Thinking (Reasoning) und Prompt-Caching

FAQ

Ist MiniMax M3 veröffentlicht?
Ja — MiniMax M3 ist am 1. Juni 2026 auf EvoLink live gegangen.

Gibt es eine MiniMax M3 API?
Ja — MiniMax M3 ist über die EvoLink API zugänglich, sowohl über den OpenAI-kompatiblen /v1/chat/completions-Endpoint als auch über den nativen Anthropic Messages /v1/messages-Endpoint.

Wie lautet die MiniMax M3 Model ID?
Die Model ID lautet MiniMax-M3.

Was kostet MiniMax M3?
Der EvoLink-Verkaufspreis (≤512K) liegt bei ~$0.70/1M Input, ~$2.80/1M Output und ~$0.14/1M Cache Read; über 512K gilt eine 2× Long-Context-Abrechnung. Details auf der MiniMax-M3-Seite.

Unterstützt MiniMax M3 1M Kontext?
Ja — MiniMax M3 unterstützt ca. 1M Tokens Kontext. Bis 512K gilt der Basispreis, darüber eine 2× Long-Context-Abrechnung.

Unterstützt MiniMax M3 multimodales Reasoning?
Ja — MiniMax M3 unterstützt multimodale Eingaben (Bild, Video, PDF) sowie Deep Thinking (Reasoning).

Unterstützt EvoLink MiniMax M3?
Ja — MiniMax M3 ist seit dem 1. Juni 2026 auf EvoLink live.

Was sollte ich nutzen, neben MiniMax M3?
Für weitere MiniMax-Family-Workflows steht MiniMax-M2.5 auf EvoLink bereit. Für Coding-Agent-Routing allgemein vergleichen Sie bestätigte Modelle über EvoLink und halten Sie Fallback-Routen bereit.