Lancement produit

MiniMax-M3 API sur EvoLink : tarifs, ID et contexte 1M

EvoLink Team

Product Team

1 juin 2026

8 min de lecture

MiniMax M3 commence à attirer l'attention des développeurs après des discussions publiques le décrivant comme un LLM de nouvelle génération pour les coding agents, les workflows à contexte long, le raisonnement multimodal et une utilisation en production à coût réduit.

Pour les équipes qui construisent sur EvoLink, la question qui compte est pratique : peut-on appeler MiniMax M3 via une API aujourd'hui, et faut-il déjà planifier des workloads de production autour de ce modèle ?

La réponse est désormais : oui. MiniMax M3 est en ligne sur EvoLink depuis le 1er juin 2026. Les développeurs peuvent accéder à M3 via le même endpoint compatible OpenAI utilisé pour tous les autres modèles EvoLink, ainsi que via l'endpoint Anthropic Messages natif /v1/messages (adapté aux CLIs de type Claude Code). Désormais en ligne, essayez-le immédiatement : MiniMax-M3 API

MiniMax M3 : état des lieux

Sujet	Statut au 1er juin 2026	Ce que cela signifie pour les développeurs
Signal de lancement public	Confirmé	M3 est lancé sur EvoLink
Disponibilité sur EvoLink	En ligne (Live)	Les développeurs peuvent accéder à M3 via EvoLink dès maintenant
Model ID	`MiniMax-M3`	Utilisez `MiniMax-M3` pour vos appels SDK et votre configuration de routage
Endpoints	Compatible OpenAI `/v1/chat/completions` + Anthropic Messages natif `/v1/messages`	Adapté aux SDK OpenAI et aux CLIs de type Claude Code
Tarification	Voir la page du modèle (Input à partir de ~$0.70/1M)	Tarifs de vente EvoLink confirmés — consultez la page du modèle
Longueur de contexte	~1M tokens (palier ×2 au-delà de 512K)	Tarif de référence jusqu'à 512K ; au-delà, facturation au tarif long contexte ×2
Support multimodal	Pris en charge (image / vidéo / PDF)	Raisonnement multimodal disponible en entrée

Cette page reflète désormais les faits confirmés au lancement du 1er juin 2026.

Pourquoi les développeurs suivent MiniMax M3

L'intérêt autour de MiniMax M3 est facile à comprendre. Le signal public positionne M3 autour de plusieurs aspects qui comptent pour les équipes IA en production :

Les workloads de coding et d'agents où les modèles doivent planifier, éditer, appeler des outils et récupérer après des erreurs.
Les tâches à contexte long comme l'analyse de codebase complète, les contrats volumineux, les documents longs et le raisonnement multi-fichiers.
MiniMax Sparse Attention (MSA) comme direction architecturale annoncée pour gérer le contexte très long de manière plus efficace.
Le raisonnement multimodal natif pour les agents computer-use et les interfaces produit.
Le routage frontier-model à moindre coût, maintenant qu'EvoLink expose une tarification token publiée pour M3 avec des routes de fallback.

Ce sont exactement les types de workloads pour lesquels une passerelle API unifiée fait la différence. Une équipe qui évalue M3 a besoin d'options de fallback, de contrôle des coûts et d'un moyen de changer de modèle sans réécrire le code applicatif.

Ce qui demande encore une documentation technique MiniMax séparée

Le signal public le plus fort à ce jour est un post sur les réseaux sociaux attribué à Skyler Miao décrivant M3 comme un LLM de nouvelle génération avec MiniMax Sparse Attention pour les tâches de coding et d'agents. EvoLink traite cela comme un signal de demande, et non comme une documentation technique définitive.

Affirmation signalée	Ce qui nécessite une confirmation officielle
Architecture MiniMax Sparse Attention	Documentation technique ou notes de version MiniMax
Performance SOTA en coding et agents	Benchmarks officiels et évaluation indépendante en conditions de production
Contexte 1M	Limites officielles de contexte, de sortie et de facturation
Raisonnement multimodal natif	Schéma API et modalités d'entrée/sortie supportées
Tarification comparable à DeepSeek	Tarification officielle au token ou par forfait
Coût inférieur à Sonnet ou autres modèles open source	Comparaison tarifaire documentée avec versions de modèles et dates exactes
Positionnement open-model	Dépôt officiel, poids du modèle et conditions de licence

Cette distinction est importante. Les développeurs peuvent utiliser les détails de route EvoLink ci-dessous pour planifier l'intégration ; les affirmations MSA, benchmarks et open weights doivent rester séparées jusqu'à publication d'une documentation MiniMax sourcée.

Disponibilité API, model ID et tarification

Pour les utilisateurs d'API, les éléments essentiels sont désormais confirmés :

Élément	Statut actuel	Pourquoi c'est important
Disponibilité API	En ligne sur EvoLink	Les développeurs peuvent appeler M3 dès maintenant
Model ID	`MiniMax-M3`	Requis pour les appels SDK, la configuration de routage et les exemples
Tarification	Input ~$0.70/1M, Output ~$2.80/1M, Cache ~$0.14/1M (≤512K)	Tarifs de vente EvoLink confirmés pour la planification budgétaire
Endpoints	OpenAI `/v1/chat/completions` + Anthropic Messages `/v1/messages`	Couvre les SDK OpenAI et les CLIs de type Claude Code
Streaming et comportement des outils	Pris en charge sur les deux endpoints	Adapté aux coding agents, aux CLIs et aux workflows de longue durée

MiniMax M3 est en ligne sur EvoLink depuis le 1er juin 2026. Consultez la page du modèle pour les détails les plus récents : MiniMax-M3 API.

Ce que les utilisateurs EvoLink peuvent faire dès maintenant

MiniMax M3 est en ligne sur EvoLink depuis le 1er juin 2026. Voici comment démarrer :

Utilisez le model ID MiniMax-M3 avec la tarification confirmée (Input à partir de ~$0.70/1M) et un contexte de ~1M tokens.
Conservez votre intégration compatible OpenAI — M3 fonctionne via le même endpoint EvoLink et la même configuration SDK, ou via l'endpoint Anthropic Messages natif /v1/messages pour les CLIs de type Claude Code.
Lancez votre jeu de tests sur des prompts de coding-agent, multimodaux (image / vidéo / PDF) et à contexte long pour évaluer M3 dès maintenant.
Gardez des routes de fallback prêtes — MiniMax-M2.5 sur EvoLink reste une route complémentaire pour les coding agents, le Q&A sur les dépôts et les workflows à contexte long.

MiniMax M3 est prêt à évaluer dès maintenant

MiniMax M3 est en ligne sur EvoLink depuis le 1er juin 2026. Les détails confirmés au lancement :

Model ID : MiniMax-M3
Tarification : Input ~$0.70/1M, Output ~$2.80/1M, Cache ~$0.14/1M (≤512K)
Contexte : ~1M tokens (palier de facturation ×2 au-delà de 512K)
Modalités : entrées image, vidéo et PDF supportées
Endpoints : OpenAI /v1/chat/completions + Anthropic Messages natif /v1/messages, avec streaming, tool use et function calling
Prompt caching pris en charge

FAQ

MiniMax M3 est-il sorti ?
Oui — MiniMax M3 est en ligne sur EvoLink depuis le 1er juin 2026.

Existe-t-il une API MiniMax M3 ?
Oui — MiniMax M3 est accessible via l'API EvoLink dès maintenant, via l'endpoint compatible OpenAI /v1/chat/completions et l'endpoint Anthropic Messages natif /v1/messages.

Quel est le model ID de MiniMax M3 ?
Le model ID est MiniMax-M3.

Combien coûte MiniMax M3 ?
Les tarifs de vente EvoLink (≤512K) sont : Input ~$0.70/1M, Output ~$2.80/1M, Cache ~$0.14/1M tokens. Au-delà de 512K, la facturation passe au tarif long contexte ×2. Voir la page du modèle.

MiniMax M3 supporte-t-il un contexte de 1M ?
Oui — MiniMax M3 supporte une fenêtre de contexte de ~1M tokens, avec un tarif de référence jusqu'à 512K et une facturation au tarif ×2 au-delà.

MiniMax M3 supporte-t-il le raisonnement multimodal ?
Oui — MiniMax M3 prend en charge les entrées multimodales (image, vidéo, PDF), ainsi que le raisonnement profond (thinking) et le prompt caching.

EvoLink supporte-t-il MiniMax M3 ?
Oui — MiniMax M3 est en ligne sur EvoLink depuis le 1er juin 2026 : MiniMax-M3 API.

Que dois-je utiliser avec MiniMax M3 ?
Pour les coding agents et les CLIs de type Claude Code, utilisez l'endpoint Anthropic Messages natif /v1/messages. Pour les workflows MiniMax complémentaires, MiniMax-M2.5 sur EvoLink reste disponible comme route de fallback.