MiniMax-M2.5 API

Utilisez MiniMax-M2.5 via EvoLink avec une seule clé API, des requêtes compatibles OpenAI et des tarifs de production à partir de $0.18/1M tokens d'entrée. Idéal pour les coding agents, Q&A de dépôts, agents de recherche et workflows de documents long-contexte sans changer votre stack SDK.

Type de modèle:

Prix:

$0.191(~ 13 credits) per 1M input tokens; $0.762(~ 51.8 credits) per 1M output tokens

$0.025(~ 1.7 credits) per 1M cache read tokens

Web search tool charged separately per request.

Stabilité maximale avec une disponibilité garantie de 99,9 %. Recommandé pour la production.

Le même endpoint API est utilisé pour toutes les versions. Seul le paramètre model change.

PRICING

PLAN	CONTEXT WINDOW	MAX OUTPUT	INPUT	OUTPUT	CACHE READ
MiniMax-M2.5	204,800	131,072	$0.191-36% (13 Credits)	$0.762-37% (51.8 Credits)	$0.025-17% (1.7 Credits)
Web Search Tool Server-side web search capability					$0.001/search (0.04 Credits)

Pricing Note: Prices show both USD and Credits. Units default to / 1M tokens unless noted separately.

Cache Hit: Price applies to cached prompt tokens.

Tarifs et accès API MiniMax-M2.5 pour les charges de raisonnement

Routez MiniMax-M2.5 via EvoLink pour les coding agents, Q&A de dépôts, recherche et analyse de documents avec contexte 204K, recherche web intégrée et prompt caching. Démarrez avec un accès compatible OpenAI et des tarifs à partir de $0.18/1M tokens d'entrée.

Accès et usage cible

Idéal pour

Agents de code

Accès

Compatible OpenAI

Contexte

Fenêtre 204K

Intégré

Recherche web + cache

Voir les tarifs Setup gateway pour CLIs de code

Que pouvez-vous construire avec l'API MiniMax-M2.5 ?

Assistants de codage intelligents

Créez des copilotes de codage et des coding agents qui gèrent le Q&A de dépôts, la génération de code, le triage de bugs et les workflows de revue. MiniMax-M2.5 est particulièrement adapté lorsque votre produit nécessite une compréhension de code long-contexte et un raisonnement étape par étape dans une seule API texte.

Commencer à construire

Cas d'usage de l'API MiniMax-M2.5 pour le codage

Recherche & analyse avec recherche web

Utilisez MiniMax-M2.5 pour les agents de recherche, les scans de marché et les workflows de connaissances nécessitant des données web fraîches. La recherche peut être activée uniquement en cas de besoin, aidant les équipes à équilibrer qualité de réponse, latence et coût.

Explorer la recherche

Cas d'usage de l'API MiniMax-M2.5 pour la recherche

Traitement de documents & synthèse

Traitez des contrats, rapports, transcriptions de support et longues bases de connaissances internes sans chunking agressif. La fenêtre de contexte 204K est utile pour les synthèses structurées, les pipelines d'extraction et les tâches de comparaison de documents.

Traiter des documents

Cas d'usage de l'API MiniMax-M2.5 pour les documents

Pourquoi les équipes choisissent l'API MiniMax-M2.5

Les équipes choisissent MiniMax-M2.5 sur EvoLink lorsqu'elles ont besoin de raisonnement long-contexte, de tarifs token prévisibles et d'un onboarding plus rapide qu'une intégration spécifique à un fournisseur séparé.

Intégration à friction réduite

Conservez le format de requête style OpenAI, utilisez une seule clé EvoLink et intégrez MiniMax-M2.5 dans les coding agents ou workflows style gateway sans construire d'abord un chemin d'intégration spécifique MiniMax.

Coût de production prévisible

Les tarifs token visibles facilitent la budgétisation : entrée à partir de $0.18/1M, sortie à $0.72/1M et hits de cache à $0.018/1M pour les prompts répétés.

Raisonnement plus récupération en direct

Utilisez le contexte 204K pour les grands prompts et activez la recherche web intégrée pour les flux de recherche ou de vérification nécessitant des informations fraîches.

Comment intégrer l'API MiniMax-M2.5

Conservez votre client OpenAI existant, pointez-le vers EvoLink, définissez le modèle sur MiniMax-M2.5 et utilisez la même route pour les workflows de coding-agent, Q&A de dépôt et long-contexte.

Étape 1 — Authentification

Créez une clé API EvoLink, définissez l'URL de base EvoLink et envoyez des requêtes avec l'authentification Bearer standard.

Étape 2 — Définir les champs requis

Envoyez `model: MiniMax-M2.5` avec votre tableau `messages`. Réutilisez les prompts système stables et les préfixes pour bénéficier du prompt caching sur les charges de travail répétées.

Étape 3 — Ajuster les sorties

Ajustez temperature, top_p, max_tokens et stream comme d'habitude. Activez `enable_search` uniquement en cas de besoin, puis choisissez `search_strategy: turbo` ou `max` en fonction de la latence et de la couverture.

Voir la documentation API

Fonctionnalités de l'API MiniMax-M2.5 pour les équipes de production

Contrôles concrets et signaux de déploiement plutôt qu'un aperçu générique du modèle

Raisonnement

Modèle de raisonnement pour charges de travail textuelles

Utilisez MiniMax-M2.5 pour le codage, l'analyse structurée et les tâches textuelles multi-étapes où la qualité de réponse est plus importante qu'une sortie de chat légère.

Contexte

Fenêtre de contexte 204K

Intégrez de longs documents, de grands prompts et un contexte multi-tours dans une seule requête avant de recourir au chunking agressif ou à l'orchestration multi-passes.

Recherche

Modes de recherche pour données actuelles

Activez la récupération en temps réel avec `enable_search: true` et choisissez `turbo` ou `max` selon que la vitesse ou une couverture plus large est plus importante.

Compatibilité

Compatible SDK OpenAI

Migrez les clients existants de style OpenAI vers MiniMax-M2.5 en changeant l'URL de base et le nom du modèle au lieu de reconstruire votre chemin d'intégration pour les outils de codage ou les agents internes.

Caching

Prompt Caching

Les préfixes répétés et les prompts système peuvent être facturés plus efficacement, ce qui aide les workflows d'agents récurrents et le trafic de production à volume élevé.

Vitesse

Chemin de déploiement Alibaba Cloud

La route est déployée sur Alibaba Cloud pour une faible latence et un chemin de livraison orienté production sur EvoLink.

FAQ de l'API MiniMax-M2.5

Everything you need to know about the product and billing.

Les tarifs de MiniMax-M2.5 sur EvoLink commencent à $0.18 par 1M de tokens d'entrée et $0.72 par 1M de tokens de sortie. Les hits de cache commencent à $0.018 par 1M de tokens, ce qui est utile lorsque vous réutilisez de longs prompts système ou des préfixes stables sur des requêtes répétées.

MiniMax-M2.5 est particulièrement adapté aux coding agents, assistants de codage, Q&A de dépôts, workflows de recherche, analyse de documents et autres applications textuelles qui bénéficient d'un long contexte, d'un raisonnement multi-étapes et d'une recherche web optionnelle.

MiniMax-M2.5 supporte une fenêtre de contexte de 204K tokens (204 800 tokens), avec jusqu'à 196 608 tokens pour l'entrée et 131 072 tokens pour la chaîne de raisonnement et la sortie combinées.

Oui. MiniMax-M2.5 supporte la recherche web intégrée et le prompt caching implicite. Activez la recherche avec `enable_search: true`, choisissez `turbo` ou `max` pour votre stratégie de recherche et bénéficiez de hits de cache moins coûteux lorsque les prompts partagent le même préfixe stable.

Oui. EvoLink fournit un endpoint API compatible OpenAI. Vous pouvez utiliser le SDK OpenAI en changeant l'URL de base vers votre endpoint EvoLink et en définissant le modèle sur MiniMax-M2.5.

Généralement oui. Les équipes évaluant MiniMax-M2.5 pour les coding agents souhaitent souvent un chemin de gateway stable pour les outils d'éditeur, les CLIs et les agents internes. Si votre workflow accepte déjà un endpoint compatible OpenAI, la migration vers EvoLink reste légère. Pour les modèles de configuration adjacents, voir One Gateway for 3 Coding CLIs et Gateway vs Direct APIs.

Utilisez l'enum de modèle `MiniMax-M2.5` dans le corps de la requête. EvoLink acheminera la requête vers le modèle MiniMax-M2.5 via le fournisseur optimal.