MiniMax-M2.5 API

Use MiniMax-M2.5 a través de EvoLink con una clave API, solicitudes compatibles con OpenAI y precios de producción desde $0.18/1M tokens de entrada. Ideal para coding agents, Q&A de repositorios, agentes de investigación y flujos de trabajo de documentos de contexto largo sin cambiar su stack de SDK.

Tipo de modelo:

Precio:

$0.191(~ 13 credits) per 1M input tokens; $0.762(~ 51.8 credits) per 1M output tokens

$0.025(~ 1.7 credits) per 1M cache read tokens

Web search tool charged separately per request.

Máxima estabilidad con 99.9% de disponibilidad garantizada. Recomendado para producción.

Todas las versiones usan el mismo endpoint API. Solo cambia el parámetro model.

PRICING

PLAN	CONTEXT WINDOW	MAX OUTPUT	INPUT	OUTPUT	CACHE READ
MiniMax-M2.5	204,800	131,072	$0.191-36% (13 Credits)	$0.762-37% (51.8 Credits)	$0.025-17% (1.7 Credits)
Web Search Tool Server-side web search capability					$0.001/search (0.04 Credits)

Pricing Note: Prices show both USD and Credits. Units default to / 1M tokens unless noted separately.

Cache Hit: Price applies to cached prompt tokens.

Precios y acceso API MiniMax-M2.5 para cargas de razonamiento

Enrute MiniMax-M2.5 a través de EvoLink para coding agents, Q&A de repositorios, investigación y análisis de documentos con contexto 204K, búsqueda web integrada y prompt caching. Comience con acceso compatible con OpenAI y precios desde $0.18/1M tokens de entrada.

Acceso y encaje del flujo

Ideal para

Agentes de código

Acceso

Compatible con OpenAI

Contexto

Ventana 204K

Integrado

Búsqueda web + caché

Ver precios Gateway para CLIs de código

¿Qué puedes construir con la API MiniMax-M2.5?

Asistentes de codificación inteligentes

Construya copilots de codificación y coding agents que manejen Q&A de repositorios, generación de código, clasificación de bugs y flujos de revisión. MiniMax-M2.5 es ideal cuando su producto necesita comprensión de código de contexto largo y razonamiento paso a paso en una API de texto.

Comenzar a construir

Caso de uso de la API MiniMax-M2.5 para codificación

Investigación y análisis con búsqueda web

Use MiniMax-M2.5 para agentes de investigación, escaneos de mercado y flujos de trabajo de conocimiento que necesitan datos web frescos. La búsqueda puede activarse solo cuando sea necesario, ayudando a los equipos a equilibrar calidad de respuesta, latencia y costo.

Explorar investigación

Caso de uso de la API MiniMax-M2.5 para investigación

Procesamiento de documentos y resumen

Procese contratos, informes, transcripciones de soporte y bases de conocimiento internas largas sin fragmentación agresiva. La ventana de contexto 204K es útil para resúmenes estructurados, pipelines de extracción y tareas de comparación de documentos.

Procesar documentos

Caso de uso de la API MiniMax-M2.5 para documentos

Por qué los equipos eligen la API MiniMax-M2.5

Los equipos eligen MiniMax-M2.5 en EvoLink cuando necesitan razonamiento de contexto largo, precios de tokens predecibles y una incorporación más rápida que una integración específica de proveedor separada.

Integración de menor fricción

Mantenga el formato de solicitud estilo OpenAI, use una clave EvoLink e integre MiniMax-M2.5 en coding agents o flujos de trabajo estilo gateway sin construir primero una ruta de integración específica de MiniMax.

Costo de producción predecible

Los precios de tokens visibles facilitan la presupuestación: entrada desde $0.18/1M, salida a $0.72/1M y aciertos de caché a $0.018/1M para prompts repetidos.

Razonamiento más recuperación en vivo

Use contexto 204K para prompts grandes y active la búsqueda web integrada para flujos de investigación o verificación que necesitan información fresca.

Cómo integrar la API MiniMax-M2.5

Mantenga su cliente OpenAI existente, apúntelo a EvoLink, establezca el modelo en MiniMax-M2.5 y use la misma ruta para flujos de trabajo de coding-agent, Q&A de repositorio y contexto largo.

Paso 1 — Autenticación

Cree una clave API de EvoLink, establezca la URL base de EvoLink y envíe solicitudes con autenticación Bearer estándar.

Paso 2 — Establecer campos requeridos

Envíe `model: MiniMax-M2.5` con su array `messages`. Reutilice prompts de sistema estables y prefijos para beneficiarse del prompt caching en cargas de trabajo repetidas.

Paso 3 — Ajustar salidas

Ajuste temperature, top_p, max_tokens y stream como de costumbre. Active `enable_search` solo cuando sea necesario, luego elija `search_strategy: turbo` o `max` según latencia y cobertura.

Ver documentación API

Características de la API MiniMax-M2.5 para equipos de producción

Controles concretos y señales de despliegue en lugar de una descripción genérica del modelo

Razonamiento

Modelo de razonamiento para cargas de trabajo de texto

Use MiniMax-M2.5 para codificación, análisis estructurado y tareas de texto multi-paso donde la calidad de respuesta es más importante que la salida de chat ligera.

Contexto

Ventana de contexto 204K

Ajuste documentos largos, prompts grandes y contexto multi-turno en una solicitud antes de recurrir a fragmentación agresiva u orquestación multi-paso.

Búsqueda

Modos de búsqueda para datos actuales

Active la recuperación en tiempo real con `enable_search: true` y elija `turbo` o `max` según si la velocidad o una cobertura más amplia es más importante.

Compatibilidad

Compatible con SDK OpenAI

Migre clientes existentes de estilo OpenAI a MiniMax-M2.5 cambiando la URL base y el nombre del modelo en lugar de reconstruir su ruta de integración para herramientas de codificación o agentes internos.

Caching

Prompt Caching

Los prefijos repetidos y prompts de sistema pueden facturarse de manera más eficiente, lo que ayuda a los flujos de trabajo de agentes recurrentes y al tráfico de producción de alto volumen.

Velocidad

Ruta de despliegue Alibaba Cloud

La ruta está desplegada en Alibaba Cloud para baja latencia y una ruta de entrega orientada a producción en EvoLink.

Preguntas frecuentes sobre la API MiniMax-M2.5

Everything you need to know about the product and billing.

Los precios de MiniMax-M2.5 en EvoLink comienzan en $0.18 por 1M de tokens de entrada y $0.72 por 1M de tokens de salida. Los aciertos de caché comienzan en $0.018 por 1M de tokens, lo cual es útil cuando reutiliza prompts de sistema largos o prefijos estables en solicitudes repetidas.

MiniMax-M2.5 es ideal para coding agents, asistentes de codificación, Q&A de repositorios, flujos de trabajo de investigación, análisis de documentos y otras aplicaciones de texto que se benefician de contexto largo, razonamiento multi-paso y búsqueda web opcional.

MiniMax-M2.5 admite una ventana de contexto de 204K tokens (204,800 tokens), con hasta 196,608 tokens para entrada y 131,072 tokens para cadena de razonamiento y salida combinadas.

Sí. MiniMax-M2.5 admite búsqueda web integrada y prompt caching implícito. Active la búsqueda con `enable_search: true`, elija `turbo` o `max` para su estrategia de búsqueda y benefíciese de aciertos de caché de menor costo cuando los prompts comparten el mismo prefijo estable.

Sí. EvoLink proporciona un endpoint API compatible con OpenAI. Puede usar el SDK de OpenAI cambiando la URL base a su endpoint de EvoLink y estableciendo el modelo en MiniMax-M2.5.

Generalmente sí. Los equipos que evalúan MiniMax-M2.5 para coding agents a menudo desean una ruta de gateway estable para herramientas de editor, CLIs y agentes internos. Si su flujo de trabajo ya acepta un endpoint compatible con OpenAI, la migración a EvoLink sigue siendo ligera. Para patrones de configuración adyacentes, consulte One Gateway for 3 Coding CLIs y Gateway vs Direct APIs.

Use el enum de modelo `MiniMax-M2.5` en el cuerpo de la solicitud. EvoLink enrutará la solicitud al modelo MiniMax-M2.5 a través del proveedor óptimo.