Gemini Omni próximamenteMás información

MiniMax-M3 API

Use MiniMax-M3 a través de EvoLink con una clave API en ambos endpoints: compatible con OpenAI (/v1/chat/completions) y Anthropic Messages (/v1/messages). Con ~1M de contexto, deep thinking, entrada multimodal y prompt caching, es ideal para coding agents, Q&A de repositorios, análisis de documentos y flujos de trabajo estilo Claude Code desde $0.49/1M tokens de entrada.
Tipo de modelo:
Precio: 

$0.494 - 0.988(~ 33.6 - 67.2 credits) per 1M input tokens; $1.976 - 3.953(~ 134.4 - 268.8 credits) per 1M output tokens

$0.618 - 1.235(~ 42 - 84 credits) per 1M cache write tokens; $0.099 - 0.197(~ 6.7 - 13.4 credits) per 1M cache read tokens

Context over 512K tokens is billed at 2× the official rate (long-context tier, not discounted). Supports thinking, multimodal input (image/video/PDF) and prompt caching.

Máxima estabilidad con 99.9% de disponibilidad garantizada. Recomendado para producción.

Todas las versiones usan el mismo endpoint API. Solo cambia el parámetro model.

MiniMax-M3 API

Enrute MiniMax-M3 a través de EvoLink para coding agents, Q&A de repositorios, investigación y análisis multimodal de documentos con una ventana de contexto de ~1M, deep thinking y prompt caching. Conéctese mediante endpoints compatibles con OpenAI o Anthropic Messages, con precios desde $0.49/1M tokens de entrada.

Acceso y encaje del flujo

Ideal para

Agentes de código

Model ID

MiniMax-M3

Acceso

OpenAI + Anthropic

Contexto

Ventana 1M

Input

$0.49/1M

Integrado

Thinking + multimodal + caché

Presentación de la API MiniMax-M3

¿Qué puedes construir con la API MiniMax-M3?

Coding Agents y flujos de trabajo Claude Code

Construya copilots de codificación y agentes que manejen Q&A de repositorios, generación de código y revisión. Como MiniMax-M3 expone un endpoint nativo de Anthropic Messages, se integra en CLIs estilo Claude Code y frameworks de agentes, mientras que el deep thinking maneja el razonamiento multi-paso en una sola API.

Caso de uso de la API MiniMax-M3 para codificación

Comprensión multimodal

Alimente imágenes, video y documentos PDF directamente a MiniMax-M3 junto con texto. Úselo para Q&A visual, captura de pantalla a código, comprensión de gráficos y documentos, y resumen de video sin conectar un modelo de visión separado a su stack.

Caso de uso de la API MiniMax-M3 multimodal

Procesamiento de documentos de contexto largo

Procese contratos, informes, bases de código y grandes bases de conocimiento sin fragmentación agresiva. La ventana de contexto de ~1M es ideal para resúmenes estructurados, pipelines de extracción y tareas de comparación, mientras que el prompt caching mantiene asequibles los prefijos largos repetidos.

Caso de uso de la API MiniMax-M3 para documentos

Por qué los equipos eligen la API MiniMax-M3

Los equipos eligen MiniMax-M3 en EvoLink cuando necesitan razonamiento multimodal de contexto largo, acceso de protocolo dual y precios de tokens predecibles sin construir una integración específica de proveedor.

Acceso de endpoint dual

Llame a MiniMax-M3 a través del endpoint compatible con OpenAI o el endpoint nativo de Anthropic Messages con una sola clave EvoLink. Tanto el código del SDK de OpenAI existente como los clientes estilo Claude Code funcionan sin reconstruir su ruta de integración.

Costo de producción predecible

Los precios de tokens visibles facilitan la presupuestación: entrada desde $0.49/1M, salida desde $1.98/1M y lecturas de caché desde alrededor de $0.10/1M para prompts repetidos. El contexto por encima de 512K se factura en un nivel de contexto largo de 2×.

Thinking, multimodal y caching

Use ~1M de contexto para prompts grandes, active el deep thinking para razonamiento complejo, pase entrada de imagen/video/PDF directamente y confíe en el prompt caching para reducir el costo del contexto repetido.

MiniMax-M3 vs MiniMax-M2.5: ¿qué modelo conviene usar?

Úsalo como guía de selección de modelo, no como benchmark. M2.5 sigue siendo una opción MiniMax de menor costo, mientras M3 es la mejor elección para cargas agentic y multimodales más exigentes.

Punto de decisiónMiniMax-M2.5MiniMax-M3
Rol del modeloOpción MiniMax de menor costo para cargas textualesOpción MiniMax principal para workloads agentic avanzados
Mejor usoRepo Q&A, análisis documental, investigación y tareas de texto sensibles al costoCoding agents, CLIs tipo Claude Code, razonamiento multimodal y análisis de repos completos
ContextoContexto 204KContexto ~1M con tramo 2x por encima de 512K
Cobertura de inputModelo enfocado en texto con web search y prompt cachingTexto más imagen, video y PDF con thinking y caching
EndpointAcceso compatible con OpenAIOpenAI-compatible más Anthropic Messages nativo
Posición de costoÚsalo cuando el costo unitario pese más que la capacidad máximaÚsalo cuando mejor razonamiento, más contexto o multimodal justifiquen el upgrade

Cómo integrar la API MiniMax-M3

Mantenga su cliente OpenAI o Anthropic existente, apúntelo a EvoLink, establezca el modelo en MiniMax-M3 y use la misma ruta para flujos de trabajo de coding-agent, multimodal y contexto largo.

1

Paso 1 — Autenticación

Cree una clave API de EvoLink y establezca la URL base de EvoLink. Use autenticación Bearer para el endpoint compatible con OpenAI, o x-api-key para el endpoint de Anthropic Messages.

2

Paso 2 — Establecer campos requeridos

Envíe `model: MiniMax-M3` con su array `messages`. Reutilice prompts de sistema y prefijos estables para beneficiarse del prompt caching en cargas de trabajo repetidas.

3

Paso 3 — Ajustar salidas

Ajuste temperature, top_p, max_tokens y stream como de costumbre. Active `thinking` para razonamiento profundo y adjunte bloques de contenido de imagen, video o PDF para solicitudes multimodales.

Características de la API MiniMax-M3 para equipos de producción

Controles concretos y señales de despliegue en lugar de una descripción genérica del modelo

Thinking

Modo deep thinking

Active el thinking para matemáticas, lógica y análisis complejo multi-paso. El razonamiento se expone como un campo o bloque de contenido separado, para que pueda mostrar u ocultar la cadena de pensamiento en su producto.

Contexto

Ventana de contexto de ~1M

Ajuste bases de código completas, documentos largos y contexto multi-turno en una sola solicitud antes de recurrir a fragmentación agresiva u orquestación multi-paso.

Multimodal

Entrada multimodal

Pase entradas de imagen, video y PDF junto con texto para Q&A visual, comprensión de documentos y resumen de video en la misma API de texto.

Compatibilidad

Compatible con OpenAI + Anthropic

Conéctese con el SDK de OpenAI mediante /v1/chat/completions o el SDK de Anthropic mediante /v1/messages cambiando la URL base y el nombre del modelo — sin reconstruir la integración.

Caching

Prompt Caching

Los prefijos repetidos y prompts de sistema se facturan a una tarifa de lectura de caché más baja, lo que ayuda a los flujos de trabajo de agentes recurrentes y al tráfico de producción de alto volumen.

Precios

Precios por nivel de contexto largo

Las solicitudes de hasta 512K de contexto usan la tarifa base; por encima de 512K, los tokens se facturan en un nivel de contexto largo de 2×, por lo que el costo escala de manera predecible con el tamaño del prompt.

Preguntas frecuentes sobre la API MiniMax-M3

Everything you need to know about the product and billing.

Los precios de MiniMax-M3 en EvoLink comienzan en alrededor de $0.49 por 1M de tokens de entrada y $1.98 por 1M de tokens de salida. Las lecturas de caché comienzan en alrededor de $0.10 por 1M de tokens, lo cual es útil cuando reutiliza prompts de sistema largos o prefijos estables. Las solicitudes con más de 512K de contexto se facturan en un nivel de contexto largo de 2×.
MiniMax-M3 es ideal para coding agents, CLIs estilo Claude Code, Q&A de repositorios, comprensión multimodal (imagen, video, PDF), flujos de trabajo de investigación y análisis de documentos largos que se benefician de ~1M de contexto, deep thinking y prompt caching.
MiniMax-M3 admite una ventana de contexto de aproximadamente 1M de tokens. Las solicitudes de hasta 512K de contexto se facturan a la tarifa base, y los tokens más allá de ese umbral se facturan en un nivel de contexto largo de 2×.
Sí. MiniMax-M3 acepta entrada de imagen, video y PDF junto con texto, admite un modo deep thinking para razonamiento complejo y admite prompt caching para que los prefijos repetidos se facturen a una tarifa de lectura de caché más baja.
Sí. EvoLink expone MiniMax-M3 en un endpoint compatible con OpenAI (/v1/chat/completions) y en un endpoint de Anthropic Messages (/v1/messages). Cambie la URL base y establezca el modelo en MiniMax-M3 para usar el SDK de OpenAI o el SDK de Anthropic.
Generalmente sí. Como MiniMax-M3 expone un endpoint nativo de Anthropic Messages, se integra directamente en CLIs estilo Claude Code y frameworks de agentes, y el endpoint compatible con OpenAI cubre herramientas de editor y agentes internos. Para patrones de configuración adyacentes, consulte Un Gateway para 3 CLIs de Codificación y Gateway frente a APIs Directas.
Use el enum de modelo `MiniMax-M3` en el cuerpo de la solicitud. EvoLink enrutará la solicitud al modelo MiniMax-M3 a través del proveedor óptimo.