MiniMax-M3 API

EvoLink를 통해 하나의 API 키로 OpenAI 호환(/v1/chat/completions) 및 Anthropic Messages(/v1/messages) 엔드포인트 모두에서 MiniMax-M3를 사용하세요. 약 1M 컨텍스트, 딥 씽킹, 멀티모달 입력 및 프롬프트 캐싱을 갖추어 Coding agents, 리포지토리 Q&A, 문서 분석 및 Claude Code 스타일 워크플로우에 적합하며 입력 토큰 $0.49/1M부터 시작합니다.

모델 유형:

가격:

$0.494 - 0.988(~ 33.6 - 67.2 credits) 100만 입력 토큰당; $1.976 - 3.953(~ 134.4 - 268.8 credits) 100만 출력 토큰당

$0.618 - 1.235(~ 42 - 84 credits) 100만 캐시 쓰기 토큰당; $0.099 - 0.197(~ 6.7 - 13.4 credits) 100만 캐시 읽기 토큰당

512K 토큰을 초과하는 컨텍스트는 공식 요금의 2배로 청구됩니다(롱 컨텍스트 등급, 할인 없음). 사고, 멀티모달 입력(이미지/비디오/PDF) 및 프롬프트 캐싱을 지원합니다.

프로덕션 워크로드를 위한 안정적인 관리형 액세스입니다. 대시보드 결제, API 키 제어, 예측 가능한 통합 동작이 필요할 때 권장됩니다.

모든 버전은 동일한 API 엔드포인트를 사용하며 model 파라미터만 다릅니다.

PRICING

PLAN	CONTEXT WINDOW	MAX OUTPUT	INPUT	OUTPUT	CACHE WRITE	CACHE READ
MiniMax-M3	1,000,000	131,072	≤524.3K$0.495-20% (33.6 Credits) >524.3K$1.236 (84 Credits)	≤524.3K$1.977-20% (134.4 Credits) >524.3K$4.942 (336 Credits)	≤524.3K$0.618-20% (42 Credits) >524.3K$1.545 (105 Credits)	≤524.3K$0.099-20% (6.7 Credits) >524.3K$0.248 (16.8 Credits)

Pricing Note: Prices show both USD and Credits. Units default to / 1M tokens unless noted separately.

Cache Hit: Price applies to cached prompt tokens.

MiniMax-M3 API

EvoLink를 통해 약 1M 컨텍스트 창, 딥 씽킹 및 프롬프트 캐싱을 갖춘 MiniMax-M3를 Coding agents, 리포지토리 Q&A, 연구 및 멀티모달 문서 분석에 라우팅하세요. OpenAI 호환 또는 Anthropic Messages 엔드포인트로 연결하고 입력 토큰 $0.49/1M부터 시작하는 가격을 이용하세요.

접속 및 워크플로 적합성

적합한 용도

코딩 에이전트

Model ID

MiniMax-M3

접속 방식

OpenAI + Anthropic

컨텍스트

1M 윈도우

Input

$0.49/1M

내장 기능

사고 + 멀티모달 + 캐시

요금 보기 코딩 CLI 게이트웨이 설정 MiniMax-M3 출시 세부 정보

MiniMax-M3 API로 무엇을 구축할 수 있나요?

Coding Agents & Claude Code 워크플로우

리포지토리 Q&A, 코드 생성 및 리뷰를 처리하는 Coding copilots 및 에이전트를 구축하세요. MiniMax-M3는 네이티브 Anthropic Messages 엔드포인트를 제공하므로 Claude Code 스타일 CLI 및 에이전트 프레임워크에 바로 통합되며, 딥 씽킹은 하나의 API에서 다단계 추론을 처리합니다.

구축 시작

멀티모달 이해

이미지, 비디오 및 PDF 문서를 텍스트와 함께 MiniMax-M3에 직접 입력하세요. 별도의 비전 모델을 스택에 연결하지 않고도 시각적 Q&A, 스크린샷-투-코드, 차트 및 문서 이해, 비디오 요약에 사용하세요.

멀티모달 탐색

긴 컨텍스트 문서 처리

공격적인 청킹 없이 계약서, 보고서, 코드베이스 및 대규모 지식 베이스를 처리하세요. 약 1M 컨텍스트 창은 구조화된 요약, 추출 파이프라인 및 비교 작업에 적합하며, 프롬프트 캐싱은 반복되는 긴 접두사를 저렴하게 유지합니다.

문서 처리

팀이 MiniMax-M3 API를 선택하는 이유

팀은 공급업체별 통합을 구축하지 않고 긴 컨텍스트 멀티모달 추론, 듀얼 프로토콜 액세스 및 예측 가능한 토큰 가격이 필요할 때 EvoLink에서 MiniMax-M3를 선택합니다.

듀얼 엔드포인트 액세스

하나의 EvoLink 키로 OpenAI 호환 엔드포인트 또는 네이티브 Anthropic Messages 엔드포인트를 통해 MiniMax-M3를 호출하세요. 기존 OpenAI SDK 코드와 Claude Code 스타일 클라이언트 모두 통합 경로를 재구축하지 않고 작동합니다.

예측 가능한 프로덕션 비용

가시적인 토큰 가격으로 예산 편성이 쉬워집니다: 입력 $0.49/1M부터, 출력 $1.98/1M, 반복 프롬프트의 캐시 읽기 약 $0.10/1M. 512K를 초과하는 컨텍스트는 2배 긴 컨텍스트 등급으로 청구됩니다.

씽킹, 멀티모달 및 캐싱

큰 프롬프트에는 약 1M 컨텍스트를 사용하고, 복잡한 추론에는 딥 씽킹을 활성화하며, 이미지/비디오/PDF 입력을 직접 전달하고, 반복 컨텍스트의 비용을 줄이기 위해 프롬프트 캐싱에 의존하세요.

MiniMax-M3 vs MiniMax-M2.5: 어떤 모델을 써야 하나요?

이 표는 benchmark가 아니라 모델 선택을 위한 비교입니다. M2.5는 더 낮은 비용의 MiniMax fallback으로 유용하고, M3는 더 까다로운 agentic 및 multimodal workload에 적합한 선택입니다.

판단 기준	MiniMax-M2.5	MiniMax-M3
모델 역할	텍스트 중심 workload를 위한 저비용 MiniMax fallback	고급 agentic workload를 위한 기본 MiniMax 모델
적합한 용도	Repo Q&A, 문서 분석, 리서치, 비용 민감 텍스트 작업	Coding agents, Claude Code 스타일 CLI, multimodal reasoning, 전체 repo 분석
컨텍스트	204K context	약 1M context, 512K 초과 시 2x tier
입력 범위	Web search와 prompt caching을 갖춘 텍스트 중심 모델	텍스트 plus 이미지, 비디오, PDF 입력과 thinking/caching
Endpoint	OpenAI 호환 접속	OpenAI 호환 plus 네이티브 Anthropic Messages
비용 포지션	최대 성능보다 단가가 더 중요할 때 사용	더 강한 reasoning, 긴 context, multimodal input이 비용을 정당화할 때 사용

MiniMax-M2.5 보기 전체 비교 읽기 MiniMax-M3 계속 사용

MiniMax-M3 API 통합 방법

기존 OpenAI 또는 Anthropic 클라이언트를 유지하고 EvoLink를 가리키며 모델을 MiniMax-M3로 설정하고 Coding-agent, 멀티모달 및 긴 컨텍스트 워크플로우에 동일한 경로를 사용하세요.

1단계 — 인증

EvoLink API 키를 생성하고 EvoLink 기본 URL을 설정하세요. OpenAI 호환 엔드포인트에는 Bearer 인증을, Anthropic Messages 엔드포인트에는 x-api-key를 사용하세요.

2단계 — 필수 필드 설정

`messages` 배열과 함께 `model: MiniMax-M3`를 보내세요. 반복 워크로드에서 프롬프트 캐싱의 이점을 얻으려면 안정적인 시스템 프롬프트와 접두사를 재사용하세요.

3단계 — 출력 조정

평소처럼 temperature, top_p, max_tokens 및 stream을 조정하세요. 딥 추론을 위해 `thinking`을 활성화하고, 멀티모달 요청을 위해 이미지, 비디오 또는 PDF 콘텐츠 블록을 첨부하세요.

프로덕션 팀을 위한 MiniMax-M3 API 기능

일반적인 모델 개요 대신 구체적인 제어 및 배포 신호

Thinking

딥 씽킹 모드

수학, 논리 및 복잡한 다단계 분석에 씽킹을 활성화하세요. 추론은 별도의 필드 또는 콘텐츠 블록으로 노출되므로 제품에서 사고 과정을 표시하거나 숨길 수 있습니다.

컨텍스트

약 1M 컨텍스트 창

공격적인 청킹이나 다중 패스 오케스트레이션에 의존하기 전에 전체 코드베이스, 긴 문서 및 다중 턴 컨텍스트를 하나의 요청에 맞추세요.

멀티모달

멀티모달 입력

동일한 텍스트 API에서 시각적 Q&A, 문서 이해 및 비디오 요약을 위해 이미지, 비디오 및 PDF 입력을 텍스트와 함께 전달하세요.

호환성

OpenAI + Anthropic 호환

기본 URL과 모델 이름을 변경하여 /v1/chat/completions를 통한 OpenAI SDK 또는 /v1/messages를 통한 Anthropic SDK로 연결하세요 — 통합 재구축이 필요 없습니다.

캐싱

프롬프트 캐싱

반복되는 접두사와 시스템 프롬프트는 더 낮은 캐시 읽기 요율로 청구되어 반복적인 에이전트 워크플로우와 대량 프로덕션 트래픽에 도움이 됩니다.

가격

긴 컨텍스트 등급 가격

최대 512K 컨텍스트 요청은 기본 요율을 사용하며, 512K를 초과하면 토큰이 2배 긴 컨텍스트 등급으로 청구되어 프롬프트 크기에 따라 비용이 예측 가능하게 확장됩니다.

MiniMax-M3 API FAQ

Everything you need to know about the product and billing.

EvoLink의 MiniMax-M3 가격은 입력 토큰 1M당 약 $0.49, 출력 토큰 1M당 약 $1.98부터 시작합니다. 캐시 읽기는 1M 토큰당 약 $0.10부터 시작하며, 긴 시스템 프롬프트나 안정적인 접두사를 재사용할 때 유용합니다. 512K를 초과하는 컨텍스트 요청은 2배 긴 컨텍스트 등급으로 청구됩니다.

MiniMax-M3는 약 1M 컨텍스트, 딥 씽킹 및 프롬프트 캐싱의 이점을 얻는 Coding agents, Claude Code 스타일 CLI, 리포지토리 Q&A, 멀티모달 이해(이미지, 비디오, PDF), 연구 워크플로우 및 긴 문서 분석에 적합합니다.

MiniMax-M3는 약 1M 토큰의 컨텍스트 창을 지원합니다. 최대 512K 컨텍스트 요청은 기본 요율로 청구되며, 해당 임계값을 초과하는 토큰은 2배 긴 컨텍스트 등급으로 청구됩니다.

예. MiniMax-M3는 텍스트와 함께 이미지, 비디오 및 PDF 입력을 수락하고, 복잡한 추론을 위한 딥 씽킹 모드를 지원하며, 반복되는 접두사가 더 낮은 캐시 읽기 요율로 청구되도록 프롬프트 캐싱을 지원합니다.

예. EvoLink는 OpenAI 호환 엔드포인트(/v1/chat/completions)와 Anthropic Messages 엔드포인트(/v1/messages) 모두에서 MiniMax-M3를 제공합니다. 기본 URL을 변경하고 모델을 MiniMax-M3로 설정하여 OpenAI SDK 또는 Anthropic SDK를 사용하세요.

일반적으로 가능합니다. MiniMax-M3는 네이티브 Anthropic Messages 엔드포인트를 제공하므로 Claude Code 스타일 CLI 및 에이전트 프레임워크에 바로 적합하며, OpenAI 호환 엔드포인트는 편집기 도구와 내부 에이전트를 커버합니다. 인접한 설정 패턴은 3개 Coding CLI를 위한 하나의 게이트웨이 및 게이트웨이 vs 직접 API를 참조하세요.

요청 본문에서 모델 enum `MiniMax-M3`를 사용하세요. EvoLink가 최적의 공급자를 통해 MiniMax-M3 모델로 요청을 라우팅합니다.