Kimi K2 Thinking API
Moonshot AI reasoning model with 128K context, Chain of Thought capabilities, and native tool calling. Available in Standard and Turbo variants for different use cases.
Kimi K2 Pensamiento API para razonamiento a largo plazo
Ejecute el modelo K2 Thinking a través de EvoLink para analizar documentos masivos, organizar herramientas y producir resultados estructurados. Creado para una ventana contextual de 256 000 tokens, llamadas de herramientas nativas y flujos de trabajo confiables de varios pasos.

PRICING
| PLAN | CONTEXT WINDOW | MAX OUTPUT | INPUT | OUTPUT | CACHE READ |
|---|---|---|---|---|---|
| Kimi K2 Thinking | 262.1K | 262.1K | $0.556-7% $0.600Official Price | $2.222-11% $2.50Official Price | $0.139-7% $0.150Official Price |
Server-side web search capability
Pricing Note: Price unit: USD / 1M tokens
Cache Hit: Price applies to cached prompt tokens.
¿Qué puedes construir con Kimi K2 Thinking?
Investigación de contexto largo
Procese informes completos, bases de código o bases de conocimiento en una sola solicitud. La ventana de contexto de 256K hace que sea práctico razonar sobre entradas grandes sin fragmentación agresiva.

Agentes orquestados por herramientas
Diseñe agentes que llamen a las herramientas y mantengan el rumbo. K2 Thinking acepta definiciones de herramientas y devuelve JSON llamadas de herramientas, lo que admite planes largos de varios pasos.

Base de código y flujos de trabajo de datos
Utilice el modelo para refactorizaciones, depuración y análisis de datos en grandes repositorios o conjuntos de datos con un razonamiento coherente paso a paso.

Por qué los desarrolladores eligen Kimi K2 Thinking API
Obtenga flexibilidad de código abierto, contexto de 256 KB y uso de herramientas nativas para flujos de trabajo de agentes sólidos y a largo plazo.
Ventana de contexto de 256K
Razone a través de documentos extensos e historiales de varios turnos con una ventana completa de 256 000 tokens para tareas complejas.
Llamadas de herramientas nativas
Acepta definiciones de herramientas y produce llamadas de herramientas JSON, lo que permite una orquestación confiable y resultados estructurados.
Eficiencia de código abierto + MoE
Pesas abiertas con una licencia MIT modificada y un diseño MoE de parámetro 1T (32B activo) para un razonamiento con escala eficiente.
Cómo integrar Kimi K2 Pensamiento API
Tres pasos para agregar razonamiento a largo plazo y uso de herramientas a su aplicación.
Paso 1: proporcione contexto
Envíe entradas largas o contexto aumentado por RAG hasta 256 000 tokens para darle al modelo una visibilidad completa de las tareas.
Paso 2: definir herramientas
Adjunte esquemas de funciones para que el modelo pueda llamar a herramientas de búsqueda, código o negocios utilizando JSON estructurado.
Paso 3: ejecutar y verificar
Ejecute razonamientos de varios pasos, transmita resultados y valide llamadas a herramientas o seguimientos de razonamiento antes de actuar sobre los resultados.
Kimi K2 Capacidades de pensamiento
Diseñado para el razonamiento agente en contextos extensos
Contexto del token de 256K
Maneje documentos extensos, chats y bases de código en una sola solicitud.
MoE 1T/32B activo
La arquitectura de combinación de expertos equilibra la escala con la eficiencia.
Definiciones de herramientas + llamadas JSON
Admite llamadas estructuradas a herramientas y salidas JSON para automatización.
Rastros de razonamiento
Admite seguimientos separados de Reasoning_Content cuando lo habilita el proveedor.
Cuantización nativa INT4
Optimizado para una inferencia eficiente con entrenamiento consciente de la cuantificación.
Licencia de código abierto
Licencia MIT modificada con uso comercial permitido (revisar términos).
Kimi K2 Thinking vs. Otros modelos de razonamiento
Compare ventanas de contexto, estilos de razonamiento y compatibilidad con herramientas en las principales API de razonamiento
| Model | Best for | Context window | Reasoning style | Tooling & streaming |
|---|---|---|---|---|
| Kimi K2 Thinking | Agentes de largo horizonte, orquestación de herramientas | 256K tokens | Paso a paso con llamadas a herramientas | Llamadas de herramientas nativas, salidas JSON, streaming |
| OpenAI o1 | Razonamiento complejo, matemáticas, codificación | 200K tokens | Cadena de pensamiento interna | Soporte de herramientas limitado, sin streaming |
| Claude 3.5 Sonnet | Tareas generales, codificación, análisis | 200K tokens | Respuesta directa con razonamiento | Uso completo de herramientas, streaming soportado |
| DeepSeek R1 | Matemáticas, codificación, despliegue de código abierto | 128K tokens | Trazas de razonamiento explícitas | Soporte básico de herramientas, streaming |
Preguntas frecuentes sobre el pensamiento Kimi K2
Everything you need to know about the product and billing.