Kimi K2 Thinking API
Moonshot AI reasoning model with 128K context, Chain of Thought capabilities, and native tool calling. Available in Standard and Turbo variants for different use cases.
API Kimi K2 Thinking pour le raisonnement long‑horizon
Exécutez K2 Thinking via EvoLink pour analyser de gros documents, orchestrer des outils et produire des sorties structurées. Conçu pour 256K tokens de contexte, tool calling natif et workflows multi‑étapes fiables.

PRICING
| PLAN | CONTEXT WINDOW | MAX OUTPUT | INPUT | OUTPUT | CACHE READ |
|---|---|---|---|---|---|
| Kimi K2 Thinking | 262.1K | 262.1K | $0.556-7% $0.600Official Price | $2.222-11% $2.50Official Price | $0.139-7% $0.150Official Price |
Server-side web search capability
Pricing Note: Price unit: USD / 1M tokens
Cache Hit: Price applies to cached prompt tokens.
Que pouvez‑vous construire avec Kimi K2 Thinking ?
Recherche long‑contexte
Traitez des rapports complets, des codebases ou des bases de connaissances en une seule requête. La fenêtre 256K rend le raisonnement sur de gros inputs pratique sans chunking agressif.

Agents orchestrés par outils
Concevez des agents qui appellent des outils et restent sur la bonne trajectoire. K2 Thinking accepte des définitions d’outils et renvoie des tool calls JSON, adaptés aux plans longs multi‑étapes.

Workflows codebase & data
Utilisez le modèle pour des refactors, du debug et de l’analyse de données sur de grands dépôts ou datasets avec un raisonnement cohérent, étape par étape.

Pourquoi les développeurs choisissent l’API Kimi K2 Thinking
Flexibilité open‑source, 256K de contexte et usage natif d’outils pour des agents long‑horizon robustes.
Fenêtre de contexte 256K
Raisonnement sur des documents longs et des historiques multi‑tours avec un contexte 256K complet.
Tool calling natif
Accepte les définitions d’outils et produit des tool calls JSON pour une orchestration fiable et des sorties structurées.
Open‑source + efficacité MoE
Poids open source sous licence MIT modifiée et architecture MoE 1T (32B actifs) pour un raisonnement efficace à grande échelle.
Comment intégrer l’API Kimi K2 Thinking
Trois étapes pour ajouter le raisonnement long‑horizon et l’usage d’outils à votre app.
Étape 1 — Fournir le contexte
Envoyez de longs inputs ou un contexte RAG augmenté jusqu’à 256K tokens pour donner une visibilité complète à la tâche.
Étape 2 — Définir les outils
Joignez des schémas de fonctions pour que le modèle appelle des outils de recherche, de code ou métier via JSON structuré.
Étape 3 — Exécuter et vérifier
Exécutez le raisonnement multi‑étapes, streamez les résultats et validez les tool calls ou traces de raisonnement avant d’agir.
Capacités de Kimi K2 Thinking
Conçu pour le raisonnement agentique en long contexte
Contexte 256K tokens
Traitez des documents longs, des chats et des codebases en une seule requête.
MoE 1T / 32B actifs
L’architecture Mixture‑of‑Experts équilibre échelle et efficacité.
Définitions d’outils + appels JSON
Support du tool calling structuré et des sorties JSON pour l’automatisation.
Traces de raisonnement
Support des traces reasoning_content séparées lorsque le provider l’active.
Quantification INT4 native
Optimisé pour l’inférence efficace via Quantization‑Aware Training.
Licence open‑source
Licence MIT modifiée avec usage commercial autorisé (vérifier les termes).
Kimi K2 Thinking vs. autres modèles de raisonnement
Comparez les fenêtres de contexte, styles de raisonnement et support d'outils des principales APIs
| Model | Best for | Context window | Reasoning style | Tooling & streaming |
|---|---|---|---|---|
| Kimi K2 Thinking | Agents long-horizon, orchestration d'outils | 256K tokens | Étape par étape avec appels d'outils | Appels d'outils natifs, sorties JSON, streaming |
| OpenAI o1 | Raisonnement complexe, maths, code | 200K tokens | Chaîne de pensée interne | Support d'outils limité, pas de streaming |
| Claude 3.5 Sonnet | Tâches générales, code, analyse | 200K tokens | Réponse directe avec raisonnement | Outils complets, streaming supporté |
| DeepSeek R1 | Maths, code, déploiement open-source | 128K tokens | Traces de raisonnement explicites | Support d'outils basique, streaming |
FAQ Kimi K2 Thinking
Everything you need to know about the product and billing.