API Claude Fable 5
$9.000(~ 612 credits) par 1M tokens d'entrée; $45.000(~ 3060 credits) par 1M tokens de sortie
$11.250(~ 765 credits) par 1M tokens d'écriture de cache; $0.900(~ 61.2 credits) par 1M tokens de lecture de cache
L'outil de recherche web est facturé séparément par requête.
Stabilité maximale avec une disponibilité garantie de 99,9 %. Recommandé pour la production.
Le même endpoint API est utilisé pour toutes les versions. Seul le paramètre model change.
API Claude Fable 5 — le modèle le plus intelligent d'Anthropic
Routez le modèle le plus puissant d'Anthropic via EvoLink pour le coding, les agents à long horizon et le long contexte les plus difficiles — là où un raisonnement plus fort vaut un surcoût face à Opus.

Claude Fable 5 est-il la bonne route pour vos tâches les plus difficiles ?
À privilégier pour le travail inter-fichiers et d'architecture le plus dur
Quand une tâche exige la meilleure planification disponible — raisonner sur une grande base de code, repenser l'architecture, démêler un refactoring difficile ou produire un plan de migration à fort enjeu — Fable 5 est la route de pointe située au-dessus d'Opus 4.8.

Pour les agents à long horizon où l'échec coûte le plus cher
Quand un agent enchaîne de longues boucles d'outils, porte un état lourd sur de nombreuses étapes et qu'une erreur est coûteuse à corriger, Fable 5 sert de route d'escalade ultime — pas de valeur par défaut pour chaque requête d'agent.

Pour l'analyse au plus grand contexte et au plus fort enjeu
Quand un seul chemin de raisonnement doit absorber de grands dépôts, de longues specs, des logs et des dossiers de recherche et que la conclusion compte vraiment, Fable 5 convient le mieux au travail riche en contexte avec la synthèse la plus forte disponible.

Quand router vers Claude Fable 5, et quand Opus 4.8 suffit-il ?
Cette page produit n'est pas un comparatif. Elle aide les équipes à décider quelles requêtes justifient le palier supérieur — Fable 5 coûte environ le double d'Opus 4.8 — et lesquelles devraient rester sur Opus 4.8 ou un modèle Claude plus léger.
Garder Opus 4.8 comme défaut solide
Opus 4.8 gère déjà bien l'essentiel du coding, des agents et du long contexte à forte valeur. Traitez Fable 5 comme une escalade délibérée pour les requêtes les plus dures, pas comme une montée en gamme globale de tout le trafic Claude.
N'envoyer que les requêtes de difficulté de pointe à Fable 5
Réservez Fable 5 aux tâches où Opus 4.8 laisse de la qualité de côté — le travail de base de code le plus complexe, les exécutions d'agents les plus longues et les décisions à long contexte les plus risquées où un raisonnement plus fort se rentabilise.
Fable 5 coûte environ 2x Opus 4.8 — router délibérément
Comme Fable 5 se situe à un niveau de prix plus élevé, la question de routage est de savoir si le raisonnement supplémentaire vaut le surcoût pour chaque requête. Gardez le trafic courant et plus léger sur Opus, Sonnet ou Haiku là où ils conviennent.
Claude Fable 5 et Opus 4.8 : quelles différences ?
Ce tableau sert à décider le routage, pas à remplacer un benchmark complet. Gardez Opus 4.8 comme défaut solide et n’escaladez vers Fable 5 que vos requêtes les plus dures et à plus forte valeur — il coûte environ le double.
| Point de décision | Garder Opus 4.8 quand... | Escalader vers Fable 5 quand... |
|---|---|---|
| Workload existant | Opus 4.8 atteint déjà la qualité de production sur cette route. | La tâche est à la limite de ce qu’Opus 4.8 fait de façon fiable. |
| Claude Code | Les changements sont cadrés et Opus 4.8 les réalise proprement. | La tâche couvre tout le dépôt, une architecture dure ou des migrations risquées. |
| Workflow agent | La boucle d’agent est stable et récupérable sur Opus 4.8. | L’exécution est longue, à fort état, et l’échec est coûteux à annuler. |
| Long contexte | Les prompts à long contexte actuels fonctionnent bien sur Opus 4.8. | La décision dépend des plus grands dépôts, specs et packs de recherche. |
| Coût vs qualité | Vous voulez le meilleur rapport qualité-prix sur du trafic premium à volume. | Le raisonnement supplémentaire vaut environ le double du prix sur cette requête. |
Comment appeler l'API Claude Fable 5 via EvoLink ?
Créez votre clé EvoLink, utilisez `claude-fable-5` comme ID de modèle et routez délibérément avec le cache, le paramètre effort et une sélection de modèle claire.
Étape 1 - Créer une clé API unifiée
Inscrivez-vous sur EvoLink et gérez l'accès aux modèles Claude avec une seule clé API au lieu de maintenir une logique d'intégration distincte pour chaque fournisseur.
Étape 2 - Utiliser claude-fable-5
Définissez le paramètre de modèle sur `claude-fable-5` pour que cette requête entre explicitement dans la route Fable 5 au lieu de se mêler au trafic Claude générique.
Étape 3 - Choisir une stratégie de routage par workflow
Décidez quand une requête a vraiment besoin de Fable 5 et quand revenir vers Opus 4.8, Sonnet ou Haiku selon la difficulté, la taille du contexte, la latence et le coût.
Comment 1M de contexte, 128K de sortie et le cache fonctionnent-ils ensemble sur Fable 5 ?
La vraie question de production n'est pas un seul paramètre. C'est comment le long contexte, la capacité de sortie, la profondeur de raisonnement et le coût des requêtes répétées façonnent votre politique de routage au palier supérieur.
Utiliser 1M de contexte pour les longues tâches à forte valeur
Vous pouvez traiter de grands documents, des dossiers de recherche ou des bases de code en une requête, mais long contexte ne veut pas dire que chaque requête doit porter le contexte maximal.
Utiliser 128K de sortie pour des plans complets et du long code
Une sortie plus longue aide pour le code, les plans, les rapports et les livrables structurés, mais les prompts de production devraient quand même fixer des limites de sortie claires pour éviter le gaspillage.
Contrôler la profondeur avec adaptive thinking et effort
Fable 5 utilise l'adaptive thinking et décide combien raisonner par requête. Utilisez le paramètre `effort` pour arbitrer entre rigueur et consommation de tokens, au lieu d'un budget de réflexion fixe. Vérifiez les niveaux d'effort supportés dans la documentation API actuelle.
Entrée vision pour captures d'écran et revue de documents
Combinez entrées texte et image pour l'analyse de captures, la revue de documents, l'inspection d'UI et les workflows de débogage multimodaux.
Cache de prompt pour le contexte récurrent
Utilisez les écritures et lectures de cache pour les prompts stables et les longues entrées récurrentes au lieu d'envoyer le même contexte comme une nouvelle requête à chaque fois — cela compte d'autant plus au palier de prix le plus élevé.
Garder le routage explicite pour une future migration
Gardez `claude-fable-5` explicite pour que les équipes puissent comparer les routes Fable, Opus, Sonnet et Haiku en qualité, latence et coût.
Changer de route Claude dans la même API
EvoLink vous donne accès aux modèles Claude via une seule API. Utilisez Fable 5 pour les chemins de difficulté de pointe, gardez Opus 4.8 comme défaut solide, et routez les requêtes courantes à haute fréquence vers Sonnet ou Haiku quand elles conviennent mieux. Tous les modèles partagent le même point de terminaison de l'API EvoLink, vous pouvez donc changer de modèle avec un seul paramètre.
FAQ sur l'accès à l'API Claude Fable 5
Everything you need to know about the product and billing.