Claude Fable 5 API
$9.000(~ 612 credits) 每 100 万输入 tokens; $45.000(~ 3060 credits) 每 100 万输出 tokens
$11.250(~ 765 credits) 每 100 万缓存写入 tokens; $0.900(~ 61.2 credits) 每 100 万缓存读取 tokens
网页搜索工具按次单独计费。
稳定性最高,保证 99.9% 可用性。推荐用于生产环境。
所有版本使用同一个 API 端点,仅 model 参数不同。
Claude Fable 5 API:Anthropic 最智能的模型
当最难的编程、长周期 Agent 和长上下文任务需要现有最强的推理、且值得在 Opus 之上付出溢价时,可通过 EvoLink 统一 API 调用 Anthropic 最强模型。

Claude Fable 5 适合你最难的任务吗?
用在最难的跨文件和架构工作上
当任务需要现有最强的规划能力——在大型代码库上推理、重新设计架构、理顺困难的重构、或生成高风险的迁移方案时,Fable 5 是位于 Opus 4.8 之上的前沿路由。

用在失败成本最高的长周期 Agent 上
当 Agent 需要跑长工具循环、跨多步保持大量状态,而一旦走错恢复成本很高时,Fable 5 适合作为最高级别的升级路由,而不是所有 Agent 请求的默认选择。


什么时候应该路由到 Claude Fable 5,什么时候 Opus 4.8 就够了?
产品页的重点不是评测谁更强,而是帮助团队判断哪些请求值得动用顶级档位——Fable 5 的价格大约是 Opus 4.8 的两倍——哪些请求应该继续走 Opus 4.8 或更轻的 Claude 模型。
把 Opus 4.8 留作强力默认
Opus 4.8 已经能很好地处理大多数高价值的编程、Agent 和长上下文任务。把 Fable 5 当作针对最难请求的有意升级,而不是把全部 Claude 流量一次性升级上去。
只把前沿难度的请求送给 Fable 5
把 Fable 5 留给那些 Opus 4.8 仍有质量空间的任务——最复杂的代码库工作、最长的 Agent 运行、以及更强推理能回本的高风险长上下文决策。
Fable 5 价格约为 Opus 4.8 两倍——要有意路由
由于 Fable 5 处在更高的价位,路由问题在于每条请求的额外推理是否值这个溢价。把日常和较轻的流量留给 Opus、Sonnet 或 Haiku 等更合适的模型。
Claude Fable 5 和 Opus 4.8 有什么差异?
这里不是完整评测表,而是路由决策表。把 Opus 4.8 作为强力默认,只把最难、价值最高的请求升级到 Fable 5——它的价格大约是两倍。
| 判断点 | 继续使用 Opus 4.8 的情况 | 升级到 Fable 5 的情况 |
|---|---|---|
| 现有工作负载 | Opus 4.8 在这条路由上已满足生产质量。 | 任务已逼近 Opus 4.8 能稳定处理的边界。 |
| Claude Code | 改动范围清晰,Opus 4.8 已能干净完成。 | 任务跨整个仓库、涉及困难架构或高风险迁移。 |
| Agent 工作流 | Agent 循环在 Opus 4.8 上稳定且可恢复。 | 运行很长、状态很重,且失败难以撤销、成本很高。 |
| 长上下文 | 现有长上下文提示词在 Opus 4.8 上稳定可靠。 | 决策依赖最大型的仓库、规格和研究资料包。 |
| 成本与质量 | 你希望在高频高价值流量上获得最佳性价比。 | 在这条请求上额外推理值大约两倍的价格。 |
如何通过 EvoLink 调用 Claude Fable 5 API?
创建 EvoLink Key,使用 `claude-fable-5` 作为模型 ID,再结合缓存、effort 参数和清晰的模型选择策略进行有意路由。
第 1 步 - 创建统一 API Key
注册 EvoLink 后获取一个统一 API Key,用同一套接入方式管理 Claude 模型,而不是为每个提供商单独维护接入逻辑。
第 2 步 - 使用 claude-fable-5
将 model 参数设置为 `claude-fable-5`,让这条请求明确进入 Fable 5 路由,而不是混在通用 Claude 流量里。
第 3 步 - 按工作流选择路由策略
根据任务难度、上下文长度、延迟和成本,判断什么时候请求真的需要 Fable 5,什么时候切回 Opus 4.8、Sonnet 或 Haiku。
在 Fable 5 上,1M 上下文、128K 输出和缓存该怎么配合?
用户真正关心的不是单个参数,而是长上下文、输出容量、推理深度和重复请求成本,如何在顶级档位上共同影响你的路由策略。
1M 上下文适合高价值长任务
可以在单次请求中处理大型文档、研究资料包或大仓库内容,但长上下文不等于所有请求都应该塞满上下文。
128K 输出适合完整计划和长代码
更适合生成长代码、详细计划、完整报告和结构化输出,但生产环境仍应控制输出边界,避免无意义的长回复。
用自适应思考和 effort 控制深度
Fable 5 采用自适应思考,会自行决定每条请求的推理量。用 `effort` 参数在回答深度与 Token 消耗之间做权衡,而不是设置固定的思考预算。具体支持的 effort 级别请查阅当前 API 文档。
视觉输入适合截图和文档审阅
支持文本与图像输入,可用于截图分析、文档理解、UI 审查和多模态调试场景。
面向重复上下文的提示词缓存
对稳定系统提示词和反复出现的长上下文使用缓存写入和缓存命中,避免每次都把相同上下文当作全新请求发送——在最高价位上这一点尤其重要。
显式路由方便后续迁移
保持 `claude-fable-5` 路由显式,方便团队对比 Fable、Opus、Sonnet 和 Haiku 的质量、延迟和成本表现。
在同一个 API 中切换 Claude 路由
EvoLink 提供对 Claude 系列模型的统一 API 访问。Fable 5 负责前沿难度路径,Opus 4.8 作为强力默认,Sonnet 和 Haiku 承接更日常、更高频的请求。 所有模型共享同一 EvoLink API 端点,只需切换一个参数即可切换模型。
规划你的 Claude Fable 5 接入
以下指南分别覆盖 API 接入、使用教程和模型对比,让本产品页专注于接入方式、模型 ID 和定价。
Claude Fable 5 API 接入常见问题
Everything you need to know about the product and billing.