
如何使用 Claude Fable 5 API:EvoLink 接入教程

model: "claude-fable-5" 的请求,确认路由可用,然后再决定 Fable 5 应该在你的模型路由策略里承担什么角色。准备工作

| 准备项 | 为什么重要 |
|---|---|
| EvoLink 账户 | 用于创建 API key |
| 服务端保存 API key | 避免密钥暴露在浏览器或前端包里 |
| 模型 ID | Fable 5 使用 claude-fable-5 |
| 真实测试 prompt | 应该选择 Fable 5 真正有价值的困难任务 |
| 成本日志 | Fable 5 是高级路由,需要记录 tokens、重试和 fallback |
第 1 步:创建 EvoLink API Key
在 EvoLink 控制台创建 API key,并把它保存在服务端环境变量里:
export EVOLINK_API_KEY="your_api_key_here"不要把 API key 写进客户端代码、公开仓库、浏览器可见环境变量或前端日志里。
第 2 步:发送最小请求
先用最小的 Claude Messages API 请求证明路由能跑通,不要一开始就接入完整 Agent 或复杂工具链。
curl https://direct.evolink.ai/v1/messages \
-H "Authorization: Bearer $EVOLINK_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-fable-5",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": "分析这个架构决策:billing、usage logs 和 model routing 应该拆成独立服务吗?"
}
]
}'如果请求成功,记录 model、latency、input tokens、output tokens,以及答案是否真的可用。第一次调用只能证明路由可用,不能证明 Fable 5 应该成为默认模型。
第 3 步:使用真实测试 Prompt
hello world 不是有效评估。你应该选择一个真实业务里愿意为高级模型付费的任务。| 测试 prompt 类型 | 更适合 Fable 5 的评估方式 |
|---|---|
| 代码库架构 | “基于这些模块和约束,给出迁移计划和风险顺序。” |
| Coding agent 轨迹 | “审查这次失败的 agent run,并指出下一步最安全动作。” |
| 长上下文分析 | “综合这份 spec、日志片段和事故时间线,输出根因分析计划。” |
| 高风险决策 | “比较三个实现路径,并指出每个路径最可能失败的位置。” |
第 4 步:添加路由规则
不要把所有 Claude 流量都路由到 Fable 5。更合理的做法是使用升级策略。
| 请求类型 | 建议路由 |
|---|---|
| 简单抽取、分类、短文改写 | Haiku 或其他低成本路线 |
| 日常 coding 和生产 assistant 工作 | 根据质量要求选择 Sonnet 或 Opus |
| 复杂 coding、长 agent loop、高价值推理 | Opus 4.8 作为强默认 |
| 失败成本很高的前沿难度任务 | Fable 5 |
第 5 步:谨慎处理高级参数
Anthropic 文档中说明了 Fable 5 的 adaptive thinking 行为、thinking 输出方式和 fallback 相关行为。EvoLink 用户在生产中依赖高级参数前,应该先确认当前路由是否支持。
| 参数或能力 | 安全上线建议 |
|---|---|
model | 使用 claude-fable-5 |
max_tokens | Claude Messages API 必填;先设置明确输出上限 |
messages | 从标准 Claude Messages API 用户消息开始 |
system | 需要系统提示时使用顶层 system 字段 |
thinking | 生产依赖前先验证是否支持 |
| Tool use | 以当前 EvoLink 文档和账户支持为准 |
| Vision input | 以当前 EvoLink 文档和账户支持为准 |
| Streaming | 以当前 EvoLink 文档和账户支持为准 |
| Prompt caching | 在路由支持且重复上下文稳定时使用 |
第 6 步:衡量每个完成任务的成本
官方 token 价格很重要,但生产成本来自整个工作流。
| 成本因素 | 应该衡量什么 |
|---|---|
| Input tokens | 是否发送了过多上下文 |
| Output tokens | 回答是否超过实际需要 |
| Retries | Fable 是否比 Opus 减少失败尝试 |
| Cache usage | 稳定指令和重复上下文是否被缓存 |
| Fallbacks | 失败、拒答或降级是否能在日志中看到 |
正确的问题不是“Fable 每个 token 更贵”。正确的问题是:“Fable 每个被接受任务的成本是多少,它减少了多少重试、审查或修复工作?”
第 7 步:建立生产检查清单
在承接真实用户流量前,至少检查这些项目:
| 检查项 | 通过条件 |
|---|---|
| 路由可用性 | 当前 EvoLink 账户可以调用 claude-fable-5 |
| 价格可见性 | 用量日志和价格符合预期 |
| Prompt replay | 代表性困难 prompt 产生更好结果 |
| Safeguard 测试 | 敏感工作流行为可预测 |
| Fallback route | Opus 4.8 或 Sonnet 仍可用 |
| 预算护栏 | 应用限制上下文、输出、重试和升级路由 |
| 可观测性 | 日志包含 model、latency、tokens 和失败原因 |
它在 Claude 家族中的位置
资料来源
- EvoLink Claude Messages API documentation
- Anthropic models overview
- Anthropic pricing
- Anthropic Fable 5 and Mythos 5 launch docs
FAQ
Claude Fable 5 的模型 ID 是什么?
claude-fable-5。应该调用哪个 endpoint?
https://direct.evolink.ai/v1/messages。如果你的账户有特定 endpoint 要求,请以当前 EvoLink Claude Messages API 文档为准。应该把所有请求都改成 Claude Fable 5 吗?
不应该。Fable 5 只适合那些更强推理能力可能抵消高级成本的困难请求。
如何判断 Fable 5 是否值得?
重放真实 prompt,并对比 Opus 4.8 的 accepted output rate、重试次数、延迟、token 用量和人工修复成本。
可以使用 prompt caching 吗?
当当前 EvoLink 路由支持 prompt caching,且你的重复上下文足够稳定时,可以使用。对长上下文高级路由来说,缓存尤其重要。
Claude Fable 5 支持 1M 上下文吗?
支持。Anthropic 文档为 Claude Fable 5 标注了 1M token context window。
如果请求被 safeguard 阻断或改走 fallback,应该怎么办?
记录 prompt category、response、model route 和用户可见结果。敏感工作流必须保留 fallback 处理和清晰的产品提示。


