
2026 年 Claude API 定价:Opus、Sonnet、Haiku 全系模型费用详解

最后更新:2026 年 4 月 9 日 · 官方供应商定价已对照 Anthropic 定价文档验证。EvoLink 渠道定价反映当前站内支持的渠道价格,可能与 Anthropic 直接计费有所不同。
要点速览
Claude API 定价取决于您选择的模型和定价范围。本指南区分:
- Anthropic 官方 API 定价
- 长上下文 / 缓存 / 批量处理定价规则
- 当前 EvoLink 渠道定价(如适用)
以下是当前官方每百万 Token(MTok)基础费率:
| 模型 | 输入 | 输出 | 最佳用途 |
|---|---|---|---|
| Claude Opus 4.6 | $5.00 | $25.00 | 旗舰推理、复杂编程、智能体 |
| Claude Opus 4.5 | $5.00 | $25.00 | 上一代旗舰,稳定版本 ID |
| Claude Opus 4.1 | $15.00 | $75.00 | 智能体编程、多文件重构 |
| Claude Sonnet 4.6 | $3.00 | $15.00 | 速度/成本/智能的最佳平衡 |
| Claude Sonnet 4.5 | $3.00 | $15.00 | 推荐默认模型,强编程能力 |
| Claude Sonnet 4.0 | $3.00 | $15.00 | 生产工作负载,1M 上下文 beta |
| Claude Haiku 4.5 | $1.00 | $5.00 | 最快、最便宜 — 高并发工作负载 |
如果您在比较供应商直接定价与网关定价,Anthropic 的官方费率是基准。EvoLink 可以为同一 Claude 系列提供更低的渠道定价,但这与 Anthropic 直接计费是不同的定价范围。
Claude Opus 4.6 定价
effort 参数进行质量/成本控制。| 组件 | 费率(每 MTok) |
|---|---|
| 输入 Token | $5.00 |
| 输出 Token | $25.00 |
| 缓存写入(5 分钟) | $6.25 |
| 缓存写入(1 小时) | $10.00 |
| 缓存读取 | $0.50(输入的 0.1 倍) |
| 批量输入 | $2.50(5 折) |
| 批量输出 | $12.50(5 折) |
claude-opus-4-6何时值得使用 Opus 4.6
- 复杂的多步编程任务(SWE-bench Verified 80.8%)
- 使用工具的智能体编排
- 需要 extended thinking 的研究综合
- 质量优先于速度的任务
Claude Opus 4.5 定价
| 组件 | 费率(每 MTok) |
|---|---|
| 输入 Token | $5.00 |
| 输出 Token | $25.00 |
| 缓存写入(5 分钟) | $6.25 |
| 缓存读取 | $0.50 |
claude-opus-4-5-20250514Claude Opus 4.1 定价
| 组件 | 费率(每 MTok) |
|---|---|
| 输入 Token | $15.00 |
| 输出 Token | $75.00 |
| 缓存写入(5 分钟) | $18.75 |
| 缓存读取 | $1.50 |
claude-opus-4-1-20250805Opus 4.1 还值得用吗?
Opus 4.1 每 Token 成本是 Opus 4.6 的 3 倍。仅在您的工作流特别需要其旧版路由特性或需要固定版本兼容性时才使用。对于大多数新工作负载,Opus 4.6 的 $5/$25 是更好的选择。
Claude Sonnet 4.6 定价
| 组件 | 费率(每 MTok) |
|---|---|
| 输入 Token | $3.00 |
| 输出 Token | $15.00 |
| 缓存写入(5 分钟) | $3.75 |
| 缓存读取 | $0.30 |
| 批量输入 | $1.50(5 折) |
| 批量输出 | $7.50(5 折) |
claude-sonnet-4-6Claude Sonnet 4.5 定价
| 组件 | 费率(每 MTok) |
|---|---|
| 输入 Token | $3.00 |
| 输出 Token | $15.00 |
| 缓存写入(5 分钟) | $3.75 |
| 缓存读取 | $0.30 |
claude-sonnet-4-5-20250929Claude Sonnet 4.0 定价
| 组件 | 费率(每 MTok) |
|---|---|
| 输入 Token | $3.00 |
| 输出 Token | $15.00 |
| 输入(>200K,1M beta) | $6.00 |
| 输出(>200K,1M beta) | $22.50 |
| 缓存写入(5 分钟) | $3.75 |
| 缓存读取 | $0.30 |
claude-sonnet-4-0-20250514Claude Haiku 4.5 定价
| 组件 | 费率(每 MTok) |
|---|---|
| 输入 Token | $1.00 |
| 输出 Token | $5.00 |
| 缓存写入(5 分钟) | $1.25 |
| 缓存读取 | $0.10 |
| 批量输入 | $0.50(5 折) |
| 批量输出 | $2.50(5 折) |
claude-haiku-4-5-20251001何时选择 Haiku 而非 Sonnet
- 每次请求成本敏感的免费层产品
- 并行化子智能体和高并发管线
- 延迟敏感的聊天和客服智能体
- Sonnet 4 级别质量已足够的任务(SWE-bench 73.3%)
成本对比:Claude vs GPT vs Gemini
Claude 定价与其他前沿模型的对比:
| 模型 | 输入/MTok | 输出/MTok | 上下文 | 最大输出 |
|---|---|---|---|---|
| Claude Opus 4.6 | $5.00 | $25.00 | 1M | 64K |
| Claude Sonnet 4.6 | $3.00 | $15.00 | 1M | 128K |
| Claude Haiku 4.5 | $1.00 | $5.00 | 200K | — |
| GPT-5.4 | $2.50 | $20.00 | 1M | 128K |
| GPT-5.2 | $1.75 | $14.00 | 400K | 128K |
| Gemini 3.1 Pro | $2.00 | $12.00 | 1M | 64K |
如何降低 Claude API 成本
1. 使用提示词缓存
如果您在多次请求中重复使用系统提示词或长上下文,缓存可以将输入成本降低高达 90%。缓存读取按基础输入费率的 0.1 倍计费。
2. 使用批量处理
Batch API 对输入和输出 Token 均提供 50% 折扣,适用于异步任务。非常适合夜间自动化、数据处理和非实时工作负载。
3. 选择合适的模型层级
Sonnet 能处理的任务不要用 Opus。Haiku 能处理的任务不要用 Sonnet。根据任务复杂度匹配模型能力。
4. 对比官方定价与 EvoLink 渠道定价
- Claude Opus 4.6: 低至 $4.50/MTok 输入(-10%)
- Claude Sonnet 4.6: 低至 $2.70/MTok 输入(-10%)
- Claude Haiku 4.5: 低至 $0.90/MTok 输入(-10%)
预算估算时使用 Anthropic 直接定价。如果您计划通过 EvoLink 的 OpenAI 兼容端点购买 Claude,则参考 EvoLink 渠道定价。
5. 监控并设置预算
使用 Anthropic 的用量面板或 EvoLink 的内置监控,按模型跟踪支出、设置告警、避免意外账单。
常见问题
Claude API 多少钱?
Claude API 定价因模型而异。Anthropic 官方 API 定价中,Haiku 4.5 起步价 $1/$5 每百万 Token,Sonnet 4.6 为 $3/$15,Opus 4.6 为 $5/$25。提示词缓存和批量处理可进一步降低实际成本。所有数据截至 2026 年 4 月 9 日。
最便宜的 Claude API 模型是哪个?
Claude Haiku 4.5,输入 $1 / 输出 $5 每百万 Token。它是当前成本最低的 Claude 模型,适用于高并发生产工作负载。
Claude API 免费吗?
生产使用没有永久免费的 Claude API 层级。Anthropic 的 API 定价按用量计费,试用或促销积分的可用性请查看 Anthropic 当前的计费页面。EvoLink 也在当前站内宣传为新账户提供免费试用积分。
Claude 与 GPT 定价对比如何?
Claude Sonnet 4.6($3/$15)在供应商直接定价上高于 GPT-5.2($1.75/$14)和 Gemini 3.1 Pro($2/$12),而 Claude Opus 4.6($5/$25)是 Claude 的高端层级。通过 EvoLink,渠道定价可以缩小差距,但这些价格应与 Anthropic 官方计费分开看待。
什么是提示词缓存?能节省多少?
提示词缓存让您在多次请求中复用常用上下文(系统提示词、文档)。缓存写入费用为基础输入费率的 1.25 倍,但缓存读取仅为 0.1 倍 — 重复输入 Token 最多节省 90%。这对使用长系统提示词的智能体和聊天机器人尤其有价值。
Claude 有批量处理折扣吗?
有。Anthropic 的 Batch API 对输入和输出 Token 均提供 50% 折扣。任务在 24 小时内异步处理。非常适合数据管线、内容生成和不需要实时响应的工作负载。
在哪里可以以最优价格使用 Claude API?
开始在 EvoLink 上使用 Claude API
准备将 Claude 集成到您的产品中?EvoLink 通过单一 OpenAI 兼容端点为您提供所有 Claude 模型的访问 — 享受渠道折扣定价、内置速率限制处理和用量监控。
- 浏览全部 Claude 模型 →
- 获取 API 密钥 → (evolink.ai)
- Claude Opus 4.6 → | Claude Sonnet 4.6 → | Claude Haiku 4.5 →


