Seedance 2.0 API 现已上线立即开始
2026 年 Claude API 定价:Opus、Sonnet、Haiku 全系模型费用详解
guide

2026 年 Claude API 定价:Opus、Sonnet、Haiku 全系模型费用详解

EvoLink Team
EvoLink Team
Product Team
2026年4月9日
12 分钟阅读

最后更新:2026 年 4 月 9 日 · 官方供应商定价已对照 Anthropic 定价文档验证。EvoLink 渠道定价反映当前站内支持的渠道价格,可能与 Anthropic 直接计费有所不同。

要点速览

Claude API 定价取决于您选择的模型和定价范围。本指南区分:

  • Anthropic 官方 API 定价
  • 长上下文 / 缓存 / 批量处理定价规则
  • 当前 EvoLink 渠道定价(如适用)

以下是当前官方每百万 Token(MTok)基础费率:

模型输入输出最佳用途
Claude Opus 4.6$5.00$25.00旗舰推理、复杂编程、智能体
Claude Opus 4.5$5.00$25.00上一代旗舰,稳定版本 ID
Claude Opus 4.1$15.00$75.00智能体编程、多文件重构
Claude Sonnet 4.6$3.00$15.00速度/成本/智能的最佳平衡
Claude Sonnet 4.5$3.00$15.00推荐默认模型,强编程能力
Claude Sonnet 4.0$3.00$15.00生产工作负载,1M 上下文 beta
Claude Haiku 4.5$1.00$5.00最快、最便宜 — 高并发工作负载

如果您在比较供应商直接定价与网关定价,Anthropic 的官方费率是基准。EvoLink 可以为同一 Claude 系列提供更低的渠道定价,但这与 Anthropic 直接计费是不同的定价范围。


Claude Opus 4.6 定价

Claude Opus 4.6 是 Anthropic 最新的旗舰模型 — 最智能的 Claude,支持混合推理、extended thinking 和 effort 参数进行质量/成本控制。
组件费率(每 MTok)
输入 Token$5.00
输出 Token$25.00
缓存写入(5 分钟)$6.25
缓存写入(1 小时)$10.00
缓存读取$0.50(输入的 0.1 倍)
批量输入$2.50(5 折)
批量输出$12.50(5 折)
上下文窗口: 200K Token(1M beta 仅限 tier 4 / 自定义限制) 最大输出: 64K Token 模型 ID: claude-opus-4-6

何时值得使用 Opus 4.6

  • 复杂的多步编程任务(SWE-bench Verified 80.8%)
  • 使用工具的智能体编排
  • 需要 extended thinking 的研究综合
  • 质量优先于速度的任务

Claude Opus 4.5 定价

Claude Opus 4.5 与 Opus 4.6 定价相同,是上一代旗舰的稳定版本,使用固定版本 ID。
组件费率(每 MTok)
输入 Token$5.00
输出 Token$25.00
缓存写入(5 分钟)$6.25
缓存读取$0.50
模型 ID: claude-opus-4-5-20250514

Claude Opus 4.1 定价

Claude Opus 4.1 定价高于 Opus 4.5/4.6,但在多文件重构方面表现出色,SWE-bench 达到 74.5%。
组件费率(每 MTok)
输入 Token$15.00
输出 Token$75.00
缓存写入(5 分钟)$18.75
缓存读取$1.50
模型 ID: claude-opus-4-1-20250805

Opus 4.1 还值得用吗?

Opus 4.1 每 Token 成本是 Opus 4.6 的 3 倍。仅在您的工作流特别需要其旧版路由特性或需要固定版本兼容性时才使用。对于大多数新工作负载,Opus 4.6 的 $5/$25 是更好的选择。


Claude Sonnet 4.6 定价

Claude Sonnet 4.6 是速度、智能和成本的最佳平衡 — 128K 最大输出(Opus 的两倍)并支持 extended thinking。
组件费率(每 MTok)
输入 Token$3.00
输出 Token$15.00
缓存写入(5 分钟)$3.75
缓存读取$0.30
批量输入$1.50(5 折)
批量输出$7.50(5 折)
上下文窗口: 200K Token 最大输出: 128K Token 模型 ID: claude-sonnet-4-6

Claude Sonnet 4.5 定价

Claude Sonnet 4.5 是 Anthropic 推荐的默认模型 — 迄今最佳编程模型,具有强大的智能体能力。
组件费率(每 MTok)
输入 Token$3.00
输出 Token$15.00
缓存写入(5 分钟)$3.75
缓存读取$0.30
上下文窗口: 200K Token,超过 200K 的长上下文定价另行计算 模型 ID: claude-sonnet-4-5-20250929

Claude Sonnet 4.0 定价

Claude Sonnet 4.0 共享 Sonnet 层级定价,超过 200K Token 仍使用独立的长上下文定价。
组件费率(每 MTok)
输入 Token$3.00
输出 Token$15.00
输入(>200K,1M beta)$6.00
输出(>200K,1M beta)$22.50
缓存写入(5 分钟)$3.75
缓存读取$0.30
模型 ID: claude-sonnet-4-0-20250514

Claude Haiku 4.5 定价

Claude Haiku 4.5 是最快、最便宜的 Claude 4 模型 — 编程能力匹配 Sonnet 4,成本仅为其几分之一。
组件费率(每 MTok)
输入 Token$1.00
输出 Token$5.00
缓存写入(5 分钟)$1.25
缓存读取$0.10
批量输入$0.50(5 折)
批量输出$2.50(5 折)
上下文窗口: 200K Token 模型 ID: claude-haiku-4-5-20251001

何时选择 Haiku 而非 Sonnet

  • 每次请求成本敏感的免费层产品
  • 并行化子智能体和高并发管线
  • 延迟敏感的聊天和客服智能体
  • Sonnet 4 级别质量已足够的任务(SWE-bench 73.3%)

成本对比:Claude vs GPT vs Gemini

Claude 定价与其他前沿模型的对比:

模型输入/MTok输出/MTok上下文最大输出
Claude Opus 4.6$5.00$25.001M64K
Claude Sonnet 4.6$3.00$15.001M128K
Claude Haiku 4.5$1.00$5.00200K
GPT-5.4$2.50$20.001M128K
GPT-5.2$1.75$14.00400K128K
Gemini 3.1 Pro$2.00$12.001M64K
详细的模型对比,请参阅 GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 Pro

如何降低 Claude API 成本

1. 使用提示词缓存

如果您在多次请求中重复使用系统提示词或长上下文,缓存可以将输入成本降低高达 90%。缓存读取按基础输入费率的 0.1 倍计费。

2. 使用批量处理

Batch API 对输入和输出 Token 均提供 50% 折扣,适用于异步任务。非常适合夜间自动化、数据处理和非实时工作负载。

3. 选择合适的模型层级

Sonnet 能处理的任务不要用 Opus。Haiku 能处理的任务不要用 Sonnet。根据任务复杂度匹配模型能力。

EvoLink 目前部分层级的 Claude 渠道定价低于 Anthropic 直接费率。这是渠道定价,与 Anthropic 官方定价页面是不同的范围:
  • Claude Opus 4.6: 低至 $4.50/MTok 输入(-10%)
  • Claude Sonnet 4.6: 低至 $2.70/MTok 输入(-10%)
  • Claude Haiku 4.5: 低至 $0.90/MTok 输入(-10%)

预算估算时使用 Anthropic 直接定价。如果您计划通过 EvoLink 的 OpenAI 兼容端点购买 Claude,则参考 EvoLink 渠道定价。

5. 监控并设置预算

使用 Anthropic 的用量面板或 EvoLink 的内置监控,按模型跟踪支出、设置告警、避免意外账单。


常见问题

Claude API 多少钱?

Claude API 定价因模型而异。Anthropic 官方 API 定价中,Haiku 4.5 起步价 $1/$5 每百万 Token,Sonnet 4.6 为 $3/$15,Opus 4.6 为 $5/$25。提示词缓存和批量处理可进一步降低实际成本。所有数据截至 2026 年 4 月 9 日。

最便宜的 Claude API 模型是哪个?

Claude Haiku 4.5,输入 $1 / 输出 $5 每百万 Token。它是当前成本最低的 Claude 模型,适用于高并发生产工作负载。

Claude API 免费吗?

生产使用没有永久免费的 Claude API 层级。Anthropic 的 API 定价按用量计费,试用或促销积分的可用性请查看 Anthropic 当前的计费页面。EvoLink 也在当前站内宣传为新账户提供免费试用积分。

Claude 与 GPT 定价对比如何?

Claude Sonnet 4.6($3/$15)在供应商直接定价上高于 GPT-5.2($1.75/$14)和 Gemini 3.1 Pro($2/$12),而 Claude Opus 4.6($5/$25)是 Claude 的高端层级。通过 EvoLink,渠道定价可以缩小差距,但这些价格应与 Anthropic 官方计费分开看待。

什么是提示词缓存?能节省多少?

提示词缓存让您在多次请求中复用常用上下文(系统提示词、文档)。缓存写入费用为基础输入费率的 1.25 倍,但缓存读取仅为 0.1 倍 — 重复输入 Token 最多节省 90%。这对使用长系统提示词的智能体和聊天机器人尤其有价值。

Claude 有批量处理折扣吗?

有。Anthropic 的 Batch API 对输入和输出 Token 均提供 50% 折扣。任务在 24 小时内异步处理。非常适合数据管线、内容生成和不需要实时响应的工作负载。

在哪里可以以最优价格使用 Claude API?

EvoLink 目前通过其 OpenAI 兼容端点提供低于 Anthropic 官方费率的 Claude 渠道定价。如果您计划通过 EvoLink 而非直接从 Anthropic 购买 Claude,这是需要对比的渠道定价页面。

准备将 Claude 集成到您的产品中?EvoLink 通过单一 OpenAI 兼容端点为您提供所有 Claude 模型的访问 — 享受渠道折扣定价、内置速率限制处理和用量监控。


价格来源于 anthropic.com/pricing,截至 2026 年 4 月。费率可能变动 — 最终预算前请始终核实当前定价。

准备好把 AI 成本降低 89% 吗?

现在就开始使用 EvoLink,体验智能 API 路由的强大能力。