Claude 4.0 Sonnet API
定价
| 方案 | 上下文窗口 | 最大输出 | 输入 | 输出 | 缓存写入 | 缓存读取 |
|---|---|---|---|---|---|---|
| Claude Sonnet 4.0 | 200.0K | 64.0K | ≤200.0K$2.55-15% $3.00官方价格 >200.0K$5.10-15% $6.00官方价格 | ≤200.0K$12.75-15% $15.00官方价格 >200.0K$19.125-15% $22.50官方价格 | ≤200.0K$3.188-15% $3.75官方价格 >200.0K$6.375-15% $7.50官方价格 | ≤200.0K$0.256-15% $0.300官方价格 >200.0K$0.511-15% $0.600官方价格 |
| Claude Sonnet 4.0 (Beta) | 200.0K | 64.0K | ≤200.0K$0.780-74% $3.00官方价格 >200.0K$1.56-74% $6.00官方价格 | ≤200.0K$3.90-74% $15.00官方价格 >200.0K$5.85-74% $22.50官方价格 | ≤200.0K$0.975-74% $3.75官方价格 >200.0K$1.95-74% $7.50官方价格 | ≤200.0K$0.078-74% $0.300官方价格 >200.0K$0.156-74% $0.600官方价格 |
服务端联网搜索能力
定价说明: 价格单位:USD / 1M tokens
缓存命中: 适用于缓存的提示词 Tokens 价格。
在 EvoLink 上运行 Claude Sonnet 4.0 有两种方式,您可以选择适合您需求的层级。
- · Claude Sonnet 4.0: 默认层级,适合生产环境的可靠性和可预测的可用性。
- · Claude Sonnet 4.0 (Beta): 低成本层级,尽力而为的可用性;推荐用于可接受重试的工作负载。
Claude 4.0 Sonnet API — 面向生产环境的均衡智能
使用 Claude Sonnet 4.0 API 交付可靠的 AI 体验,为真实团队和真实工作负载结合实用的延迟与强大的推理能力。

利用 Claude Sonnet 4.0 API 可以构建什么?
客户支持智能体
使用 Claude Sonnet 4.0 API 创建能够端到端解决工单的支持助手。它能保持品牌语气,理解长篇客户历史,并能调用工具获取订单或更新 CRM 记录。团队使用 Claude Sonnet 4.0 API 来缩短处理时间,提高解决质量,并保持跨语言和渠道的回复一致性。

文档分析与提取
利用 Claude Sonnet 4.0 API 将合同、报告和日志转化为结构化摘要。凭借长上下文选项,Claude Sonnet 4.0 API 可以读取大型文档,回答精确问题,并输出符合您 Schema 的 JSON。这对于需要准确性和可追溯摘要的合规审查、知识库和分析流水线非常理想。

开发者副驾驶与代码审查
发布能够审查差异(Diffs)、提出修复建议并解释设计选择的编程副驾驶。Claude Sonnet 4.0 API 将 Claude 4 的推理能力带入日常工程任务,其定价层级适合团队规模化处理 PR 摘要、重构和架构指导。使用 Claude Sonnet 4.0 API 保持审查的快速、有用且在大型代码库中保持一致。

为什么团队选择 Claude Sonnet 4.0 API
Claude Sonnet 4.0 API 为生产级 AI 平衡了能力、成本和可靠性。
均衡的性能
为日常工作流提供强大的推理能力和实用的延迟。
清晰的成本规划
透明的基础定价,提供缓存和批处理选项。
生产就绪
支持工具使用、结构化输出和长上下文选项。
如何集成 Claude Sonnet 4.0 API
使用 Claude Sonnet 4.0 API,几分钟内实现从 API 密钥到生产工作流的跨越。
第 1 步 — 身份验证
创建 API 密钥,设置 Sonnet 4 模型别名,并从您的应用或后端发送第一个提示词。
第 2 步 — 添加工具
定义工具和 JSON Schema 输入,以便模型为您的工作流返回结构化、可操作的结果。
第 3 步 — 优化
使用缓存或批处理,然后在扩展 Claude Sonnet 4.0 API 规模时监控用量、延迟和质量。
Claude Sonnet 4.0 API 能力
符合真实产品需求的实用功能
透明的基础定价
Claude Sonnet 4 的定价为每百万输入 Token 3 美元,每百万输出 Token 15 美元。清晰的基准有助于团队预测成本并为生产负载选择合适的模型。
提示词缓存费率
提示词缓存采用独立费率:5 分钟缓存写入为基础输入的 1.25 倍,1 小时缓存写入为 2 倍,缓存读取仅为 0.1 倍。这使得重复上下文的成本随时间大幅降低。
1M 上下文 Beta 定价
1M Token 上下文窗口正处于 Beta 测试阶段,仅面向用量层级 4 或具有自定义速率限制的组织开放,且仅适用于 Claude Sonnet 4 和 4.5。超过 200K 输入 Token 的请求适用溢价费率。
批处理节省成本
批处理为异步作业提供输入和输出 Token 50% 的折扣,可降低大规模摄取和夜间自动化的成本。
支持 JSON Schema 的工具使用
工具定义包含使用 JSON Schema 定义参数的 input_schema。这保持了工具调用的可预测性,并提高了必须执行操作或返回结构化数据的智能体的可靠性。
多模态与多语言
所有当前的 Claude 模型都支持文本和图像输入、文本输出、多语言能力和视觉。可通过 Anthropic API 以及 AWS Bedrock、Google Vertex AI 和 Microsoft Foundry 访问。
常见问题
Everything you need to know about the product and billing.