Seedance 2.0 API — 即将上线Get early access

Claude 4.0 Sonnet API

Claude Sonnet 4.0 API 是一款专为生产团队设计的均衡、高性能模型,适用于需要强大推理能力、安全输出和可预测成本的场景。将 Claude Sonnet 4.0 API 用于支持智能体、文档分析和开发者工作流,兼顾质量与预算。
Run With API
Using coding CLIs? Run Claude 4.0 Sonnet via EvoCode — One API for Code Agents & CLIs. (View Docs)
$

定价

方案上下文窗口最大输出输入输出缓存写入缓存读取
Claude Sonnet 4.0200.0K64.0K
200.0K$2.55-15%
$3.00官方价格
>200.0K$5.10-15%
$6.00官方价格
200.0K$12.75-15%
$15.00官方价格
>200.0K$19.125-15%
$22.50官方价格
200.0K$3.188-15%
$3.75官方价格
>200.0K$6.375-15%
$7.50官方价格
200.0K$0.256-15%
$0.300官方价格
>200.0K$0.511-15%
$0.600官方价格
Claude Sonnet 4.0 (Beta)200.0K64.0K
200.0K$0.780-74%
$3.00官方价格
>200.0K$1.56-74%
$6.00官方价格
200.0K$3.90-74%
$15.00官方价格
>200.0K$5.85-74%
$22.50官方价格
200.0K$0.975-74%
$3.75官方价格
>200.0K$1.95-74%
$7.50官方价格
200.0K$0.078-74%
$0.300官方价格
>200.0K$0.156-74%
$0.600官方价格
Web Search Tool

服务端联网搜索能力

$0.011/search

定价说明: 价格单位:USD / 1M tokens

缓存命中: 适用于缓存的提示词 Tokens 价格。

在 EvoLink 上运行 Claude Sonnet 4.0 有两种方式,您可以选择适合您需求的层级。

  • · Claude Sonnet 4.0: 默认层级,适合生产环境的可靠性和可预测的可用性。
  • · Claude Sonnet 4.0 (Beta): 低成本层级,尽力而为的可用性;推荐用于可接受重试的工作负载。

Claude 4.0 Sonnet API — 面向生产环境的均衡智能

使用 Claude Sonnet 4.0 API 交付可靠的 AI 体验,为真实团队和真实工作负载结合实用的延迟与强大的推理能力。

AI 模型功能展示

利用 Claude Sonnet 4.0 API 可以构建什么?

客户支持智能体

使用 Claude Sonnet 4.0 API 创建能够端到端解决工单的支持助手。它能保持品牌语气,理解长篇客户历史,并能调用工具获取订单或更新 CRM 记录。团队使用 Claude Sonnet 4.0 API 来缩短处理时间,提高解决质量,并保持跨语言和渠道的回复一致性。

支持场景展示

文档分析与提取

利用 Claude Sonnet 4.0 API 将合同、报告和日志转化为结构化摘要。凭借长上下文选项,Claude Sonnet 4.0 API 可以读取大型文档,回答精确问题,并输出符合您 Schema 的 JSON。这对于需要准确性和可追溯摘要的合规审查、知识库和分析流水线非常理想。

文档处理展示

开发者副驾驶与代码审查

发布能够审查差异(Diffs)、提出修复建议并解释设计选择的编程副驾驶。Claude Sonnet 4.0 API 将 Claude 4 的推理能力带入日常工程任务,其定价层级适合团队规模化处理 PR 摘要、重构和架构指导。使用 Claude Sonnet 4.0 API 保持审查的快速、有用且在大型代码库中保持一致。

编程场景展示

为什么团队选择 Claude Sonnet 4.0 API

Claude Sonnet 4.0 API 为生产级 AI 平衡了能力、成本和可靠性。

均衡的性能

为日常工作流提供强大的推理能力和实用的延迟。

清晰的成本规划

透明的基础定价,提供缓存和批处理选项。

生产就绪

支持工具使用、结构化输出和长上下文选项。

如何集成 Claude Sonnet 4.0 API

使用 Claude Sonnet 4.0 API,几分钟内实现从 API 密钥到生产工作流的跨越。

1

第 1 步 — 身份验证

创建 API 密钥,设置 Sonnet 4 模型别名,并从您的应用或后端发送第一个提示词。

2

第 2 步 — 添加工具

定义工具和 JSON Schema 输入,以便模型为您的工作流返回结构化、可操作的结果。

3

第 3 步 — 优化

使用缓存或批处理,然后在扩展 Claude Sonnet 4.0 API 规模时监控用量、延迟和质量。

Claude Sonnet 4.0 API 能力

符合真实产品需求的实用功能

成本

透明的基础定价

Claude Sonnet 4 的定价为每百万输入 Token 3 美元,每百万输出 Token 15 美元。清晰的基准有助于团队预测成本并为生产负载选择合适的模型。

缓存

提示词缓存费率

提示词缓存采用独立费率:5 分钟缓存写入为基础输入的 1.25 倍,1 小时缓存写入为 2 倍,缓存读取仅为 0.1 倍。这使得重复上下文的成本随时间大幅降低。

上下文

1M 上下文 Beta 定价

1M Token 上下文窗口正处于 Beta 测试阶段,仅面向用量层级 4 或具有自定义速率限制的组织开放,且仅适用于 Claude Sonnet 4 和 4.5。超过 200K 输入 Token 的请求适用溢价费率。

效率

批处理节省成本

批处理为异步作业提供输入和输出 Token 50% 的折扣,可降低大规模摄取和夜间自动化的成本。

工具

支持 JSON Schema 的工具使用

工具定义包含使用 JSON Schema 定义参数的 input_schema。这保持了工具调用的可预测性,并提高了必须执行操作或返回结构化数据的智能体的可靠性。

平台

多模态与多语言

所有当前的 Claude 模型都支持文本和图像输入、文本输出、多语言能力和视觉。可通过 Anthropic API 以及 AWS Bedrock、Google Vertex AI 和 Microsoft Foundry 访问。

常见问题

Everything you need to know about the product and billing.

Claude Sonnet 4.0 API 被定位为面向生产团队的高性能、均衡模型,适用于需要强大推理能力而无需支付溢价成本的场景。它是客户支持智能体、文档分析和开发者副驾驶的实用默认选择,能够在规模化应用中保持准确和可靠。它也适合计划逐步添加工具使用、结构化输出和长上下文工作流的团队。
Claude Sonnet 4 的定价为每百万输入 Token 3 美元,每百万输出 Token 15 美元。提示词缓存对写入和读取采用不同费率,批处理为异步作业提供 50% 的折扣。如果启用 1M 上下文 Beta 且请求超过 200K 输入 Token,则适用长上下文溢价费率。请始终在最终预算前确认官方定价页面的最新费率。
Claude Sonnet 4 为特定层级的组织提供 1M Token 上下文窗口的 Beta 测试,该选项仅适用于 Claude Sonnet 4 和 4.5。超过 200K 输入 Token 的请求按长上下文费率计费,较小的提示词则使用标准定价。这使得该模型非常适合处理大型文档、长对话和多文件审查。
是的。该 API 支持工具使用,每个工具定义包含遵循 JSON Schema 的 input_schema。这使得工具调用可预测、易验证且更安全地实现自动化。工具定义和调用会计入 Token 用量。对于需要获取数据或触发操作的智能体,基于 Schema 的工具输入可减少解析错误并提高可靠性。
提示词缓存通过区分缓存写入和读取定价来降低重复上下文的成本。5 分钟写入为 1.25 倍,1 小时写入为 2 倍,而读取仅为 0.1 倍。当您在多次请求中复用长系统提示词、政策或静态文档时,这非常有用。对于高业务量工作流,缓存可以在保持响应质量的同时削减总支出。
是的。所有当前的 Claude 模型都支持文本和图像输入、文本输出、多语言能力和视觉。这意味着该 API 可以解读截图、图表或扫描文档,并以多种语言响应。如果您的工作流包含视觉数据,这可以将分析和报告保留在单一模型中,对全球支持和分析团队非常有帮助。
Claude 模型可通过 Anthropic API 以及第三方平台(包括 AWS Bedrock、Google Vertex AI 和 Microsoft Foundry)访问。这为团队在采购、数据驻留和基础设施对齐方面提供了选择。如果您跨多个平台部署,请标准化提示词和评估检查,以确保模型在不同地区和环境中的行为一致。