Claude 4.6 Sonnet API
Claude 4.6 Sonnet 是 Anthropic 在速度、智能和成本之间最均衡的模型,是一个面向编程、Agent 工作流和日常任务的多功能系统,具备 200K 上下文窗口和 128K 最大输出。通过 EvoLink 的统一 API 即可访问。
定价
| 方案 | 上下文窗口 | 最大输出 | 输入 | 输出 | 缓存写入 | 缓存读取 |
|---|---|---|---|---|---|---|
| Claude Sonnet 4.6 | 200.0K | 128.0K | ≤200.0K$2.55-15% $3.00官方价格 >200.0K$5.10-15% $6.00官方价格 | ≤200.0K$12.75-15% $15.00官方价格 >200.0K$19.125-15% $22.50官方价格 | ≤200.0K$3.188-15% $3.75官方价格 >200.0K$6.375-15% $7.50官方价格 | ≤200.0K$0.256-15% $0.300官方价格 >200.0K$0.511-15% $0.600官方价格 |
| Claude Sonnet 4.6 (Beta) | 200.0K | 128.0K | ≤200.0K$0.780-74% $3.00官方价格 >200.0K$1.56-74% $6.00官方价格 | ≤200.0K$3.90-74% $15.00官方价格 >200.0K$5.85-74% $22.50官方价格 | ≤200.0K$0.975-74% $3.75官方价格 >200.0K$1.95-74% $7.50官方价格 | ≤200.0K$0.078-74% $0.300官方价格 >200.0K$0.156-74% $0.600官方价格 |
服务端联网搜索能力
定价说明: 价格单位:USD / 1M tokens
缓存命中: 适用于缓存的提示词 Tokens 价格。
在 EvoLink 上运行 Claude Sonnet 4.6 有两种方式,您可以选择适合您需求的层级。
- · Claude Sonnet 4.6: 默认层级,适合生产环境的可靠性和可预测的可用性。
- · Claude Sonnet 4.6 (Beta): 低成本层级,尽力而为的可用性;推荐用于可接受重试的工作负载。
Claude 4.6 Sonnet API — Anthropic 最均衡的模型
Claude 4.6 Sonnet 在智能、速度和成本之间实现了理想平衡,具备 200K 上下文窗口和高达 128K 的输出 Token,适用于编程、智能体和复杂工作流。

利用 Claude 4.6 Sonnet API 可以构建什么?
多功能编程助手
将 Sonnet 4.6 用于日常编程任务——架构设计、重构、代码审查和 Bug 修复。凭借高达 128K 的输出 Token 和 200K 上下文窗口,在单次请求中处理大型代码库并生成全面的代码差异、测试套件和实施计划。

可靠的智能体工作流
构建能够规划、调用工具并在多步任务中保持上下文的智能体。Sonnet 4.6 为智能体密集型工作流提供智能与速度的平衡,以远低于旗舰定价的成本提供可靠的工具使用和一致的输出。


为什么团队在 EvoLink 上选择 Claude Sonnet 4.6 API
通过 EvoLink 的单一 API 密钥,获得具备稳定模型 ID、提示词缓存和统一路由的 Anthropic 最均衡模型。
速度、智能与成本的最佳平衡
Sonnet 4.6 专为需要在编程、分析和智能体任务中获得强劲表现但无需旗舰定价的团队而打造。
128K 最大输出支持大规模生成
在单次请求中生成完整的代码、文档和分析——输出容量是以往模型的两倍。
通过提示词缓存控制成本
支持 5 分钟和 1 小时级别的提示词缓存,缓存命中按基础输入费率的 0.1 倍计费,有效降低重复成本。
如何集成 Claude Sonnet 4.6 API
通过 EvoLink 连接,选择您的模型 ID,几分钟内即可开始构建。
第 1 步 — 创建您的 EvoLink API 密钥
注册 EvoLink 以获取单一 API 密钥,该密钥可路由至 Anthropic、Bedrock 或 Vertex AI。
第 2 步 — 选择模型 ID
使用 `claude-sonnet-4-6` 通过 EvoLink 的统一 API 访问最新的 Sonnet 4.6 模型。
第 3 步 — 优化质量与成本
Claude 4.6 Sonnet 支持延伸思考处理复杂任务,并支持提示词缓存以降低重复成本——每百万 Token 仅需 $3/$15。
Claude Sonnet 4.6 API 能力
面向生产环境的关键规格与模型特性
200K 上下文窗口
在单次请求中读取大型文档或代码库,无需分块。
128K 最大输出
生成长篇回答、计划和代码,不会提前截断——是以往限制的两倍。
延伸思考
在任务变得复杂时启用更深层的推理,成本可预测。
视觉 + 多语言输入
接受文本和图像输入,具备强大的多语言理解能力。
提示词缓存费率
缓存写入与读取分别计费;缓存命中仅按基础输入价格的 0.1 倍计费。
稳定的 ID 与别名
别名会自动升级到最新快照,而版本化 ID 则保持结果一致。
Claude Sonnet 4.6 API - 常见问题
Everything you need to know about the product and billing.