Claude Soneto 4.0 API
Claude Sonnet 4.0 API es un modelo equilibrado y de alto rendimiento diseñado para equipos de producción que necesitan un razonamiento sólido, resultados seguros y costos predecibles. Utilice Claude Sonnet 4.0 API para agentes de soporte, análisis de documentos y flujos de trabajo de desarrolladores donde tanto la calidad como el presupuesto son importantes.
PRICING
| PLAN | CONTEXT WINDOW | MAX OUTPUT | INPUT | OUTPUT | CACHE WRITE | CACHE READ |
|---|---|---|---|---|---|---|
| Claude Sonnet 4.0 | 200.0K | 64.0K | ≤200.0K$2.55-15% $3.00Official Price >200.0K$5.10-15% $6.00Official Price | ≤200.0K$12.75-15% $15.00Official Price >200.0K$19.125-15% $22.50Official Price | ≤200.0K$3.188-15% $3.75Official Price >200.0K$6.375-15% $7.50Official Price | ≤200.0K$0.256-15% $0.300Official Price >200.0K$0.511-15% $0.600Official Price |
| Claude Sonnet 4.0 (Beta) | 200.0K | 64.0K | ≤200.0K$0.780-74% $3.00Official Price >200.0K$1.56-74% $6.00Official Price | ≤200.0K$3.90-74% $15.00Official Price >200.0K$5.85-74% $22.50Official Price | ≤200.0K$0.975-74% $3.75Official Price >200.0K$1.95-74% $7.50Official Price | ≤200.0K$0.078-74% $0.300Official Price >200.0K$0.156-74% $0.600Official Price |
Server-side web search capability
Pricing Note: Price unit: USD / 1M tokens
Cache Hit: Price applies to cached prompt tokens.
Two ways to run Claude Sonnet 4.0 — pick the tier that matches your workload.
- · Claude Sonnet 4.0: the default tier for production reliability and predictable availability.
- · Claude Sonnet 4.0 (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.
Claude Sonnet 4.0 API — Inteligencia equilibrada para la producción
Ofrezca experiencias de IA confiables con Claude Sonnet 4.0 API, que combina latencia práctica con un razonamiento sólido para equipos y cargas de trabajo reales.

¿Qué puedes construir con el Claude Sonnet 4.0 API?
Agentes de atención al cliente
Cree asistentes de soporte que resuelvan tickets de un extremo a otro con Claude Sonnet 4.0 API. Mantiene el tono de la marca, comprende largos historiales de clientes y puede utilizar herramientas para recuperar pedidos o actualizar registros de CRM. Los equipos utilizan Claude Sonnet 4.0 API para reducir el tiempo de gestión, aumentar la calidad de la resolución y mantener respuestas consistentes en todos los idiomas y canales.

Análisis y extracción de documentos.
Convierta contratos, informes y registros en resúmenes estructurados con Claude Sonnet 4.0 API. Con opciones de contexto largo, Claude Sonnet 4.0 API puede leer documentos grandes, responder preguntas precisas y generar JSON que se ajuste a su esquema. Esto es ideal para revisiones de cumplimiento, bases de conocimiento y procesos de análisis que necesitan precisión y resúmenes rastreables.

Copilotos de desarrolladores y revisión de código
Envíe copilotos de codificación que revisen diferencias, propongan correcciones y expliquen opciones de diseño. Claude Sonnet 4.0 API aporta el razonamiento Claude 4 a las tareas de ingeniería cotidianas, con un nivel de precios que se adapta a los equipos que escalan resúmenes de relaciones públicas, refactorizaciones y orientación sobre arquitectura. Utilice Claude Sonnet 4.0 API para mantener revisiones rápidas, útiles y consistentes en grandes bases de código.

Por qué los equipos eligen el Claude Sonnet 4.0 API
Claude Sonnet 4.0 API equilibra la capacidad, el costo y la confiabilidad para la producción de IA.
Rendimiento equilibrado
Razonamiento sólido con latencia práctica para los flujos de trabajo diarios.
Planificación de costes clara
Precios base transparentes con opciones de almacenamiento en caché y por lotes.
Preparación para la producción
Uso de herramientas, resultados estructurados y opciones de contexto largo.
Cómo integrar el Claude Sonnet 4.0 API
Desde la clave API hasta los flujos de trabajo de producción en minutos con Claude Sonnet 4.0 API.
Paso 1: autenticar
Cree una clave API, configure el alias del modelo Sonnet 4 y envíe un primer mensaje desde su aplicación o backend.
Paso 2: agregar herramientas
Defina herramientas y entradas de esquema JSON para que el modelo devuelva resultados estructurados y procesables para su flujo de trabajo.
Paso 3: optimizar
Utilice el almacenamiento en caché o el procesamiento por lotes, luego supervise el uso, la latencia y la calidad a medida que escala el Claude Sonnet 4.0 API.
Claude Capacidades de Sonnet 4.0 API
Funciones prácticas que se adaptan a las necesidades reales del producto
Precios base transparentes
Claude Sonnet 4 tiene un precio de $3 por millón de tokens de entrada y $15 por millón de tokens de salida. Esta línea de base clara ayuda a los equipos a pronosticar costos y elegir el modelo adecuado para las cargas de trabajo de producción.
Tasas de almacenamiento en caché rápidas
El almacenamiento en caché rápido utiliza velocidades separadas: las escrituras de caché de 5 minutos son 1,25 veces la entrada base, las escrituras de caché de 1 hora son 2 veces y las lecturas de caché son 0,1 veces. Esto hace que el contexto repetido sea mucho más barato con el tiempo.
Precio beta contextual de 1 millón
La ventana de contexto 1M está en versión beta para el nivel de uso 4 o límites de velocidad personalizados y solo está disponible para Claude Sonnet 4 y 4.5. Las solicitudes de más de 200.000 tokens de entrada utilizan tarifas premium: entrada de $6 y salida de $22,50 por MTok.
Ahorros en procesamiento por lotes
El procesamiento por lotes ofrece un descuento del 50 % en tokens de entrada y salida para trabajos asincrónicos, lo que puede reducir los costos de ingesta a gran escala y automatización nocturna.
Uso de herramientas con esquema JSON
Las definiciones de herramientas incluyen un input_schema que utiliza el esquema JSON para definir parámetros. Esto mantiene las llamadas a herramientas predecibles y mejora la confiabilidad de los agentes que deben ejecutar acciones o devolver datos estructurados.
Multimodal y multilingüe
Todos los modelos Claude actuales admiten entrada de texto e imágenes, salida de texto, capacidades multilingües y visión. Los modelos Claude están disponibles a través de Anthropic API y en AWS Bedrock, Google Vertex AI y Microsoft Foundry.
Preguntas frecuentes
Everything you need to know about the product and billing.