Seedance 2.0 API — Coming SoonGet early access

Claude Soneto 4.0 API

Claude Sonnet 4.0 API es un modelo equilibrado y de alto rendimiento diseñado para equipos de producción que necesitan un razonamiento sólido, resultados seguros y costos predecibles. Utilice Claude Sonnet 4.0 API para agentes de soporte, análisis de documentos y flujos de trabajo de desarrolladores donde tanto la calidad como el presupuesto son importantes.

Run With API
Using coding CLIs? Run Claude 4.0 Sonnet via EvoCode — One API for Code Agents & CLIs. (View Docs)
$

PRICING

PLANCONTEXT WINDOWMAX OUTPUTINPUTOUTPUTCACHE WRITECACHE READ
Claude Sonnet 4.0200.0K64.0K
200.0K$2.55-15%
$3.00Official Price
>200.0K$5.10-15%
$6.00Official Price
200.0K$12.75-15%
$15.00Official Price
>200.0K$19.125-15%
$22.50Official Price
200.0K$3.188-15%
$3.75Official Price
>200.0K$6.375-15%
$7.50Official Price
200.0K$0.256-15%
$0.300Official Price
>200.0K$0.511-15%
$0.600Official Price
Claude Sonnet 4.0 (Beta)200.0K64.0K
200.0K$0.780-74%
$3.00Official Price
>200.0K$1.56-74%
$6.00Official Price
200.0K$3.90-74%
$15.00Official Price
>200.0K$5.85-74%
$22.50Official Price
200.0K$0.975-74%
$3.75Official Price
>200.0K$1.95-74%
$7.50Official Price
200.0K$0.078-74%
$0.300Official Price
>200.0K$0.156-74%
$0.600Official Price
Web Search Tool

Server-side web search capability

$0.011/search

Pricing Note: Price unit: USD / 1M tokens

Cache Hit: Price applies to cached prompt tokens.

Two ways to run Claude Sonnet 4.0 — pick the tier that matches your workload.

  • · Claude Sonnet 4.0: the default tier for production reliability and predictable availability.
  • · Claude Sonnet 4.0 (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.

Claude Sonnet 4.0 API — Inteligencia equilibrada para la producción

Ofrezca experiencias de IA confiables con Claude Sonnet 4.0 API, que combina latencia práctica con un razonamiento sólido para equipos y cargas de trabajo reales.

Exhibición de héroe de la característica 1 del modelo de IA

¿Qué puedes construir con el Claude Sonnet 4.0 API?

Agentes de atención al cliente

Cree asistentes de soporte que resuelvan tickets de un extremo a otro con Claude Sonnet 4.0 API. Mantiene el tono de la marca, comprende largos historiales de clientes y puede utilizar herramientas para recuperar pedidos o actualizar registros de CRM. Los equipos utilizan Claude Sonnet 4.0 API para reducir el tiempo de gestión, aumentar la calidad de la resolución y mantener respuestas consistentes en todos los idiomas y canales.

Muestra de soporte de la característica 2 del modelo de IA

Análisis y extracción de documentos.

Convierta contratos, informes y registros en resúmenes estructurados con Claude Sonnet 4.0 API. Con opciones de contexto largo, Claude Sonnet 4.0 API puede leer documentos grandes, responder preguntas precisas y generar JSON que se ajuste a su esquema. Esto es ideal para revisiones de cumplimiento, bases de conocimiento y procesos de análisis que necesitan precisión y resúmenes rastreables.

Muestra de documentos de la característica 3 del modelo de IA

Copilotos de desarrolladores y revisión de código

Envíe copilotos de codificación que revisen diferencias, propongan correcciones y expliquen opciones de diseño. Claude Sonnet 4.0 API aporta el razonamiento Claude 4 a las tareas de ingeniería cotidianas, con un nivel de precios que se adapta a los equipos que escalan resúmenes de relaciones públicas, refactorizaciones y orientación sobre arquitectura. Utilice Claude Sonnet 4.0 API para mantener revisiones rápidas, útiles y consistentes en grandes bases de código.

Muestra de codificación de la característica 4 del modelo de IA

Por qué los equipos eligen el Claude Sonnet 4.0 API

Claude Sonnet 4.0 API equilibra la capacidad, el costo y la confiabilidad para la producción de IA.

Rendimiento equilibrado

Razonamiento sólido con latencia práctica para los flujos de trabajo diarios.

Planificación de costes clara

Precios base transparentes con opciones de almacenamiento en caché y por lotes.

Preparación para la producción

Uso de herramientas, resultados estructurados y opciones de contexto largo.

Cómo integrar el Claude Sonnet 4.0 API

Desde la clave API hasta los flujos de trabajo de producción en minutos con Claude Sonnet 4.0 API.

1

Paso 1: autenticar

Cree una clave API, configure el alias del modelo Sonnet 4 y envíe un primer mensaje desde su aplicación o backend.

2

Paso 2: agregar herramientas

Defina herramientas y entradas de esquema JSON para que el modelo devuelva resultados estructurados y procesables para su flujo de trabajo.

3

Paso 3: optimizar

Utilice el almacenamiento en caché o el procesamiento por lotes, luego supervise el uso, la latencia y la calidad a medida que escala el Claude Sonnet 4.0 API.

Claude Capacidades de Sonnet 4.0 API

Funciones prácticas que se adaptan a las necesidades reales del producto

Costo

Precios base transparentes

Claude Sonnet 4 tiene un precio de $3 por millón de tokens de entrada y $15 por millón de tokens de salida. Esta línea de base clara ayuda a los equipos a pronosticar costos y elegir el modelo adecuado para las cargas de trabajo de producción.

Almacenamiento en caché

Tasas de almacenamiento en caché rápidas

El almacenamiento en caché rápido utiliza velocidades separadas: las escrituras de caché de 5 minutos son 1,25 veces la entrada base, las escrituras de caché de 1 hora son 2 veces y las lecturas de caché son 0,1 veces. Esto hace que el contexto repetido sea mucho más barato con el tiempo.

Contexto

Precio beta contextual de 1 millón

La ventana de contexto 1M está en versión beta para el nivel de uso 4 o límites de velocidad personalizados y solo está disponible para Claude Sonnet 4 y 4.5. Las solicitudes de más de 200.000 tokens de entrada utilizan tarifas premium: entrada de $6 y salida de $22,50 por MTok.

Eficiencia

Ahorros en procesamiento por lotes

El procesamiento por lotes ofrece un descuento del 50 % en tokens de entrada y salida para trabajos asincrónicos, lo que puede reducir los costos de ingesta a gran escala y automatización nocturna.

Herramientas

Uso de herramientas con esquema JSON

Las definiciones de herramientas incluyen un input_schema que utiliza el esquema JSON para definir parámetros. Esto mantiene las llamadas a herramientas predecibles y mejora la confiabilidad de los agentes que deben ejecutar acciones o devolver datos estructurados.

Plataformas

Multimodal y multilingüe

Todos los modelos Claude actuales admiten entrada de texto e imágenes, salida de texto, capacidades multilingües y visión. Los modelos Claude están disponibles a través de Anthropic API y en AWS Bedrock, Google Vertex AI y Microsoft Foundry.

Preguntas frecuentes

Everything you need to know about the product and billing.

Claude Sonnet 4.0 API se posiciona como un modelo equilibrado y de alto rendimiento para equipos de producción que necesitan un razonamiento sólido sin costos adicionales. Es un valor predeterminado práctico para los agentes de atención al cliente, el análisis de documentos y los copilotos de desarrolladores que deben seguir siendo precisos y confiables a escala. El Claude Sonnet 4.0 API también se adapta a los equipos que planean agregar uso de herramientas, resultados estructurados y flujos de trabajo de contexto largo a lo largo del tiempo, manteniendo al mismo tiempo la latencia y el gasto predecibles para las operaciones diarias.
Claude Sonnet 4 tiene un precio de $3 por millón de tokens de entrada y $15 por millón de tokens de salida. El almacenamiento en caché rápido utiliza tarifas separadas para escrituras y lecturas de caché, y el procesamiento por lotes aplica un descuento del 50% en la entrada y salida para trabajos asincrónicos. Si habilita la versión beta de contexto de 1 millón y su solicitud supera los 200 000 tokens de entrada, se aplican tarifas premium de contexto largo. Confirme siempre las tarifas actuales en la página de precios oficial antes de realizar el presupuesto final.
Claude Sonnet 4 admite una ventana de contexto de token de 1 millón en versión beta para organizaciones en el nivel de uso 4 o con límites de tasa personalizados, y esa opción de 1 millón solo está disponible para Claude Sonnet 4 y 4.5. Las solicitudes superiores a 200.000 tokens de entrada se facturan a tarifas premium de contexto largo, mientras que las solicitudes más pequeñas utilizan precios estándar. Esto hace que el Claude Sonnet 4.0 API sea ideal para documentos grandes, conversaciones largas y revisiones de varios archivos que, de otro modo, requerirían fragmentación.
Sí. El Claude Sonnet 4.0 API admite el uso de herramientas y cada definición de herramienta incluye un esquema de entrada que sigue el esquema JSON para definir parámetros. Esto hace que las llamadas a herramientas sean predecibles, más fáciles de validar y más seguras de automatizar. Las definiciones y llamadas de herramientas cuentan para el uso de tokens, así que inclúyalas en las estimaciones de costos. Para los agentes que deben recuperar datos o desencadenar acciones, las entradas de herramientas basadas en esquemas reducen los errores de análisis y mejoran la confiabilidad.
El almacenamiento en caché rápido reduce el costo del contexto repetido al separar los precios de escritura y lectura de caché. En la página de precios, las escrituras de caché de 5 minutos son 1,25 veces la entrada base, las escrituras de caché de 1 hora son 2 veces y las lecturas de caché son 0,1 veces. Esto resulta útil cuando se reutilizan mensajes largos del sistema, políticas o documentos estáticos en muchas solicitudes. Para flujos de trabajo de gran volumen, el almacenamiento en caché puede reducir el gasto total y mantener constante la calidad de la respuesta.
Sí. Anthropic afirma que todos los modelos Claude actuales admiten entrada de texto e imágenes, salida de texto, capacidades multilingües y visión. Eso significa que Claude Sonnet 4.0 API puede interpretar capturas de pantalla, gráficos o documentos escaneados y responder en varios idiomas. Si su flujo de trabajo incluye datos visuales, esto mantiene el análisis y los informes en un solo modelo en lugar de cambiar de proveedor, lo cual es útil para los equipos de análisis y soporte global.
Los modelos Claude están disponibles a través de Anthropic API y en plataformas de terceros, incluidas AWS Bedrock, Google Vertex AI y Microsoft Foundry. Esto brinda a los equipos opciones para adquisiciones, residencia de datos y alineación de infraestructura. Si implementa en varias plataformas, estandarice las indicaciones y las comprobaciones de evaluación para que Claude Sonnet 4.0 API se comporte de manera consistente en todas las regiones y entornos.