
Claude Code Router: Opciones de proveedor, límites y configuración de enrutamiento en producción

No se trata de si Claude Code es bueno. Se trata de cómo tu equipo opera Claude Code a escala: gestionando costos, manejando límites de tasa, sobreviviendo a caídas de proveedores y manteniendo múltiples agentes de código funcionando sin que compitan por la misma cuota.
Resumen
- Anthropic directo te da la experiencia más cercana al origen, pero te ata a los límites y precios de un solo proveedor.
- OpenRouter te da diversidad de proveedores, pero introduce su propia capa de errores y desafíos de visibilidad de costos.
- Un gateway API unificado (como EvoLink) le da a Claude Code un endpoint compatible con Anthropic con fallback multi-proveedor a nivel de gateway.
- La elección correcta depende del tamaño de tu equipo, la variabilidad de carga, la sensibilidad al costo y los requisitos de fallback.
- Usa la matriz de opciones de enrutamiento a continuación para encontrar tu caso.
Por qué los agentes de código necesitan más que un solo proveedor
Un desarrollador individual usando Claude Code a través de la API de Anthropic rara vez tiene problemas. Pero las cargas de trabajo de agentes de código a escala de equipo se comportan diferente:
| Patrón de equipo | Qué ocurre | Por qué falla un solo proveedor |
|---|---|---|
| 3–5 desarrolladores, todos en Claude Code | Sesiones concurrentes de contexto largo compiten por la misma cuota de organización | La tarea de refactorización grande de un desarrollador puede dejar sin recursos a los demás |
| Pipelines de CI/CD usando Claude | Tráfico en ráfagas durante despliegues y revisiones de PR | Ráfagas cortas pueden alcanzar los límites RPM/TPM mientras el uso mensual parece normal |
| Orquestación multi-agente | Fanout de herramientas, reintentos y tareas en segundo plano se acumulan | El consumo acumulado de tokens supera con creces lo que generaría un chat simple |
| Necesidades de modelos mixtos | Algunas tareas necesitan Opus, otras Sonnet, otras una opción más barata | El bloqueo con un solo proveedor significa pagar de más o dar servicio insuficiente en algunas tareas |
Si alguno de estos patrones coincide con tu equipo, la pregunta no es "¿debería usar un router?" — sino "¿qué enfoque de enrutamiento se ajusta a mi carga de trabajo?"
Opciones de proveedor y compensaciones
Opción 1: API directa de Anthropic
{
"env": {
"ANTHROPIC_API_KEY": "sk-ant-..."
},
"permissions": {
"allow": [],
"deny": []
}
}- Acceso directo a los modelos de Claude sin intermediarios
- Límites de tasa y precios oficiales de Anthropic
- La configuración más simple — sin proveedores adicionales en la ruta
- Sin fallback automático si Anthropic está caído o limitando tasas
- Los límites de tasa a nivel de organización se comparten entre todos tus desarrolladores
- Sin cambio de modelo sin modificar código
- Sin optimización de costos más allá de los niveles de precios de Anthropic
Opción 2: OpenRouter
Claude Code se conecta a OpenRouter mediante variables de entorno que reemplazan el endpoint Anthropic predeterminado. OpenRouter expone una interfaz compatible con Anthropic Messages API (un "skin Anthropic"), no un endpoint estándar de OpenAI chat completions:
{
"env": {
"ANTHROPIC_BASE_URL": "https://openrouter.ai/api",
"ANTHROPIC_AUTH_TOKEN": "sk-or-...",
"ANTHROPIC_API_KEY": ""
},
"permissions": {
"allow": [],
"deny": []
}
}- Acceso a Claude más otros modelos a través de una sola API
- Enrutamiento de proveedores de OpenRouter con
allow_fallbackshabilitado por defecto - Amplio catálogo de modelos para experimentar
- Una capa de errores adicional: los propios errores de OpenRouter se suman a los errores del proveedor upstream
- Las tarifas de compra de créditos y plataforma pueden afectar el costo efectivo — OpenRouter no aplica recargos sobre los precios de inferencia del proveedor, pero se aplican tarifas de plataforma en compras de créditos y excedentes BYOK
- Para modelos gratuitos, OpenRouter aplica sus propios límites de tasa (20 RPM, 50–1000 solicitudes/día); para modelos de pago, los límites del proveedor upstream son generalmente la restricción principal
Opción 3: Gateway compatible con Anthropic (EvoLink)
ANTHROPIC_BASE_URL para apuntar al endpoint proxy compatible con Anthropic de EvoLink:{
"env": {
"ANTHROPIC_AUTH_TOKEN": "your-evolink-api-key",
"ANTHROPIC_BASE_URL": "https://direct.evolink.ai",
"CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1"
},
"permissions": {
"allow": [],
"deny": []
}
}- Interfaz compatible con Anthropic — Claude Code envía solicitudes estándar de Anthropic Messages API, y EvoLink las proxifica con enrutamiento a nivel de gateway
- Enrutamiento a nivel de gateway entre proveedores, no solo un catálogo de modelos
- Fallback y selección de modelo gestionados a nivel de infraestructura
- Una sola clave API para modelos de texto, imagen y video
- Enrutamiento de costos diseñado para reducir el gasto efectivo
- Otro proveedor en la ruta de la petición (como cualquier gateway)
- Necesitas verificar que los modelos Claude específicos estén disponibles en el catálogo de EvoLink
Matriz de opciones de enrutamiento de Claude Code
| Factor | Anthropic directo | OpenRouter | EvoLink (Gateway unificado) |
|---|---|---|---|
| Complejidad de configuración | Baja — solo una clave API | Baja — variables de entorno (ANTHROPIC_BASE_URL + token) | Baja — variables de entorno (ANTHROPIC_BASE_URL + clave) |
| Acceso a modelos | Solo Claude | Claude + muchos otros | Claude + más de 40 modelos |
| Alcance de límites de tasa | Límites de org de Anthropic | Límites del proveedor upstream (modelos de pago); límites de plataforma de OpenRouter (modelos gratuitos) | Límites gestionados por gateway |
| Fallback en fallo | Ninguno — lo construyes tú | Fallback a nivel de proveedor (allow_fallbacks=true por defecto) | Fallback automático a nivel de gateway |
| Visibilidad de costos | Facturación directa de Anthropic | Tarifas de crédito/plataforma sobre precios del proveedor | Seguimiento de uso por clave |
| Complejidad de errores | Una capa | Dos capas (OpenRouter + proveedor) | Dos capas (gateway + proveedor) |
| Enrutamiento multi-modelo | Cambios manuales de código | openrouter/auto o modelo explícito | evolink/auto o modelo explícito |
| Compatibilidad API | SDK Anthropic nativo | Compatible con Anthropic Messages API ("skin Anthropic") | Proxy compatible con Anthropic |
| Ideal para | Solo / equipo pequeño, solo Claude | Experimentación con modelos, catálogo amplio | Enrutamiento en producción, optimización de costos |
Límites comunes que debes planificar
Independientemente del proveedor que elijas, las cargas de trabajo de agentes de código encuentran estos límites:
Límites de cuota y tasa
| Tipo de límite | Qué lo activa | Impacto en agentes de código |
|---|---|---|
| RPM (Peticiones por Minuto) | Demasiadas peticiones en una ventana corta | Las llamadas a herramientas en paralelo y los setups multi-agente lo alcanzan rápido |
| TPM (Tokens por Minuto) | Contexto grande o salidas largas | Un solo prompt de refactorización grande puede consumir minutos de presupuesto |
| Límites diarios | Uso alto sostenido | Los pipelines de CI/CD pueden agotar la cuota diaria por la tarde |
| Compartición a nivel de org | Múltiples desarrolladores en la misma org | La ráfaga de una persona bloquea a todos los demás |
Presión del contexto
Los modelos Claude actuales soportan ventanas de contexto de hasta 1M de tokens (las rutas anteriores pueden seguir exponiendo 200K). Las entradas grandes significan:
- Mayor costo por petición
- Mayor tiempo de respuesta
- Mayor probabilidad de alcanzar los límites de TPM
Errores de proveedor
Cuando ocurren errores, el origen importa:
- Los errores directos de Anthropic son sencillos de diagnosticar
- Los errores de OpenRouter pueden ser de OpenRouter mismo o del proveedor upstream — aprende a distinguirlos
- Los errores de gateway siguen el mismo patrón — verifica si fue el gateway o el proveedor upstream el que devolvió el error
Lista de verificación para configuración en producción
Antes de enrutar Claude Code a través de cualquier proveedor, verifica:
- La clave API funciona — envía una petición de prueba mínima antes de configurar Claude Code
- El ID de modelo es correcto — la nomenclatura de modelos varía según el proveedor
- Los límites de tasa son conocidos — revisa los límites RPM/TPM/diarios de tu nivel
- El costo está estimado — calcula el gasto diario esperado según el tamaño del equipo y la carga de trabajo
- Existe un plan de fallback — ¿qué pasa cuando el proveedor principal se cae?
- Múltiples desarrolladores coordinados — si comparten una org/proyecto, planifiquen la contención de cuota
- Monitoreo implementado — registra conteo de peticiones, uso de tokens, tasas de error y latencia
- Timeout configurado — las peticiones de agentes de código pueden ser largas; asegúrate de que el timeout del cliente sea adecuado
Cuándo el enrutamiento estilo EvoLink ayuda
No necesitas un gateway de enrutamiento si:
- Eres un desarrollador individual con uso predecible de Claude
- Solo necesitas una familia de modelos
- Ya tienes tu propia lógica de reintentos y fallback
Te beneficias del enrutamiento por gateway cuando:
- Tu equipo ejecuta 3+ sesiones concurrentes de agentes de código
- Quieres combinar modelos Claude, GPT, DeepSeek o Qwen según el tipo de tarea
- Quieres que el fallback ocurra a nivel de infraestructura, no en el código de tu aplicación
- Te importa la optimización de costos entre proveedores
curl https://api.evolink.ai/v1/chat/completions \
-H "Authorization: Bearer $EVOLINK_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "evolink/auto",
"messages": [
{"role": "user", "content": "Refactor this module to use dependency injection."}
]
}'Artículos relacionados
- Claude Code with OpenRouter: Limits, Errors, and Alternatives — comparación detallada de OpenRouter para agentes de código
- One Gateway for 3 Coding CLIs — configura Gemini CLI, Codex CLI y Claude Code a través de un solo gateway
- Fix OpenRouter 429 "Provider Returned Error" — depura errores específicos de OpenRouter
- Model Not Found in OpenAI-Compatible APIs — soluciona errores de ID de modelo al cambiar de proveedor
- How to Reduce 429 Errors in Agent Workloads — patrones de throttling y reintentos para tráfico de agentes
FAQ
¿Qué es un Claude Code router?
ANTHROPIC_BASE_URL para apuntar a un endpoint compatible con Anthropic diferente, o tan completo como un gateway API unificado que gestiona la selección de proveedor, fallback y enrutamiento de costos automáticamente.¿Puedo usar Claude Code con un proveedor que no sea Anthropic?
ANTHROPIC_BASE_URL para reemplazar el endpoint Anthropic predeterminado. Cualquier servicio que exponga un endpoint compatible con Anthropic Messages API puede servir como proxy — incluyendo OpenRouter (que proporciona un "skin Anthropic"), EvoLink y soluciones autoalojadas. Esto no es lo mismo que un endpoint genérico compatible con OpenAI; Claude Code espera el formato de la API de Anthropic.¿El enrutamiento añade latencia a mi agente de código?
Cualquier salto adicional añade algo de latencia. Para la mayoría de cargas de trabajo de agentes de código, la latencia adicional de un gateway (típicamente 10–50 ms) es insignificante comparada con el tiempo de inferencia del modelo (a menudo segundos). La compensación es latencia frente a beneficios de fallback y costos.
¿Cómo gestiono los límites de tasa en un equipo?
Tres enfoques: (1) usa claves API separadas por desarrollador para aislar la cuota, (2) implementa throttling del lado del cliente en tus flujos de trabajo de agentes de código, (3) usa un gateway que gestione los límites de tasa a nivel de infraestructura.
¿Debería usar evolink/auto o un modelo específico para programar?
claude-sonnet-4-20250514) cuando necesites un comportamiento predecible para un flujo de trabajo probado. Usa evolink/auto cuando quieras que el router optimice las compensaciones costo-calidad en tareas de código mixtas.

