
Cómo usar evolink Smart router: Configuración en 5 minutos para enrutamiento unificado de modelos de IA

https://api.evolink.ai/v1/chat/completions y una URL base de https://api.evolink.ai/v1 en múltiples guías de integración. Este tutorial utiliza esos patrones de integración confirmados y evita promesas no documentadas sobre lógica de enrutamiento oculta, pools de modelos exactos o descuentos específicos de cuenta.Qué es evolink Smart router
evolink Smart router es el punto de entrada de enrutamiento inteligente dentro del flujo de trabajo de la API unificada de EvoLink. El valor práctico no es "magia automática". El valor es que tu aplicación puede mantener una superficie de integración única mientras EvoLink maneja las decisiones de selección de modelos dentro de la capa de gateway.- mantener un formato de solicitud compatible con OpenAI
- reducir el cambio del lado de la aplicación entre proveedores o familias de modelos
- inspeccionar el modelo enrutado en la respuesta de la API en lugar de codificar un modelo en todas partes
- comenzar con una ruta de gateway flexible antes de fijar un modelo para flujos críticos de producción
Si ya conoces el modelo exacto, el perfil de latencia y el objetivo de costo que necesitas, un ID de modelo fijo suele ser la opción más limpia.
Qué necesitas antes de comenzar
| Elemento | Qué preparar | Por qué importa |
|---|---|---|
| Cuenta de EvoLink | Inicia sesión en evolink.ai | Necesitas acceso a la configuración del panel y facturación |
| Clave API | Créala en el panel de EvoLink | El gateway usa autenticación Bearer token |
| URL base | https://api.evolink.ai/v1 | Funciona con flujos SDK compatibles con OpenAI usados en otras partes del repositorio |
| ID de modelo Smart router | evolink/auto | Usa este ID de modelo para habilitar el enrutamiento inteligente a través del gateway |
Tu primera solicitud con curl
curl https://api.evolink.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "evolink/auto",
"messages": [
{
"role": "user",
"content": "Explica las bases de datos vectoriales en un párrafo corto."
}
]
}'model apunta a tu entrada de enrutamiento inteligente en lugar de un modelo de proveedor fijo.Ejemplo en Python
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.evolink.ai/v1"
)
response = client.chat.completions.create(
model="evolink/auto",
messages=[
{
"role": "user",
"content": "Resume el equilibrio entre latencia y calidad del modelo."
}
]
)
print(response.model)
print(response.choices[0].message.content)Ejemplo en Node.js
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.EVOLINK_API_KEY,
baseURL: "https://api.evolink.ai/v1",
});
const response = await client.chat.completions.create({
model: "evolink/auto",
messages: [
{
role: "user",
content: "Enumera tres razones por las que los equipos usan un gateway de IA.",
},
],
});
console.log(response.model);
console.log(response.choices[0].message.content);Cómo leer la respuesta
Una respuesta de enrutador inteligente sigue la estructura familiar de completado de chat:
{
"id": "chatcmpl-example",
"object": "chat.completion",
"created": 1773187200,
"model": "provider/model-selected-at-runtime",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "Una base de datos vectorial almacena embeddings para que la búsqueda semántica pueda recuperar contenido similar de manera eficiente."
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 17,
"completion_tokens": 18,
"total_tokens": 35
}
}model es lo primero que debes registrar en producción. Te dice qué modelo enrutado manejó realmente la solicitud, lo cual es útil para depuración, análisis de gastos y decidir si debes seguir usando el enrutador inteligente o cambiar una carga de trabajo a un modelo fijo.Enrutador inteligente vs modelo fijo
| Escenario | evolink Smart router | ID de modelo fijo |
|---|---|---|
| Prototipado inicial | Muy adecuado | Generalmente innecesario |
| Cargas de trabajo mixtas | Muy adecuado | Puede volverse operacionalmente ruidoso |
| Ruta de producción estable con QA estricto | Posible, pero verifica cuidadosamente | Generalmente mejor |
| Ajuste de costos por caso de uso | Buen punto de partida | Mejor una vez que conoces el modelo ganador |
| Estrategia de failover de proveedor | Más fácil de centralizar | Gestionas más lógica en el código de la aplicación |
El patrón que generalmente escala mejor es simple:
- Comienza con
evolink Smart routermientras la carga de trabajo aún está cambiando. - Registra el valor
modelenrutado y compara costo, latencia y calidad de salida. - Fija un modelo para flujos que necesitan mayor previsibilidad operacional.
Qué permanece específico de la cuenta
El borrador original incluía varias afirmaciones de producto que no deben publicarse como hechos concretos sin una fuente verificada vinculada a tu cuenta o documentación oficial. Trátalos como elementos a confirmar antes de publicar promesas externas:
- el identificador de modelo público exacto para
evolink Smart router - el tamaño exacto del pool de enrutamiento disponible
- cualquier promesa sobre "sin tarifa de enrutamiento"
- cualquier afirmación de descuento porcentual versus proveedores directos
- declaraciones de SLA como
99.9% de tiempo de actividad - qué capacidades avanzadas están garantizadas a través del enrutador inteligente para cada modelo enrutado
Si quieres que este artículo se vuelva más orientado a ventas más adelante, la forma limpia es agregar esos elementos solo después de que estén documentados en una página de precios de primera parte, página de producto o documentación oficial de API.
Lista de verificación de producción antes del lanzamiento
| Verificación | Por qué verificarlo |
|---|---|
| Confirmar el ID del modelo de enrutador | Previene errores de copiar y pegar del código de marcador de posición |
Probar el campo model de respuesta | Confirma la visibilidad del modelo enrutado para observabilidad |
| Comparar costo en prompts reales | El precio efectivo depende de los modelos seleccionados y la forma de la carga de trabajo |
| Medir latencia por tipo de solicitud | El enrutamiento inteligente solo es útil si coincide con tu SLA de cara al usuario |
| Decidir cuándo fijar un modelo | Algunos flujos necesitan salida determinista o cobertura de QA más estrecha |
Próximos pasos
Una vez que tu primera solicitud funcione, el seguimiento de mayor valor no es más código de ejemplo. Es instrumentación.
- registra
response.model - almacena el uso de tokens por característica o ruta
- compara el tráfico del enrutador inteligente con una línea base de modelo fijo
- revisa los modelos fijos disponibles en el catálogo de modelos de EvoLink
Eso te da los datos necesarios para decidir si la ruta del gateway está mejorando la eficiencia de costos y la confiabilidad de producción para tu carga de trabajo real.
Preguntas frecuentes
¿Es evolink Smart router lo mismo que elegir un modelo fijo?
evolink Smart router mantiene esa decisión en la capa de gateway.¿Necesito un SDK diferente para usar evolink Smart router?
No. Según los ejemplos existentes del repositorio, el patrón de integración permanece compatible con OpenAI. Principalmente cambias la URL base y el identificador de modelo.
¿Dónde encuentro el ID correcto del modelo Smart router?
Confírmalo en tu panel de EvoLink o documentación oficial antes de publicar o enviar código para copiar y pegar. El borrador original no incluía un identificador verificado localmente.
¿Debo iniciar tráfico de producción en evolink Smart router?
Sí, si tu carga de trabajo aún está evolucionando y quieres un punto de entrada de gateway único. Para flujos estrictamente controlados, compáralo con un modelo fijo antes del lanzamiento completo.
¿Qué debo registrar primero después de la integración?
response.model, latencia, uso de tokens y el nombre de la característica que activó la solicitud. Esos cuatro campos generalmente explican la mayoría de las preguntas de enrutamiento y costos.¿El enrutamiento inteligente garantiza menor costo?
No automáticamente. Puede mejorar el costo efectivo, pero el resultado depende de tus prompts, modelos downstream seleccionados y configuración de cuenta.
¿Cuándo debo cambiar de Smart router a un modelo fijo?
Cambia cuando una carga de trabajo tenga un ganador claro en calidad, latencia o costo y quieras un QA más estricto y un comportamiento de producción más predecible.


