
Cómo usar GLM-5.2 con EvoLink para coding agents

Use los snippets como patrones de SDK compatible con OpenAI. Confirme el soporte exacto de parámetros en la documentación de GLM-5.2 antes de producción.
Ruta rápida
| Paso | Acción | Motivo |
|---|---|---|
| 1 | Crear una API key de EvoLink | Una clave enruta GLM-5.2 por el gateway |
| 2 | Usar un cliente compatible con OpenAI | Reutiliza SDKs y herramientas existentes |
| 3 | Definir model como glm-5.2 | Evita errores entre slug y model ID |
| 4 | Probar con un prompt pequeño | Verifica auth, routing y respuesta |
| 5 | Añadir contexto y tools gradualmente | Controla coste y depuración |
Patrón Python compatible con OpenAI
from openai import OpenAI
client = OpenAI(
api_key="YOUR_EVOLINK_API_KEY",
base_url="https://api.evolink.ai/v1",
)
response = client.chat.completions.create(
model="glm-5.2",
messages=[
{"role": "system", "content": "You are a concise senior software engineer."},
{"role": "user", "content": "Review this function and suggest one safe refactor."},
],
temperature=0.2,
max_tokens=1024,
)
print(response.choices[0].message.content)Patrón Node.js compatible con OpenAI
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.EVOLINK_API_KEY,
baseURL: "https://api.evolink.ai/v1",
});
const response = await client.chat.completions.create({
model: "glm-5.2",
messages: [
{ role: "system", content: "You are a concise senior software engineer." },
{ role: "user", content: "Summarize the risks in this pull request." },
],
temperature: 0.2,
max_tokens: 1024,
});
console.log(response.choices[0].message.content);Flujos adecuados
| Flujo | Encaje | Nota de producción |
|---|---|---|
| Q&A de repositorios | El contexto largo reduce chunking agresivo | Reutilice prefijos estables |
| Code review | Útil para razonamiento sobre diffs | Ponga límites de salida |
| Agentes con tools | Function calling ayuda a loops agente | Pruebe schemas pequeños primero |
| Análisis de documentos largos | Funciona para contratos, especificaciones e informes | Controle los tokens de entrada antes de enviar todo el contexto |
| Coding CLIs | Ruta compatible OpenAI simplifica setup | Ver gateway para coding CLIs |
Control de costes
- Mantenga system prompts y resúmenes de repositorio estables al inicio.
- Reutilice prefijos largos cuando aplique prompt caching.
- Desactive controles de razonamiento más profundo cuando baste una respuesta simple.
- Defina límites duros de
max_tokenspara loops de agentes. - Registre input, output, cache reads, latencia y reintentos por llamada.
Handoff de producción
Antes de enrutar tráfico real de coding agent, verifique:
| Comprobación | Condición de aprobación |
|---|---|
| Auth | Una nueva key de EvoLink devuelve una respuesta correcta |
| Model ID | Las solicitudes usan glm-5.2, no el slug glm-5-2 |
| Coste | El uso de input/output/cache-read aparece en billing o logs |
| Tool calls | Los schemas funcionan en una prueba pequeña |
| Fallback | Existe un segundo modelo o ruta manual para sesiones fallidas |
FAQ
¿Qué model ID debo usar?
glm-5.2. La URL usa /glm-5-2, pero el request usa el ID con punto.¿Funciona con el SDK de OpenAI?
Sí. Use la base URL de EvoLink con el endpoint compatible de Chat Completions.
¿Dónde reviso precios?
¿Sirve para coding agents?
Sí, especialmente para repo Q&A, code review, contexto largo y agentes con herramientas.
¿Debo empezar con tool calling?
No. Primero valide un chat simple, luego agregue schemas.
¿Prompt caching siempre baja costes?
Solo cuando se reutilizan prefijos estables que califican como cache reads.


