Guía de Configuración OpenClaw + LLM Gratuito 2026: Lo Que Realmente Funciona

Perfecto. Tengo un servidor headless. Tengo Ollama. Tengo sueños.

Así es como la realidad los aplastó — y cómo finalmente gané.

⚡ Actualización (20 Feb, 2026): El panorama de LLMs gratuitos se movió rápido desde enero. Tres cosas cambiaron:

1. Anthropic prohibió los tokens de Claude Max en OpenClaw. Si estabas usando tu suscripción Max, se acabó. Reconstruí el mío por $15/mes usando Kimi K2.5 + MiniMax M2.5 de respaldo.

2. Nuevos modelos entraron al ring. Qwen 3.5 (Alibaba) — capacidades agénticas nativas, $0.40/M tokens de entrada. DeepSeek V3.2 "Speciale" — 88.7% en LiveCodeBench, licencia MIT, $0.28/M entrada. Ambos compatibles con OpenRouter, se conectan directo a OpenClaw.

3. NVIDIA publicó una guía oficial para ejecutar OpenClaw localmente en GPUs RTX con Ollama. Si tienes una tarjeta RTX, LM Studio + modelo 7B = verdaderamente $0.

Mi elección actual: Kimi K2.5 vía OpenRouter para calidad casi-Claude a centavos. Ollama + Qwen 3.5 localmente por $0.

OpenClaw LLM local setup configuration with Ollama server and Qwen model integration — Cuando tu servidor local funciona mejor que tu vida social

Acto 1: El Desierto de Configuraciones

La documentación oficial decía:

{
"api": "openai"
}

Mi servidor respondía:

Invalid input

Resulta que las palabras mágicas reales son:

{
"api": "openai-completions"
}

Un guión. Tres horas de mi vida.

Acto 2: El Modelo Que (No) Podía

Primer intento: qwen2.5:7b — unos respetables 7 mil millones de parámetros.

Tiempo para responder "Di OK": 7 minutos.

Mi arrocera china de producción masiva tiene mejor velocidad de inferencia.

Acto 3: La Traición de la Ventana de Contexto

"Bien," dije. "Usaré TinyLlama. Es pequeño. Es una llama. ¿Qué podría salir mal?"

FailoverError: Model context window too small (2048 tokens). Minimum is 16000.

Clawdbot requiere un nivel de atención de doctorado. TinyLlama tiene la memoria de un pez dorado.

Acto 4: El Modelo Ricitos de Oro

Finalmente: qwen2.5:1.5b

Tamaño: 986 MB (ni muy grande)
Contexto: 32k tokens (ni muy pequeño)
Velocidad: Realmente responde antes de que se enfríe mi café
Calidad: Alucina un poco, pero ¿quién no?

La Configuración Que Funciona

{
"models": {
"mode": "merge",
"providers": {
"ollama": {
"baseUrl": "http://127.0.0.1:11434/v1",
"apiKey": "ollama-local",
"api": "openai-completions",
"models": [{
"id": "qwen2.5:1.5b",
"name": "Qwen 2.5 1.5B",
"reasoning": false,
"input": ["text"],
"contextWindow": 32768,
"maxTokens": 8192,
"cost": { "input": 0, "output": 0, "cacheRead": 0, "cacheWrite": 0 }
}]
}
}
},
"agents": {
"defaults": {
"model": { "primary": "ollama/qwen2.5:1.5b" }
}
}
}

Guardar en: ~/.clawdbot/clawdbot.json Y ~/.clawdbot/agents/main/agent/models.json

Sí, ambos. No preguntes.

Los Comandos Que Realmente Funcionan

# Instalar el modelo
ollama pull qwen2.5:1.5b

# Probar directamente (evitar complejidad del gateway)
clawdbot agent --agent main --local --message "Hola"

# O con gateway
clawdbot gateway &
clawdbot agent --agent main --message "Hola"

# TUI interactivo
clawdbot tui

La Verdad Sin Filtros

Lo que prometieron vs. lo que obtienes:

"IA gratis" → Gratis si tu tiempo no vale nada
"Privacidad local" → Realmente cierto ✓
"Respuestas rápidas" → Depende de tu definición de "rápido"
"Configuración fácil" → api: "openai-completions" (no "openai")

¿Deberías Hacer Esto?

Sí, si:

Tienes una GPU (aunque sea modesta)
Disfrutas debuggear configs a las 2 AM
Valoras la privacidad sobre la velocidad
Los precios de IA corporativa te ofenden

No, si:

Tienes un servidor papa solo con CPU
Esperas respuestas nivel ChatGPT
Valoras tu cordura

Las Especificaciones Mínimas Reales

RAM: 8 GB mínimo, 16 GB recomendado
Modelo: qwen2.5:1.5b mínimo, qwen2.5:7b + GPU recomendado
Ventana de contexto: 16k+ requerido
Paciencia: Infinita

¿Necesitas un VPS Que Realmente Pueda Con Esto?

Si estás cansado de ejecutar IA en una papa, un VPS decente marca toda la diferencia. Recomiendo empezar con al menos 8GB RAM y algunos núcleos de CPU decentes.

👉 Consigue un VPS con bonus extra aquí

Escrito por alguien que reintentó configs masivamente hasta que algo funcionó. De nada.

De configuraciones imposibles a un agente AI local funcional, te cuento los detalles de mi viaje con OpenClaw y modelos gratuitos.

→ Únete a la newsletter de AI en producción