Probé Ejecutar Openclaw (ex Clawdbot) con un LLM Gratuito. Esto es lo que Pasó.
Perfecto. Tengo un servidor headless. Tengo Ollama. Tengo sueños.
Así es como la realidad los aplastó — y cómo finalmente gané.
⚡ Actualización (20 Feb, 2026): El panorama de LLMs gratuitos se movió rápido desde enero. Tres cosas cambiaron:
1. Anthropic prohibió los tokens de Claude Max en OpenClaw. Si estabas usando tu suscripción Max, se acabó. Reconstruí el mío por $15/mes usando Kimi K2.5 + MiniMax M2.5 de respaldo.
2. Nuevos modelos entraron al ring. Qwen 3.5 (Alibaba) — capacidades agénticas nativas, $0.40/M tokens de entrada. DeepSeek V3.2 "Speciale" — 88.7% en LiveCodeBench, licencia MIT, $0.28/M entrada. Ambos compatibles con OpenRouter, se conectan directo a OpenClaw.
3. NVIDIA publicó una guía oficial para ejecutar OpenClaw localmente en GPUs RTX con Ollama. Si tienes una tarjeta RTX, LM Studio + modelo 7B = verdaderamente $0.
Mi elección actual: Kimi K2.5 vía OpenRouter para calidad casi-Claude a centavos. Ollama + Qwen 3.5 localmente por $0.

Acto 1: El Desierto de Configuraciones
La documentación oficial decía:
{
"api": "openai"
}
Mi servidor respondía:
Invalid input
Resulta que las palabras mágicas reales son:
{
"api": "openai-completions"
}
Un guión. Tres horas de mi vida.
Acto 2: El Modelo Que (No) Podía
Primer intento: qwen2.5:7b — unos respetables 7 mil millones de parámetros.
Tiempo para responder "Di OK": 7 minutos.
Mi arrocera china de producción masiva tiene mejor velocidad de inferencia.
Acto 3: La Traición de la Ventana de Contexto
"Bien," dije. "Usaré TinyLlama. Es pequeño. Es una llama. ¿Qué podría salir mal?"
FailoverError: Model context window too small (2048 tokens). Minimum is 16000.
Clawdbot requiere un nivel de atención de doctorado. TinyLlama tiene la memoria de un pez dorado.
Acto 4: El Modelo Ricitos de Oro
Finalmente: qwen2.5:1.5b
- Tamaño: 986 MB (ni muy grande)
- Contexto: 32k tokens (ni muy pequeño)
- Velocidad: Realmente responde antes de que se enfríe mi café
- Calidad: Alucina un poco, pero ¿quién no?
La Configuración Que Funciona
{
"models": {
"mode": "merge",
"providers": {
"ollama": {
"baseUrl": "http://127.0.0.1:11434/v1",
"apiKey": "ollama-local",
"api": "openai-completions",
"models": [{
"id": "qwen2.5:1.5b",
"name": "Qwen 2.5 1.5B",
"reasoning": false,
"input": ["text"],
"contextWindow": 32768,
"maxTokens": 8192,
"cost": { "input": 0, "output": 0, "cacheRead": 0, "cacheWrite": 0 }
}]
}
}
},
"agents": {
"defaults": {
"model": { "primary": "ollama/qwen2.5:1.5b" }
}
}
}
Guardar en: ~/.clawdbot/clawdbot.json Y ~/.clawdbot/agents/main/agent/models.json
Sí, ambos. No preguntes.
Los Comandos Que Realmente Funcionan
# Instalar el modelo
ollama pull qwen2.5:1.5b
# Probar directamente (evitar complejidad del gateway)
clawdbot agent --agent main --local --message "Hola"
# O con gateway
clawdbot gateway &
clawdbot agent --agent main --message "Hola"
# TUI interactivo
clawdbot tui
La Verdad Sin Filtros
Lo que prometieron vs. lo que obtienes:
- "IA gratis" → Gratis si tu tiempo no vale nada
- "Privacidad local" → Realmente cierto ✓
- "Respuestas rápidas" → Depende de tu definición de "rápido"
- "Configuración fácil" →
api: "openai-completions"(no"openai")
¿Deberías Hacer Esto?
Sí, si:
- Tienes una GPU (aunque sea modesta)
- Disfrutas debuggear configs a las 2 AM
- Valoras la privacidad sobre la velocidad
- Los precios de IA corporativa te ofenden
No, si:
- Tienes un servidor papa solo con CPU
- Esperas respuestas nivel ChatGPT
- Valoras tu cordura
Las Especificaciones Mínimas Reales
- RAM: 8 GB mínimo, 16 GB recomendado
- Modelo:
qwen2.5:1.5bmínimo,qwen2.5:7b+ GPU recomendado - Ventana de contexto: 16k+ requerido
- Paciencia: Infinita
¿Necesitas un VPS Que Realmente Pueda Con Esto?
Si estás cansado de ejecutar IA en una papa, un VPS decente marca toda la diferencia. Recomiendo empezar con al menos 8GB RAM y algunos núcleos de CPU decentes.
👉 Consigue un VPS con bonus extra aquí
Escrito por alguien que reintentó configs masivamente hasta que algo funcionó. De nada.
De configuraciones imposibles a un agente AI local funcional, te cuento los detalles de mi viaje con OpenClaw y modelos gratuitos.