J'ai testé Openclaw (ex Clawdbot) avec un LLM gratuit. Voici ce qui s'est passé.

3 min read

Parfait. J'ai un serveur headless. J'ai Ollama. J'ai des rêves.

Voici comment la réalité les a écrasés — et comment j'ai fini par gagner.

Mise à jour (20 fév 2026) : Le paysage des LLM gratuits a bougé vite depuis janvier. Trois changements :

1. Anthropic a banni les tokens Claude Max dans OpenClaw. Si vous tourniez sur votre abonnement Max, c'est fini. J'ai reconstruit le mien pour 15€/mois avec Kimi K2.5 + MiniMax M2.5 en fallback.

2. De nouveaux modèles sont entrés dans l'arène. Qwen 3.5 (Alibaba) — capacités agentiques natives, 0,40€/M tokens d'entrée. DeepSeek V3.2 "Speciale" — 88,7% sur LiveCodeBench, licence MIT, 0,28€/M en entrée. Tous deux compatibles OpenRouter, se branchent direct dans OpenClaw.

3. NVIDIA a publié un guide officiel pour faire tourner OpenClaw en local sur GPU RTX avec Ollama. Si vous avez une carte RTX, LM Studio + modèle 7B = vraiment 0€.

Mon choix actuel : Kimi K2.5 via OpenRouter pour une qualité proche de Claude à quelques centimes. Ollama + Qwen 3.5 en local pour 0€.

Configuration OpenClaw avec Ollama et modèles LLM locaux sur serveur headless
Quand ton serveur headless a plus de problèmes que toi

Acte 1 : L'Enfer de la Config

La doc officielle disait :

{
"api": "openai"
}

Mon serveur répondait :

Invalid input

Il s'avère que les vrais mots magiques sont :

{
"api": "openai-completions"
}

Un trait d'union. Trois heures de ma vie.


Acte 2 : Le Modèle Qui Ne Pouvait Pas

Première tentative : qwen2.5:7b — 7 milliards de paramètres respectables.

Temps pour répondre à "Dis OK" : 7 minutes.

Mon rice cooker chinois produit en masse a une vitesse d'inférence supérieure.


Acte 3 : La Trahison de la Fenêtre de Contexte

"Bon," me suis-je dit. "Je vais utiliser TinyLlama. C'est tiny. C'est un llama. Qu'est-ce qui peut foirer ?"

FailoverError: Model context window too small (2048 tokens). Minimum is 16000.

Clawdbot exige une capacité d'attention niveau doctorat. TinyLlama a la mémoire d'un poisson rouge.


Acte 4 : Le Modèle Boucle d'Or

Enfin : qwen2.5:1.5b

  • Taille : 986 MB (pas trop gros)
  • Contexte : 32k tokens (pas trop petit)
  • Vitesse : Répond vraiment avant que mon café refroidisse
  • Qualité : Hallucine un peu, mais qui ne le fait pas ?

La Config Qui Marche

{
"models": {
"mode": "merge",
"providers": {
"ollama": {
"baseUrl": "http://127.0.0.1:11434/v1",
"apiKey": "ollama-local",
"api": "openai-completions",
"models": [{
"id": "qwen2.5:1.5b",
"name": "Qwen 2.5 1.5B",
"reasoning": false,
"input": ["text"],
"contextWindow": 32768,
"maxTokens": 8192,
"cost": { "input": 0, "output": 0, "cacheRead": 0, "cacheWrite": 0 }
}]
}
}
},
"agents": {
"defaults": {
"model": { "primary": "ollama/qwen2.5:1.5b" }
}
}
}

Sauvegarder dans : ~/.clawdbot/clawdbot.json ET ~/.clawdbot/agents/main/agent/models.json

Oui, les deux. Ne demandez pas pourquoi.


Les Commandes Qui Marchent Vraiment

# Installer le modèle
ollama pull qwen2.5:1.5b

# Tester directement (éviter la complexité de la gateway)
clawdbot agent --agent main --local --message "Salut"

# Ou avec la gateway
clawdbot gateway &
clawdbot agent --agent main --message "Salut"

# TUI interactif
clawdbot tui


La Vérité Vraie

Ce qu'ils promettaient vs. ce que vous obtenez :

  • "IA gratuite" → Gratuite si votre temps ne vaut rien
  • "Confidentialité locale" → Effectivement vrai ✓
  • "Réponses rapides" → Dépend de votre définition de "rapide"
  • "Installation facile"api: "openai-completions" (pas "openai")

Devriez-Vous Faire Ça ?

Oui, si :

  • Vous avez un GPU (même modeste)
  • Vous aimez déboguer des configs à 2h du mat'
  • Vous privilégiez la confidentialité à la vitesse
  • Les tarifs des IA corporate vous révoltent

Non, si :

  • Vous avez un serveur patate CPU-only
  • Vous attendez des réponses niveau ChatGPT
  • Vous tenez à votre santé mentale

Les Vraies Specs Minimales

  • RAM : 8 GB minimum, 16 GB recommandés
  • Modèle : qwen2.5:1.5b minimum, qwen2.5:7b + GPU recommandé
  • Fenêtre de contexte : 16k+ requis
  • Patience : Infinie

Besoin d'un VPS Qui Peut Vraiment Gérer Ça ?

Si vous en avez marre de faire tourner l'IA sur une patate, un VPS correct change tout. Je recommande de commencer avec au moins 8GB de RAM et quelques cœurs CPU décents.

👉 Obtenez un VPS avec bonus supplémentaire ici


Écrit par quelqu'un qui a retry en masse des configs jusqu'à ce que quelque chose marche. De rien.


Dans les coulisses de l'implémentation OpenClaw : des heures de configuration, des modèles capricieux et enfin une victoire locale avec Qwen 2.5.

Rejoindre la newsletter de production AI