Hermes Agent: Die selbst-gehostete KI ist endlich erwachsen geworden. Hier ist das Zwei-VPS-Setup für unter 10$.
Letztes Wochenende habe ich Hermes Agent auf zwei VPS installiert. Eine brandneue Hostinger-Kiste per 1-Click-Docker. Meine bestehende Contabo-Box via SSH und einem einzigen curl-Befehl. Gleiche Modell-Konfiguration auf beiden Seiten: Sonnet 4.6 als Primary, DeepSeek V4 für Delegation. Zwei Installationsphilosophien. Beide liefern einen funktionierenden Agent, der binnen Minuten in Telegram antwortet.
TL;DR: Zwei Installationswege Ende-zu-Ende getestet (null Terminal versus pures SSH), ein Modell-Stack, der sich seit Februar komplett verschoben hat, ein architektonischer Schachzug, den Nous Research gemacht hat, während OpenClaw mit Patches beschäftigt war, und ein Community-Muster, das ich nicht erwartet hatte – wer tatsächlich migriert (und wer nicht).

Wer hier seit Februar mitliest, weiß, dass ich meine 15€/Monat OpenClaw-Migration nach dem Claude Max-Bann dokumentiert habe. Seitdem nicht mehr angefasst. Lief ja. Dann habe ich letzte Woche meine Meinung geändert. Anthropic hat am 4. April offiziell den Third-Party-Zugang zu Pro/Max gekappt. Der öffentliche OpenClaw CVE-Tracker überschritt am 10. die 138-Einträge-Marke. Nous Research lieferte am 13. Hermes v0.9 aus – ein Release, das mehr Pull Requests in einem Drop zusammenführte, als manche Projekte in einem Quartal schaffen. Dreifach-Treffer, gleiche Woche. Schwer zu ignorieren nach dem Punkt.
Der Moment, als mir klar wurde: Das ist ein anderes Kaliber
Fünf Minuten in die Contabo-Installation fragte mich der Wizard, welches Terminal-Backend ich wollte: local, Docker, SSH, Daytona, Singularity oder Modal. OpenClaw hat mir diese Frage nie gestellt. OpenClaw lief einfach. Was großartig war, bis nachmittags ein Skill versuchte, Temp-Dateien zu löschen und beinahe ein Verzeichnis erwischte, das ich lieber unberührt gelassen hätte. Dass Hermes die Isolation-Frage explizit stellt, bevor die Installation abgeschlossen ist, verrät dir, mit welcher Generation du es zu tun hast.
Genauso beim Auto-Detection-Schritt weiter unten im Wizard. Er scannte nach ~/.openclaw, fand meins und bot an, Skills, Memories und API-Keys zu importieren. Nicht in einem Migrations-Guide, den du an einem Dienstag lesen musst. Im Installer. Das ist jemand, der für einen spezifischen User designt hat (den, der OpenClaw verlässt) und die Rampe gebaut hat.
Zwei kleine Entscheidungen. Beide sagen dasselbe. Jemand hat sechs Monate OpenClaw beobachtet und sich Notizen gemacht.
Warum ich mir die Mühe gemacht habe: Was mir sechs Monate OpenClaw beigebracht haben
Erst mal Anerkennung, wo sie hingehört. OpenClaw hat die Self-Hosted-Agent-Kategorie definiert. 347k GitHub-Stars in sechs Monaten, ein Ökosystem aus 13k+ Community-gebauten Skills, ein Discord, der sich lebendig anfühlt. Ohne OpenClaw gäbe es kein Hermes, über das ich schreiben könnte. Der Prototyp hat die harte Arbeit geleistet, zu beweisen, dass die Kategorie real ist.
Aber ein Prototyp, der schnell wächst, sammelt Architektur-Schulden an. Drei Stellen, wo ich diese Schulden am eigenen Leib gespürt habe.
Die UX bricht Nicht-Geeks das Genick. Ich habe Abende damit verbracht, obskure Konfigurationsprobleme zu debuggen, die keinen Sinn ergaben, bis ich drei Discord-Threads und einen wütenden Medium-Post gelesen hatte. Shadow, OpenClaws offizieller Maintainer, sagte es direkt auf Discord (paraphrasiert): Wer keine Kommandozeile bedienen kann, sollte OpenClaw nicht verwenden. Wenn dir die Person, die das Produkt wartet, sagt, es sei ein Geek-Tool, glaub ihr.
Security wird gepatcht, nicht designed. Der öffentliche CVE-Tracker protokollierte über 138 Einträge in etwa zwei Monaten zwischen Februar und April 2026. Eine separate Exposure-Analyse von ARMO zählte etwa 135k öffentlich erreichbare OpenClaw-Instanzen, die Mehrheit ohne Authentifizierung. Reco flaggte eine Kampagne bösartiger Skills in den Hunderten. Microsofts Guidance im Februar, paraphrasiert: OpenClaw nicht auf Maschinen mit sensiblen Daten deployen. Das sind keine Bug-Zahlen. Das ist eine Architektur, die Inputs standardmäßig vertraut und ihre Zeit damit verbringt, zu patchen, wenn jemand das nächste Loch findet.
Governance ist turbulent. Drei Namensänderungen in zwölf Monaten (Clawdbot, Moltbot, OpenClaw). OpenAI-Übernahme Ende 2025. Für ein Tool, das ich drei Jahre lang laufen lassen will, ist das zu viel Wetter zum Durchsitzen.
Nichts davon zielt auf Peter Steinberger ab. Der Typ hat etwas Riesiges ausgeliefert und eine Kategorie definiert. Aber eine Architektur, die für einen Prototyp designed wurde, kann ihre Schulden nicht durch Patching überwinden, egal wie gewissenhaft das Patching ist.
Deshalb gibt es nächste Generationen.
Was Hermes zu einem Produkt macht, nicht zu einem Prototyp
Kurzer Kontext zu Nous Research. KI-Safety-Lab hinter den Hermes-, Nomos- und Psyche-Modellfamilien, seriöse Reputation in der Open-Weight-Crowd, MiniMax-Partnerschaft Anfang 2026 angekündigt. Hermes Agent startete im Februar, überschritt 64k+ GitHub-Stars in zwei Monaten, lieferte v0.9.0 am 13. April mit neun Releases in sieben Wochen aus. Aggressive Geschwindigkeit.
Vier architektonische Züge, die ich während der Installationen aus erster Hand beobachtet habe.
Security als Constraint behandelt. Tirith, der Pre-Execution-Scanner, inspiziert Shell-Befehle, bevor sie laufen. Sub-Agents leben in ihrem eigenen Namespace, jeder isoliert von den anderen und vom Host. Container werden gehärtet ausgeliefert mit read-only Root-Filesystem und gedropten Capabilities. Filesystem-Checkpoints passieren automatisch vor jeder destruktiven Operation, mit einem Rollback-Befehl, der tut, was er sagt. Null agent-spezifische CVEs bis dato laut The New Stack (paraphrasiert). Der Zug hier ist architektonisch, nicht kosmetisch.
Eine geschlossene Lernschleife. Nach komplexen Tasks (fünf oder mehr Tool-Calls) pausiert der Agent, evaluiert und schreibt einen wiederverwendbaren Skill (eine SKILL.md plus den dazugehörigen Code). Nous' eigener Benchmark (paraphrasiert) behauptet etwa 40% schnellere Performance bei Research-Tasks, sobald der Agent seine eigene Skill-Library aufgebaut hat. Ich sah den Mechanismus in Aktion, als ich ihn das erste Mal bat, eine wiederkehrende Aufgabe einzurichten. Er schrieb eine SKILL.md, die den Cron-plus-Auth-Tanz abdeckte, den er gerade herausgefunden hatte, sodass die nächste Cron-Anfrage von diesem Skill ausgeht statt von null. Fühlt sich beim ersten Mal komisch an. Nützlich ab Tag drei.
Eine standardisierte Runtime. Gleiche Dependency-Sets, gleiches Isolation-Modell, gleiches Verhalten über Linux, macOS, WSL2 und Android via Termux. Die Runtime driftet nicht, je nachdem wo du deployest (lokale Dev-Maschine, 5€-VPS, Bare-Metal-Homelab, ein Handy), was offensichtlich klingt, bis du versuchst, eine gedriftete OpenClaw-Installation aus dem Gedächtnis auf einer neuen Box um 23 Uhr zu rebuilden. Kein natives Windows, kein Impact auf mich oder 95% der Leser hier.
Ein modell-agnostisches Routing-Layer. Nous Portal OAuth (400+ Modelle), OpenRouter (200+), direktes Anthropic/OpenAI, Ollama lokal, vLLM, SGLang. Primary oder Delegation mit einem einzigen hermes model-Befehl wechseln. Keine Code-Änderung, kein Restart, keine Reconfig. Ein neues Modell auf einer spezifischen Aufgabe zu testen dauert etwa zwei Sekunden.
The New Stack paraphrasierte die Wette treffend: OpenClaw optimierte für Ökosystem-Breite, Hermes optimiert für Lern-Tiefe. Verschiedene architektonische Wetten, keine universell richtig. Hermes passt zum Use Case, wo du willst, dass das Ding über Zeit kompoundiert.
Installationsweg Eins: Hostinger (Null Terminal)
KVM 2 Plan-Specs: 2 vCPU, 8 GB RAM, 100 GB NVMe, 8 TB Bandwidth, Ubuntu 24.04 LTS. Preis: 8,99€/Monat. Vorkonfiguriertes Hermes Agent Template im Docker-Katalog. Null Docker auf deiner Seite zu installieren.
Wie es lief. hPanel → Docker Manager → Catalog → "Hermes Agent" in die Suche getippt → Select → Deploy. Das Template fragte während des Deployments nach dem Provider-API-Key. Ich fügte meinen OpenRouter-Key ein (ein Key handhabt Sonnet 4.6, DeepSeek V4 und die Fallbacks). Unter fünfzehn Minuten vom Deploy-Klick zum ersten "Hi" in Telegram, und das meiste davon war die VPS-Provisionierung selbst.
Keine echte Reibung. Der Wizard ist das, worin Hostinger schon immer gut war: eigensinnige Defaults, minimale Fragen, funktioniert.
Ein Detail, das erwähnenswert ist. Derselbe Hostinger-Katalog bietet auch OpenClaw als 1-Click-Template an. Keine kommerzielle Entscheidung meinerseits. Eine User-Choice im gleichen Store. Provider bleibt neutral.
Für wen dieser Weg ist: den Leser, der meine OpenClaw-Artikel verfolgt hat, der Hermes testen will, ohne sich in systemd, ufw und Docker-Networking zu vertiefen. Null Terminal Ende zu Ende. Deploy, Key einfügen, chatten.
Hostinger Docker-Katalog Hermes Agent Template.
Installationsweg Zwei: Contabo (Hatte ich schon eine)
Meine Contabo-Box läuft schon eine Weile, handhabt WooCommerce-Store-Ops plus eine Handvoll Partner-Webhooks, mit Traefik davor. Ich wollte sehen, ob Hermes auf eine bestehende Box ohne Drama draufpassen würde.
Cloud VPS 10 Specs: 3 vCPU, 8 GB RAM, 75 GB NVMe. Preis: 4,95€/Monat, gleicher Preis in Jahr 1, 2 und 3. Keine Renewal-Überraschung. Das ist der Teil, zu dem ich immer wieder zurückkomme.
Wie es lief. SSH rein als regulärer User mit sudo-Rechten (nicht root, und ja, darauf kommen wir zurück). Dann der offizielle One-Liner von Nous Research (wörtlich):
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
Obligatorisches Geständnis: Ja, das ist curl | bash, das Muster, über das jeder Sysadmin seit einem Jahrzehnt schreit. Auf einer Box, die einen echten E-Commerce-Store betreibt. Lies das Script, bevor du es ausführst. Hab ich gemacht. Solltest du auch. Der Installer selbst ist sauber, handhabt Python 3.11, Node.js, uv, ripgrep, ffmpeg eigenständig und berührt nie etwas außerhalb des Hermes-Arbeitsverzeichnisses. Trotzdem, wenn dir das Wort "curl bash" gerade einen Ausschlag verpasst hat, clone das Repo und führe die Installation von einem lokalen Checkout aus. Funktioniert genauso.
Dann der interaktive Wizard. Entscheidungen, die tatsächlich wichtig sind: LLM-Provider → Modell → TTS (ich nahm Edge TTS, kostenlos) → Terminal-Backend (Docker, für Isolation, aus den sechs Optionen) → Messaging-Arbeitsverzeichnis → sudo-Support → max Tool-Iterationen → Tool-Progress-Display → Session-Reset-Modus → Messaging-Plattform (Telegram).
Zehn Fragen, vielleicht fünfzehn. Sie zu lesen schlägt sie zu überspringen, weil allein die Terminal-Backend-Wahl der Unterschied zwischen "Agent in einer Sandbox" und "Agent mit den Küchenschlüsseln" ist.
Der Auto-Detection-Schritt ist der, den ich flaggen will. Weil ich ~/.openclaw auf derselben VPS liegen hatte, bot der Wizard an, meine bestehenden Skills, Memories, Settings und API-Keys in einem Zug zu importieren. Hab ich genommen. Drei Sekunden, fertig. Was auch immer OpenClaw meinem Agent über sechs Monate beigebracht hat, sitzt jetzt in Hermes, was mir erspart, die Personalisierungsschicht von null zu rebuilden. Wenn du kein OpenClaw auf der Box hast, überspringt der Wizard diesen Schritt einfach und macht weiter.
Eine dokumentierte Falle, nicht zu verpassen. Wenn du bereits einen Telegram-Bot unter OpenClaw laufen hast, verwende NICHT dessen Token wieder. Erstelle einen NEUEN Bot via BotFather oder beide brechen. Eine YouTube-Demo von Anfang April lief direkt hinein vor der Kamera (paraphrasiert, Quelle unten). Kostenlose Lektion, courtesy von jemand anderes' Fehler.
Unter zwanzig Minuten insgesamt zu einem funktionierenden Agent auf Telegram, das meiste davon damit verbracht, die Wizard-Fragen sorgfältig zu lesen statt Enter zu hämmern.
Die Contabo-Argumente, kondensiert. RAM-per-Dollar ist unschlagbar bei etwa 0,50€/GB (zum Vergleich, du bist bei etwa 6€/GB auf DigitalOcean). Volle OS-Kontrolle (Ubuntu 22/24, Debian, Rocky, CentOS). Rechenzentren über Europa, Asien, die Amerikas, Australien. Ein CLI-Wizard, der dir beibringt, was er installiert, statt es hinter einem Panel zu verstecken. Gleicher Preis über drei Jahre.
Für wen dieser Weg ist: den Leser, der die Befehle verstehen will, die gelaufen sind, der bereits andere Services hostet, der in Drei-bis-Fünf-Jahre-Chunks plant statt in Dreißig-Tage-Ones.
Der Modell-Stack (Zwei Monate später, alles verschoben)
In meinem Februar-Artikel lief ich Kimi K2.5 + MiniMax + GLM-4.7-Flash. Optimaler Stack für OpenClaw zu der Zeit. Für Hermes verschob sich die Landschaft und meine Prioritäten verschoben sich mit.
Technischer Kontext zuerst. Hermes v0.9 trägt einen fixen Per-API-Call-Overhead von etwa 73% (Tool-Definitionen um 8.700 Token, System-Prompt um 5.200 Token). Im Telegram-Modus klettert der Overhead auf 15-20K Token pro Nachricht, zwei bis drei Mal CLI-Modus, laut Nous' eigenen Docs. In diesem Kontext wird zuverlässiges Tool-Calling zum kritischen Faktor. Ein billiges Modell, das Tool-Calls verfehlt, loopt in Fehler und verbrennt mehr Token als ein Premium-Modell, das sauber läuft.
Echte Config nach zwei Wochen Iteration:
provider: openrouter
model: anthropic/claude-sonnet-4-6 # primary
delegation:
model: deepseek/deepseek-v4
provider: openrouter
Claude Sonnet 4.6 (3$/15$ per Million Input/Output-Token) als Primary. Konsens-Pick in der Hermes-in-Production-Community gerade (r/LocalLLaMA-Threads, r/singularity, Berkeley Function Calling Leaderboard). Zuverlässiges Tool-Calling, solides Multi-Step-Reasoning, keine Error-Spiralen. DeepSeek V4 (0,30$/0,50$) als Delegation. 90% Cache-Discount macht den Overhead nahezu kostenlos. Um 90% von Claudes Qualität bei Sub-Agent-Tasks. Ehrlicher Caveat: DeepSeeks Infra wirft 503s zu Stoßzeiten, Fallback ist sauber (Delegation fällt sauber zurück auf Primary ohne Drama).
Modelle zu vermeiden. GPT-5.4 Mini, "schrecklich beim Tool-Calling" laut expliziter r/LocalLLaMA-Warnung. MiniMax 2.5 war unbrauchbar, 2.7 fixte es. Qwen 3.x für Tool-Calling bricht Parsing wegen der <think>-Tags. Pure Reasoning-Modelle reden sich aus der Tool-Nutzung heraus. Frag mich nicht warum, sie tun es einfach.
Echte monatliche Kosten hängen von deinem Usage-Pattern ab. Bei etwa 10 Nachrichten pro Tag landest du wahrscheinlich um 15-25€ all-in. Bei 30 pro Tag, näher an 40-70€. Bei 50+, 80-120€. Der Telegram-Overhead ist die Variable, die die Nadel bewegt.
Fallback-Plan, falls etwas entgleist: hermes model, Primary auf DeepSeek V4 wechseln, sofort wirksam, keine Reconfig. Sicherheitsnetz ist ein Befehl.
Meine SOUL.md öffnet mit den vier Integritätszeilen aus meinem Prompt-Vertrag. Nie lügen. Nie die Wahrheit verstecken. Nie ein Problem verschleiern. Nie stumm versagen. Dieselbe Klausel, die oben auf meiner alten OpenClaw CLAUDE.md saß. Sie macht das Dashboard immer noch gelb statt fake-grün, und ich bevorzuge immer noch gelb.
Was Hermes noch nicht kann (Ehrlich)
Vier Caveats, die es wert sind, klar ausgesprochen zu werden.
Anthropic OAuth funktioniert NICHT nativ. Wenn du Claude-first bist (ich, wahrscheinlich du), brauchst du OpenRouter oder einen direkten Anthropic-API-Key. Pro- und Max-Abonnements decken das Web-Interface ab, nicht die API, also kannst du sie sowieso nicht in einen Agent einstecken. Die echte Reibung ist, eine separate Pay-as-you-go-Balance auf OpenRouter oder der Anthropic-Konsole zusätzlich zu welchem Web-Abo auch immer du bereits zahlst, verwalten zu müssen. Zwei Rechnungen, zwei Dashboards, eine Usage zu monitoren. Größter Caveat auf meiner Liste gerade.
Das Skills-Ökosystem ist jung. Kein ClawHub-Äquivalent mit 13k+ Community-gebauten Skills. Hermes erstellt seine eigenen Skills durch die Lernschleife, aber du startest ohne geteilte Library. Der Compounding-Effekt braucht zwei bis vier Wochen, um sichtbar zu werden, basierend auf dem, was ich beobachtet habe und was r/LocalLLaMA berichtet.
v0.9 ist fünf Tage alt. Hermes ist insgesamt zwei Monate alt. CVEs werden kommen (keine Architektur ist immun). Das Design sollte sie weniger katastrophal halten. Nous' aggressive Geschwindigkeit bedeutet auch eine massive Änderungsoberfläche, was eine massive Bug-Oberfläche bedeutet. Ein Release, das Hunderte von PRs merged, ist keine ruhige Zahl.
Und eine Community-Nuance, die wichtig ist. Power-User migrieren nicht. Sie laufen beide parallel via ACP-Protokoll (OpenClaw als Orchestrator, Hermes als Execution-Specialist). Quelle: eine Kilo-Analyse von r/openclaw-Threads, paraphrasiert. Vollmigration ist nicht der einzig gültige Weg. Ich laufe nicht dual, aber ich sage dir auch nicht, es nicht zu tun.
Hermes ist architektonisch überlegen. Darauf werde ich bestehen. Aber es ist ein zwei Monate altes Produkt, kein Messias. Entsprechend temperieren.
Wer das tatsächlich machen sollte
Vier schnelle Segmente, damit du nicht bei der Entscheidung schielen musst.
Wenn du neu bei Self-Hosted-Agents bist, geh direkt Hermes via Hostinger 1-Click. Keine OpenClaw-Schulden zu migrieren. Sonnet 4.6 + DeepSeek V4 auf OpenRouter. Etwa 15-25€/Monat all-in für persönliche Nutzung.
Wenn du bereits OpenClaw mit stabilem Setup laufen hast, dual-run via ACP statt migrieren. OpenClaw orchestriert weiter deine Automatisierungen, Hermes läuft als Execution-Specialist bei neuen Tasks. Der Hermes-Wizard erkennt ~/.openclaw und bietet an, die Personalisierungsschicht zu importieren, was bedeutet, dass die Kosten des Ausprobierens praktisch null sind.
Wenn du post-Claude-Max-Bann migriert bist (mein Fall, Februar), ist es Hermes + OpenRouter + Sonnet 4.6 + DeepSeek V4. Direktes Upgrade vom alten Kimi/MiniMax-Stack. Gleiche Preisrange, bessere Tool-Calling-Zuverlässigkeit.
Für kritische Production, warten. v1.0 oder drei Monate v0.x-Stabilität. Für persönliche Nutzung oder Side-Projects ist es jetzt in Ordnung. Für deines Kunden Prod ist es das nicht.
Dein Kunde zahlt dich dafür, langweilig über deren Uptime zu sein.
Ich habe Installations-Notizen zu beiden Wegen gemacht, während ich sie durchging. Falls Interesse besteht, werde ich sie zu einem ordentlichen Guide aufräumen: die 2-Wege-Checkliste, das SOUL.md-Integritäts-Template, die Sonnet 4.6 / DeepSeek V4-Config. Sag es in den Kommentaren.
In drei Monaten wird Hermes seine eigenen CVEs haben. Jede Architektur endet mit welchen. Das ist nicht die Frage.
OpenClaw hatte sechs Monate. Es nahm die Schulden auf sich. Hermes schaute sich diese Schulden zuerst an. Guter Prototyp. Aber ehrlich, Zeit mit Debugging zu verbringen (auch mit Claude) ist nicht meine Leidenschaft. Ich baue lieber. C'est la vie 😊
Quellen
- Öffentlicher OpenClaw CVE-Tracker (GitHub, April 2026)
- ARMO Exposure-Analyse zu OpenClaw-Instanzen (Februar 2026)
- Reco Kampagnen-Report zu bösartigen OpenClaw-Skills (März 2026)
- Nous Research Hermes Agent Dokumentation und v0.9 Release Notes (April 2026)
Dieser Artikel kann Affiliate-Links enthalten. Ich erhalte möglicherweise eine kleine Provision, wenn du über sie kaufst.
(*) Das Cover ist KI-generiert. Midjourney warf einen Blick auf den Hermes-Launch-Schedule und gab mir die Schuld für die Deadline.