Hermes Agent: La IA Autoalojada Que Por Fin Maduró. Aquí Está la Configuración de Dos VPS por Menos de $10

13 min read

El fin de semana pasado instalé Hermes Agent en dos VPS. Una máquina Hostinger nueva con Docker en un clic. Mi servidor Contabo existente vía SSH y un solo comando curl. La misma configuración de modelos en ambos: Sonnet 4.6 como principal, DeepSeek V4 para delegación. Dos filosofías de instalación. Ambas entregan un agente funcional que responde en Telegram en cuestión de minutos.

TL;DR: Dos rutas de instalación probadas de principio a fin (cero terminal versus SSH puro), un stack de modelos que cambió completamente desde febrero, una decisión arquitectónica que Nous Research tomó mientras OpenClaw estaba ocupado parcheando, y un patrón comunitario que no esperaba sobre quién está migrando realmente (y quién no).

Cómic de cubículo de oficina de los 90s mostrando desarrollador frustrado rodeado de caos de documentación versus desarrollador tranquilo con ventana de terminal limpia mostrando instalación exitosa
Tu migración de OpenClaw vs. literalmente cualquiera usando Hermes.

Si has estado leyendo aquí desde febrero, sabes que documenté mi migración a OpenClaw por $15/mes después del ban de Claude Max. No lo había tocado desde entonces. Funcionaba. Luego la semana pasada cambié de opinión. Anthropic oficialmente retiró el acceso de terceros a Pro/Max el 4 de abril. El tracker público de CVEs de OpenClaw superó las 138 entradas el día 10. Nous Research lanzó Hermes v0.9 el día 13, una versión que fusionó más pull requests de una vez que algunos proyectos lanzan en un trimestre. Triple golpe, misma semana. Difícil seguir ignorándolo después de eso.

El Momento en que Supe que Era una Bestia Diferente

Cinco minutos después de empezar la instalación en Contabo, el asistente me preguntó qué backend de terminal quería: local, Docker, SSH, Daytona, Singularity, o Modal. OpenClaw nunca me hizo esa pregunta. OpenClaw simplemente funcionaba. Lo cual estuvo genial hasta la tarde en que una habilidad intentó limpiar archivos temporales y casi tocó un directorio que prefería que no tocara. Que Hermes haga explícita la pregunta de aislamiento, antes de completar la instalación, te dice con qué generación estás tratando.

Lo mismo con el paso de auto-detección más adelante en el asistente. Escaneó buscando ~/.openclaw, vio el mío, y ofreció importar habilidades, memorias y claves API. No en una guía de migración que tienes que leer un martes. En el instalador. Eso es alguien que diseñó para un usuario específico (el que se va de OpenClaw) y construyó la rampa.

Dos decisiones pequeñas. Ambas dicen lo mismo. Alguien observó seis meses de OpenClaw y tomó notas.

Por Qué Me Molesté: Lo Que Seis Meses de OpenClaw Me Enseñaron

Primero, crédito donde se debe. OpenClaw definió la categoría de agentes auto-hospedados. 347k estrellas en GitHub en seis meses, un ecosistema de más de 13k habilidades construidas por la comunidad, un Discord que se siente vivo. Sin OpenClaw, no habría Hermes sobre el cual escribir. El prototipo hizo el trabajo difícil de probar que la categoría era real.

Pero un prototipo que crece rápido acumula deuda arquitectónica. Tres lugares donde sentí esa deuda de primera mano.

La UX rompe a los no-geeks. He pasado tardes depurando problemas de configuración oscuros que no tenían sentido hasta que había leído tres hilos de Discord y un post enojado en Medium. Shadow, el mantenedor oficial de OpenClaw, lo dijo directamente en Discord (parafraseado): si no puedes usar una línea de comandos, no deberías estar usando OpenClaw. Cuando la persona que mantiene el producto te dice que es una herramienta para geeks, créele.

La seguridad se parchea, no se diseña. El tracker público de CVEs registró más de 138 entradas en aproximadamente dos meses entre febrero y abril de 2026. Un análisis de exposición separado de ARMO contó aproximadamente 135k instancias de OpenClaw públicamente accesibles, la mayoría sin autenticación. Reco marcó una campaña de habilidades maliciosas en los cientos. La guía de Microsoft en febrero, parafraseada: no despliegues OpenClaw en máquinas que contengan datos sensibles. Estos no son conteos de bugs. Esta es una arquitectura que confía en las entradas por defecto y pasa su tiempo parcheando cuando alguien encuentra el siguiente agujero.

La gobernanza es turbulenta. Tres cambios de nombre en doce meses (Clawdbot, Moltbot, OpenClaw). Adquisición de OpenAI a finales de 2025. Para una herramienta que quiero mantener funcionando tres años, eso es demasiado clima para aguantar.

Nada de esto apunta a Peter Steinberger. El tipo lanzó algo enorme y definió una categoría. Pero una arquitectura diseñada para un prototipo no puede superar su deuda a través de parches, sin importar qué tan diligentes sean los parches.

Por eso existen las siguientes generaciones.

Lo Que Hace de Hermes un Producto, No un Prototipo

Contexto rápido sobre Nous Research. Laboratorio de seguridad de IA detrás de las familias de modelos Hermes, Nomos y Psyche, reputación seria en la multitud de peso abierto, asociación con MiniMax anunciada a principios de 2026. Hermes Agent se lanzó en febrero, superó las 64k+ estrellas en GitHub en dos meses, lanzó v0.9.0 el 13 de abril con nueve versiones en siete semanas. Velocidad agresiva.

Cuatro movimientos arquitectónicos que observé de primera mano durante las instalaciones.

Seguridad tratada como una restricción. Tirith, el escáner pre-ejecución, inspecciona comandos de shell antes de que se ejecuten. Los sub-agentes viven en su propio espacio de nombres, cada uno aislado de los otros y del host. Los contenedores se envían endurecidos con sistema de archivos raíz de solo lectura y capacidades eliminadas. Los puntos de control del sistema de archivos ocurren automáticamente antes de cualquier operación destructiva, con un comando de rollback que hace lo que dice. Cero CVE específicos del agente hasta la fecha según The New Stack (parafraseado). El movimiento aquí es arquitectónico, no cosmético.

Un bucle de aprendizaje cerrado. Después de tareas complejas (cinco o más llamadas a herramientas), el agente pausa, evalúa, y escribe una habilidad reutilizable (un SKILL.md más el código que va con él). El propio benchmark de Nous (parafraseado) afirma aproximadamente 40% de rendimiento más rápido en tareas de investigación una vez que el agente ha construido su propia biblioteca de habilidades. Vi el mecanismo en acción la primera vez que le pedí que configurara una tarea recurrente. Escribió un SKILL.md cubriendo la danza de cron-más-auth que acababa de resolver, así que la siguiente solicitud de cron comienza desde esa habilidad en lugar de desde cero. Se siente raro la primera vez. Útil para el día tres.

Un runtime estandarizado. Mismo conjunto de dependencias, mismo modelo de aislamiento, mismo comportamiento a través de Linux, macOS, WSL2, y Android vía Termux. El runtime no deriva dependiendo de dónde despliegues (máquina de desarrollo local, VPS de $5, homelab bare-metal, un teléfono), lo cual suena obvio hasta que intentas reconstruir una instalación de OpenClaw derivada de memoria en una nueva caja a las 11pm. Sin Windows nativo, sin impacto en mí o el 95% de los lectores aquí.

Una capa de enrutamiento agnóstica al modelo. Nous Portal OAuth (400+ modelos), OpenRouter (200+), Anthropic/OpenAI directo, Ollama local, vLLM, SGLang. Cambia principal o delegación con un solo comando hermes model. Sin cambio de código, sin reinicio, sin reconfiguración. Probar un nuevo modelo en una tarea específica toma aproximadamente dos segundos.

The New Stack parafraseó la apuesta limpiamente: OpenClaw optimizó para amplitud de ecosistema, Hermes optimiza para profundidad de aprendizaje. Apuestas arquitectónicas diferentes, ninguna universalmente correcta. Hermes encaja en el caso de uso donde quieres que la cosa se componga con el tiempo.

Ruta de Instalación Uno: Hostinger (Cero Terminal)

Especificaciones del plan KVM 2: 2 vCPU, 8 GB RAM, 100 GB NVMe, 8 TB ancho de banda, Ubuntu 24.04 LTS. Precio: $8.99/mes. Plantilla preconfigurada de Hermes Agent en el catálogo de Docker. Cero Docker que instalar de tu lado.

Cómo fue. hPanel → Docker Manager → Catálogo → escribí "Hermes Agent" en la búsqueda → Seleccionar → Desplegar. La plantilla pidió la clave API del proveedor durante el despliegue. Pegué mi clave de OpenRouter (una clave maneja Sonnet 4.6, DeepSeek V4, y los respaldos). Menos de quince minutos desde hacer clic en Desplegar hasta el primer "Hola" en Telegram, y la mayor parte de eso fue el VPS aprovisionándose a sí mismo.

Sin fricción real. El asistente es en lo que Hostinger siempre ha sido bueno: defaults con opinión, preguntas mínimas, funciona.

Un detalle que vale la pena notar. El mismo catálogo de Hostinger también ofrece OpenClaw como una plantilla de 1-clic. No es una elección comercial de mi parte. Una elección del usuario en la misma tienda. El proveedor se mantiene neutral.

Para quién es esta ruta: el lector que siguió mis artículos de OpenClaw, que quiere probar Hermes sin meterse en systemd, ufw, y redes de Docker. Cero terminal de principio a fin. Despliega, pega clave, chatea.

Plantilla de Hermes Agent en catálogo Docker de Hostinger.

Ruta de Instalación Dos: Contabo (Ya Tenía Uno)

Mi caja de Contabo ha estado funcionando por un tiempo ya, manejando operaciones de tienda WooCommerce más un puñado de webhooks de socios, con Traefik al frente. Quería ver si Hermes se instalaría en una caja existente sin drama.

Especificaciones Cloud VPS 10: 3 vCPU, 8 GB RAM, 75 GB NVMe. Precio: $4.95/mes, mismo precio en año 1, 2, y 3. Sin sorpresa de renovación. Esa es la parte a la que sigo volviendo.

Cómo fue. SSH como usuario regular con derechos sudo (no root, y sí volveremos a eso). Luego el one-liner oficial de Nous Research (textual):

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

Confesión obligatoria: sí, esto es curl | bash, el patrón sobre el que cada sysadmin ha estado gritando por una década. En una caja que ejecuta una tienda de ecommerce real. Lee el script antes de ejecutarlo. Yo lo hice. Tú también deberías. El instalador en sí está limpio, maneja Python 3.11, Node.js, uv, ripgrep, ffmpeg por su cuenta, y nunca toca nada fuera del directorio de trabajo de Hermes. Dicho eso, si las palabras "curl bash" te dieron sarpullido justo ahora, clona el repo y ejecuta la instalación desde un checkout local. Funciona igual.

Luego el asistente interactivo. Elecciones que realmente importan: proveedor LLM → modelo → TTS (elegí Edge TTS, gratis) → backend de terminal (Docker, para aislamiento, de las seis opciones) → directorio de trabajo de mensajería → soporte sudo → máximo iteraciones de herramientas → visualización de progreso de herramientas → modo de reset de sesión → plataforma de mensajería (Telegram).

Diez preguntas, tal vez quince. Leerlas es mejor que saltárselas, porque solo la elección del backend de terminal es la diferencia entre "agente en un sandbox" y "agente con las llaves de la cocina".

El paso de auto-detección es el que quiero señalar. Porque tenía ~/.openclaw en este mismo VPS, el asistente ofreció importar mis habilidades, memorias, configuraciones y claves API existentes de una vez. Lo tomé. Tres segundos, listo. Lo que sea que OpenClaw le enseñó a mi agente durante seis meses ahora está en Hermes, lo cual me ahorra reconstruir la capa de personalización desde cero. Si no tienes OpenClaw en la caja, el asistente simplemente salta ese paso y continúa.

Una trampa documentada, que no debe perderse. Si ya ejecutas un bot de Telegram bajo OpenClaw, NO reutilices su token. Crea un bot NUEVO vía BotFather o ambos se rompen. Una demo de YouTube de principios de abril cayó directo en eso en cámara (parafraseado, fuente abajo). Lección gratis, cortesía del error de alguien más.

Menos de veinte minutos total para un agente funcional en Telegram, la mayor parte gastada leyendo las preguntas del asistente cuidadosamente en lugar de aplastar Enter.

Los argumentos de Contabo, condensados. RAM-por-dólar es imbatible en aproximadamente $0.50/GB (para referencia, estás alrededor de $6/GB en DigitalOcean). Control completo del OS (Ubuntu 22/24, Debian, Rocky, CentOS). Centros de datos a través de Europa, Asia, las Américas, Australia. Un asistente CLI que te enseña lo que está instalando en lugar de ocultarlo detrás de un panel. Mismo precio durante tres años.

Para quién es esta ruta: el lector que quiere entender los comandos que se ejecutaron, que ya hospeda otros servicios, que planifica en chunks de tres-a-cinco-años en lugar de treinta días.

Contabo Cloud VPS 10.

El Stack de Modelos (Dos Meses Después, Todo Cambió)

En mi artículo de febrero estaba ejecutando Kimi K2.5 + MiniMax + GLM-4.7-Flash. Stack óptimo para OpenClaw en ese momento. Para Hermes, el panorama se movió y mis prioridades se movieron con él.

Contexto técnico primero. Hermes v0.9 lleva un overhead fijo por llamada API de aproximadamente 73% (definiciones de herramientas alrededor de 8,700 tokens, prompt del sistema alrededor de 5,200 tokens). En modo Telegram el overhead sube a 15-20K tokens por mensaje, dos a tres veces el modo CLI, según los propios docs de Nous. En ese contexto, llamadas confiables a herramientas se convierte en el factor crítico. Un modelo barato que falla en llamadas a herramientas entra en bucle de error y quema más tokens que un modelo premium ejecutándose limpio.

Configuración real después de dos semanas de iteración:

provider: openrouter
model: anthropic/claude-sonnet-4-6    # primary

delegation:
  model: deepseek/deepseek-v4
  provider: openrouter

Claude Sonnet 4.6 ($3/$15 por millón de tokens de entrada/salida) como principal. Elección de consenso en la comunidad Hermes-en-producción ahora mismo (hilos de r/LocalLLaMA, r/singularity, Berkeley Function Calling Leaderboard). Llamadas confiables a herramientas, razonamiento multi-paso sólido, sin espirales de error. DeepSeek V4 ($0.30/$0.50) como delegación. 90% de descuento en caché hace el overhead casi gratis. Alrededor del 90% de la calidad de Claude en tareas de sub-agentes. Advertencia honesta: la infra de DeepSeek arroja 503s en horas pico, el fallback es limpio (la delegación vuelve al principal sin drama).

Modelos a evitar. GPT-5.4 Mini, "terrible en llamadas a herramientas" por advertencia explícita de r/LocalLLaMA. MiniMax 2.5 era inutilizable, 2.7 lo arregló. Qwen 3.x para llamadas a herramientas rompe el parsing por las etiquetas <think>. Los modelos de razonamiento puro se convencen a sí mismos de no usar herramientas. No me preguntes por qué, simplemente lo hacen.

El costo mensual real depende de tu patrón de uso. En aproximadamente 10 mensajes por día, probablemente aterrizarás alrededor de $15-25 todo incluido. En 30 por día, más cerca de $40-70. En 50+, $80-120. El overhead de Telegram es la variable que mueve la aguja.

Plan de respaldo si algo descarrila: hermes model, cambiar principal a DeepSeek V4, efectivo inmediatamente, sin reconfiguración. La red de seguridad es un comando.

Mi SOUL.md abre con las cuatro líneas de integridad de mi contrato de prompt. Nunca mentir. Nunca ocultar la verdad. Nunca esconder un problema. Nunca fallar silenciosamente. La misma cláusula que estaba en la parte superior de mi viejo CLAUDE.md de OpenClaw. Todavía hace el dashboard amarillo en lugar de verde-falso, y todavía prefiero amarillo.

Lo Que Hermes No Hace Aún (Honestamente)

Cuatro advertencias que vale la pena declarar claramente.

Anthropic OAuth NO funciona nativamente. Si eres Claude-primero (yo, probablemente tú), necesitas OpenRouter o una clave API directa de Anthropic. Las suscripciones Pro y Max cubren la interfaz web, no la API, así que no puedes conectarlas a un agente de todos modos. La fricción real es tener que manejar un balance separado de pago-por-uso en OpenRouter o la consola de Anthropic encima de cualquier suscripción web que ya pagues. Dos facturas, dos dashboards, un uso que monitorear. La advertencia más grande en mi lista ahora mismo.

El ecosistema de habilidades es joven. Sin equivalente a ClawHub con más de 13k habilidades construidas por la comunidad. Hermes crea sus propias habilidades a través del bucle de aprendizaje, pero empiezas sin una biblioteca compartida. El efecto de composición toma de dos a cuatro semanas en volverse visible, basado en lo que observé y lo que reporta r/LocalLLaMA.

v0.9 tiene cinco días. Hermes tiene dos meses en total. Los CVEs vendrán (ninguna arquitectura es inmune). El diseño debería mantenerlos menos catastróficos. La velocidad agresiva de Nous también significa una superficie masiva de cambio, lo que significa una superficie masiva de bugs también. Una versión que fusiona cientos de PRs no es un número tranquilo.

Y un matiz comunitario que importa. Los usuarios avanzados no están migrando. Están ejecutando ambos en paralelo vía el protocolo ACP (OpenClaw como orquestador, Hermes como especialista en ejecución). Fuente: un análisis Kilo de hilos de r/openclaw, parafraseado. La migración completa no es la única ruta válida. No estoy ejecutando dual, pero tampoco te estoy diciendo que no lo hagas.

Hermes es arquitectónicamente superior. Me mantendré en eso. Pero es un producto de dos meses, no un mesías. Templa en consecuencia.

Quién Debería Realmente Hacer Esto

Cuatro segmentos rápidos para que no tengas que entrecerrar los ojos en la decisión.

Si eres nuevo en agentes auto-hospedados, ve Hermes directo vía el 1-clic de Hostinger. Sin deuda de OpenClaw que migrar. Sonnet 4.6 + DeepSeek V4 en OpenRouter. Aproximadamente $15-25/mes todo incluido para uso personal.

Si ya ejecutas OpenClaw con una configuración estable, dual-ejecuta vía ACP en lugar de migrar. OpenClaw sigue orquestando tus automatizaciones, Hermes ejecuta como especialista en ejecución en tareas nuevas. El asistente de Hermes detecta ~/.openclaw y ofrece importar la capa de personalización, lo que significa que el costo de probar es básicamente cero.

Si migraste post-ban-de-Claude-Max (mi caso, febrero), es Hermes + OpenRouter + Sonnet 4.6 + DeepSeek V4. Actualización directa del viejo stack Kimi/MiniMax. Mismo rango de precio, mejor confiabilidad en llamadas a herramientas.

Para producción crítica, espera. v1.0 o tres meses de estabilidad v0.x. Para uso personal o proyectos secundarios, está bien ahora. Para la prod de tu cliente, no lo está.

Tu cliente te paga para ser aburrido sobre su uptime.

Tomé notas de instalación en ambas rutas mientras las hacía. Si hay interés, las limpiaré en una guía apropiada: el checklist de 2-rutas, la plantilla de integridad SOUL.md, la configuración Sonnet 4.6 / DeepSeek V4. Dilo en los comentarios.


Tres meses a partir de ahora, Hermes tendrá sus propios CVEs. Toda arquitectura termina con algunos. Esa no es la pregunta.

OpenClaw tuvo seis meses. Asumió la deuda. Hermes miró esa deuda primero. Buen prototipo. Pero honestamente, pasar tiempo depurando (incluso con Claude) no es mi pasión. Prefiero estar construyendo. C'est la vie 😊

Fuentes

  • Tracker público de CVEs de OpenClaw (GitHub, abril 2026)
  • Análisis de exposición ARMO sobre instancias OpenClaw (febrero 2026)
  • Reporte de campaña Reco sobre habilidades maliciosas de OpenClaw (marzo 2026)
  • Documentación de Nous Research Hermes Agent y notas de versión v0.9 (abril 2026)

Este artículo puede contener enlaces de afiliados. Puedo ganar una pequeña comisión si compras a través de ellos.

(*) La portada es generada por IA. Midjourney echó un vistazo al cronograma de lanzamiento de Hermes y me culpó por la fecha límite.