7 Hábitos Contraintuitivos de Desarrollo del Creador de OpenClaw Que Te Harán Lanzar Como un Loco — 6,600 Commits

11 min read

¿Cuándo fue la última vez que leíste cada línea de código antes de hacer deploy?

No lo hojeaste por encima. No echaste un vistazo al diff durante 4 segundos antes de darle a "aprobar". Lo leíste de verdad, línea por línea, entendiste cada función, cada caso límite.

Si tu respuesta es "ayer" — genial, eres meticuloso. También eres jodidamente lento.

Peter Steinberger — el tipo que construyó OpenClaw, el repo de más rápido crecimiento en la historia de GitHub (más de 180,000 estrellas), el proyecto que OpenAI y Meta se pelean por adquirir — hizo 6,600 commits en enero de 2026. Solo. Sin equipo. A partir de hoy, acaba de unirse a OpenAI para liderar su próxima generación de agentes personales. Sam Altman lo llamó "un genio." OpenClaw pasa a una fundación y se mantiene open-source.

¿Su lema? "Hago deploy de código que no leo."

Esa frase suena temeraria hasta que ves los resultados. Y entonces empiezas a preguntarte — ¿cuántas de las "mejores prácticas" que sigues cada día son en realidad solo hábitos que nunca cuestionaste?

Pasé dos semanas probando el enfoque de Peter en mi propio stack (Convex, n8n, Claude Code — los sospechosos de siempre). Algunas cosas cambiaron mi forma de trabajar para siempre. Otras se sintieron como hacer un salto de confianza con un robot asesino. Los siete hábitos sonaban mal hasta que vi qué pasaba cuando realmente los probé.

Desarrollador haciendo deploy sin revisar código mientras agentes automatizan testing
Cuando confías más en tus tests que en tu código

1. Haz deploy de código que nunca has leído

Eso no es broma. Es una cita directa de Peter Steinberger en el podcast Pragmatic Engineer. El hombre que construyó PSPDFKit — un framework de PDF que funciona en más de mil millones de dispositivos — volvió de 3 años de retiro y decidió que leer código era opcional.

"Hago deploy de código que no leo."

La configuración que hace que esto no sea una locura: sus agentes compilan, hacen lint y ejecutan toda la suite de tests antes de que cualquier cosa se commitee. Si el pipeline está verde, se despliega. Peter revisa decisiones de arquitectura. Revisa diseño de sistemas. No se sienta ahí leyendo TypeScript auto-generado como si fuera una novela.

Probé esto en una migración de backend de Convex el mes pasado. En lugar de revisar cada línea de mutación una por una, escribí tests comprehensivos primero, luego dejé que Claude Code generara la implementación. Los tests pasaron. Hice merge sin leer el código.

Me sudaban las manos todo el tiempo. Como la primera vez que haces rm -rf en un directorio y te das cuenta de que olvidaste verificar cuál era.

Pero nada se rompió. Y desplegué en 3 horas en lugar de un día completo.

El cambio mental: deja de revisar código. Empieza a revisar resultados. Si tu cobertura de tests es sólida, el código es solo... plomería. Lo que nos lleva al punto 7. Pero me estoy adelantando.

2. Mata tus MCPs y subagentes

Todo el mundo y su perro están construyendo enjambres multi-agente ahora mismo. Cinco agentes coordinándose a través de MCPs, pasándose contexto de ida y vuelta, con un agente orquestador manejando todo el circo. Se ve impresionante en una demo. En producción, es una máquina de Rube Goldberg que se rompe cada martes.

Peter no usa MCPs. No usa modo plan. No usa subagentes.

Un agente. Buenos prompts. Habilidades específicas. Eso es todo.

Sé lo que estás pensando porque pensé lo mismo — "pero mi flujo de trabajo es complejo, necesito múltiples agentes." Así que hice un experimento. Tenía un pipeline de n8n con 4 nodos de AI diferentes haciendo procesamiento secuencial: extraer, clasificar, enriquecer, formatear. Cuatro agentes, cuatro llamadas a API, cuatro lugares donde las cosas podían fallar silenciosamente.

Lo reemplacé con una sola llamada a Claude Code con un prompt bien estructurado. Mismo output. Más rápido. $12/mes más barato. Y cuando algo se rompe, debuggeo una cosa en lugar de jugar detective entre cuatro cajas negras.

Peter lo dijo sin rodeos en una entrevista: la mayoría de configuraciones multi-agente dan la ilusión de productividad pero en realidad producen peor basura. El loop humano-máquina — un humano, un agente, feedback ajustado — es donde viene la calidad real.

No todos los flujos de trabajo deberían simplificarse así. Pero muchos más de los que piensas sí pueden.

3. Haz prompts vagos a propósito

Este me jodió la cabeza.

// Lo que solía escribir:
"Crea una mutación de Convex que tome un ID de usuario y una lista de
objetos de transacción, valide que cada monto de transacción sea positivo,
verifique que el usuario existe en la tabla users, haga inserts en lotes
de 50, maneje fallas parciales haciendo rollback del lote,
y devuelva un objeto resumen con conteos de éxitos/fallas."

// Lo que Peter escribiría:
"Maneja imports de transacciones en lote para usuarios."

Seis palabras. Eso es todo. Peter intencionalmente da prompts vagos para dejar que el agente explore soluciones que él no había considerado. En el podcast de Lex Fridman, describió descubrir que su agente usó FFmpeg y Whisper para procesar un mensaje de voz que envió — una cadena de soluciones que nunca habría especificado en un prompt.

Estaba escép — no espera, estaba aterrorizado. Los prompts vagos se sienten como darle las llaves de tu auto a un extraño y decir "ya te las arreglarás."

Pero lo probé en tres features la semana pasada. Dos de ellas volvieron con implementaciones en las que no habría pensado. Una de ellas era genuinamente mejor que lo que tenía en mi cabeza. La tercera era basura y la tiré en 30 segundos.

Dos victorias y un borrado rápido. Es una buena proporción. El truco es hacer prompts vagos para exploración, no para producción. No estás desplegando el primer intento. Estás descubriendo el enfoque, luego ajustando el prompt para la construcción real.

4. Gasta 10x más tiempo planeando, 10x menos tiempo programando

La mayoría de devs que conozco (incluyendo mi yo pasado, honestamente) gastan unos 5 minutos pensando en una feature y luego 4 horas programándola. Peter voltea esa proporción completamente.

Pasa un tiempo "sorprendentemente largo" — palabras de su entrevistador, no mías — yendo y viniendo con un agente solo en el plan. Desafía al agente. Busca hoyos. Pregunta "¿qué pasa con el caso límite X?" Reescribe el enfoque. Empuja de vuelta cuando el agente sugiere algo perezoso. Solo cuando el plan es hermético inicia la implementación y se mueve a planear lo siguiente.

Esto es el equivalente de desarrollador de un gran maestro de ajedrez gastando 20 minutos en un movimiento. Se ve lento. En realidad es rápido. Porque la alternativa es gastar 20 minutos moviendo piezas al azar y luego otros 40 minutos deshaciendo el desastre.

He estado haciendo esto con Claude para mis schemas de Convex y es casi terapéutico. En lugar de saltar al código y darme cuenta 2 horas después de que mi modelo de datos está mal — pero divago, cualquiera que haya hecho una migración de schema de Convex a medianoche conoce ese sabor particular de arrepentimiento — ahora paso 30 minutos discutiendo con Claude sobre el diseño del schema. La implementación real toma una fracción del tiempo porque la arquitectura ya está resuelta.

Peter usa Codex específicamente por esta razón. Planea el trabajo extensivamente, luego lo lanza en Codex porque Codex ejecuta tareas largas de forma autónoma. Claude Code sigue volviendo por aclaraciones, lo que rompe su flujo.

Diferentes herramientas para diferentes humanos. El principio se mantiene igual: planea largo, programa corto.

5. Ejecuta 5 agentes en paralelo y no leas ninguno en vivo

Abre tres ventanas de terminal. Lanza tres features diferentes simultáneamente. Cierra las tapas de las tres y ve a hacer café.

Ese es el flujo de trabajo de Peter. Ejecuta 5–10 agentes en paralelo en diferentes features y se mantiene en estado de flujo no viendo a ninguno de ellos trabajar. Revisa resultados cuando terminan. No antes.

Esto suena como herejía de desarrollador senior. Estamos entrenados para observar, monitorear, atrapar errores temprano. La idea de ejecutar 5 procesos autónomos escribiendo código y simplemente... no mirar... se siente como dejar 5 hornillas prendidas e irse a caminar.

Pero piensa en lo que realmente estás haciendo cuando ves a un agente escribir código en tiempo real. No estás agregando valor. Solo estás ansioso. Es el equivalente de desarrollador de abrir la puerta del horno cada 2 minutos para revisar el pastel. Todo lo que haces es ralentizarlo.

Probé esto en menor escala — 3 agentes, no 5. Uno estaba refactorizando un flujo de auth de Supabase. Uno estaba construyendo un nuevo workflow de n8n. Uno estaba escribiendo tests para funciones existentes de Convex. Los configuré con prompts claros (bueno, más claros que el punto 3 — no soy tan valiente todavía), los lancé, y me fui a almorzar.

Volví a: 2 completados exitosamente, 1 falló en un test que no pudo resolver. Arreglé la falla en 15 minutos. Output total: el progreso de 3 features en 90 minutos de tiempo de reloj.

La idea clave que Peter compartió: el estado de flujo no es sobre monitorear agentes. Es sobre encolarlos. Tu trabajo se vuelve prompt engineering → lanzar → prompt engineering → lanzar → revisar lote. Línea de ensamblaje, no niñera.

6. Reemplaza code reviews con "prompt requests"

¿Recuerdas cuando los pull requests significaban algo? Abrías un PR, escribías una descripción explicando tus cambios, un compañero revisaba el diff línea por línea, dejaba comentarios sobre nombres de variables y null checks faltantes, ibas y venías por dos días, y eventualmente alguien lo aprobaba porque todos estaban cansados.

Peter considera los PRs muertos. No muriendo — muertos.

Su reemplazo: prompt requests. En lugar de revisar el código que produjo un agente, revisas el prompt que lo produjo. Si el prompt es sólido y los tests pasan, el código está aprobado. Su equipo ni siquiera habla de código ya. Sus discusiones son 100% arquitectura y decisiones de alto nivel.

Este es el punto más controversial de esta lista y no estoy completamente convertido todavía. ¿Para proyectos solo? Sí, funciona. He estado copiando mis prompts de Claude Code en mensajes de commit en lugar de escribir descripciones manuales, y es genuinamente más útil para mi yo futuro ver "qué pedí" en lugar de "qué cambió."

¿Para equipos? Creo que todavía necesitas algo de code review para compartir conocimiento. Pero el punto de Peter se mantiene: el prompt se está volviendo más importante que el output. En un mundo donde cualquier agente decente puede escribir el código, la calidad de tus instrucciones es el diferenciador.

Digo — un tipo con 180,000 estrellas de GitHub y ofertas de Meta y OpenAI dice que los PRs están muertos. Tal vez el resto de nosotros deberíamos al menos considerarlo 🦞

7. Trata el 80% de tu código como plomería de datos desechable

Ejercicio rápido. Abre tu proyecto ahora mismo. Mira tus archivos editados más recientemente. ¿Cuántos de ellos están haciendo algo genuinamente interesante — algoritmos novedosos, lógica de negocio compleja, patrones de UI creativos?

¿Y cuántos están solo... moviendo datos del punto A al punto B? Parseando JSON. Transformando respuestas de API. Mapeando filas de base de datos a objetos de frontend. Validando inputs. Formateando outputs.

La estimación de Peter: 80% del código de aplicación es "masajear datos en diferentes formas." Y él argumenta que este 80% no merece atención humana obsesiva. Deja que el agente maneje la plomería. Guarda tu cerebro para diseño de sistemas.

Esto me hizo clic cuando audité mi propio proyecto de Convex la semana pasada. Tenía 47 archivos. De esos, tal vez 8 contenían lógica real — el motor de scheduling, las reglas de billing, el sistema de permisos. ¿El resto? Plomería de datos. Fetching de Supabase, reshaping para el frontend, validando payloads de webhook. Trabajo importante, pero no trabajo de pensar.

He empezado a etiquetar archivos mentalmente como "arquitecto" vs "plomero." Los archivos de arquitecto reciben mi atención completa. Los archivos de plomero se delegan a Claude Code con buenos tests y no miro atrás. (Ver punto 1.)

La ganancia de productividad no es solo tiempo. Es cognitiva. Cuando dejas de gastar energía mental en boilerplate de transformación de datos, tienes poder cerebral real para las decisiones que importan. Es como finalmente limpiar tu escritorio de papeles para que puedas realmente pensar.


Bonus: Discute con billonarios sobre tu IDE

Comparación entre arquitectura multi-agente compleja versus agente único simple
De máquina Rube Goldberg a navaja suiza en un refactor

Esta es la parte que prometí y todavía no puedo creer que sea real.

Cuando Mark Zuckerberg primero contactó a Peter sobre adquirir OpenClaw, su primera interacción no fue una hoja de términos. No fue una discusión de valuación. Ni siquiera fue charla casual.

Pasaron 10 minutos discutiendo sobre si Claude Code o Codex es mejor.

Diez minutos. Peter Steinberger y el CEO de Meta. Debatiendo herramientas de AI coding como dos devs en un canal de Discord a las 2 AM. Zuckerberg después lo llamó "excéntrico, pero brillante."

Y cuando le preguntaron en el podcast de Lex Fridman sobre su mentalidad durante las conversaciones de adquisición con tanto Meta como OpenAI simultáneamente, Peter dijo: "No hago esto por el dinero. Me vale madre."

Plot twist: hoy, Peter eligió OpenAI. No Meta. Discutió con Zuckerberg sobre editores de código, rechazó lo que sea que Meta estuviera ofreciendo, y se unió al equipo de Codex en su lugar. OpenClaw se vuelve una fundación, se mantiene open-source, y Peter puede construir "agentes para todos" con los recursos del laboratorio de AI más grande del planeta.

En sus propias palabras en su blog: "Puedo ver totalmente cómo OpenClaw podría volverse una empresa enorme. Y no, no es realmente emocionante para mí. Soy un constructor de corazón."

43 proyectos antes de OpenClaw. Una salida de PSPDFKit valorada en $100M+. Tres años de retiro y búsqueda del alma. Y ahora se une a OpenAI porque construir cosas es más divertido que poseer cosas.

Esa no es una táctica de negociación. Eso es lo que pasa cuando alguien está tan profundo en el oficio que todo lo demás se vuelve ruido de fondo. Peter no estaba negociando. Estaba vibrando.

Cada hábito contraintuitivo en esta lista viene de la misma raíz: preocuparse obsesivamente por el trabajo y casi nada por el proceso alrededor de él. Despliega sin leer. Promptea sin sobrepensar. Planea sin programar. Revisa prompts, no diffs.

Los hábitos suenan locos hasta que te das cuenta de que todos apuntan en la misma dirección — gasta tu atención humana finita en las cosas que solo un humano puede hacer, y confía en las máquinas con todo lo demás.


Si estos hábitos te hicieron cuestionar al menos una cosa sobre tu flujo de trabajo — ese es el punto. Peter acaba de unirse a OpenAI hoy, lo que significa que el ecosistema OpenClaw está a punto de ponerse muy interesante muy rápido. Actualmente estoy probando su configuración de "agente auto-modificante" en mi stack de producción. Si quieres ver qué tan espectacularmente va (o no va), sígueme y compartiré los resultados.

Lo siguiente: el deep-dive de seguridad de OpenClaw que todos han estado pidiendo. El que te dice todas las formas en que tu langosta puede traicionarte. 🔒


Cada semana, desbloqueo los hábitos de desarrollo que transforman cómo construimos con IA en producción. Desde despliegues rápidos hasta estrategias contraintuitivas de Peter Steinberger.

Únete a la newsletter de desarrollo de IA