Todas las IA se Volvieron Más Tontas en 30 Días. Y Va a Empeorar.

11 min read

Esta semana, tres personas diferentes me dijeron exactamente lo mismo. Sobre tres herramientas de IA distintas. Ni siquiera uso las otras tres, pero las quejas llegaron hasta mí de todas formas.

RESUMEN. Esto no es Anthropic limitando Claude para recortar costos. No es OpenAI arruinando un lanzamiento. No es el enrutamiento de Gemini fallando. Cuatro laboratorios te están sirviendo una experiencia degradada ahora mismo, y la explicación es la misma para los cuatro. Ningún changelog lo va a escribir. Ningún CEO lo va a anunciar. Y está a punto de empeorar mucho más.

Cuando cuatro competidores empeoran en los mismos treinta días, no son cuatro bugs independientes. Es una señal. El resto de este artículo explica qué dice esa señal, por qué los laboratorios no pueden arreglarlo, y qué hacer antes de que tu factura se ponga al día.

Desarrollador revisando frenéticamente respuestas degradadas de IA mientras colega señala gráfico de costos de cómputo en declive en oficina
Tu IA no se volvió tonta. Tu presupuesto sí.

Uso Claude Todos los Días. Esta Semana, Tres Amigos Dijeron lo Mismo Sobre GPT, Gemini, Perplexity.

No soy de esos tipos que pagan cuatro suscripciones solo para discutir cuál modelo es mejor. Soy un tipo de Claude. Claude Code todo el día, Claude para investigación, Claude para escribir (este artículo también, sí). Aburrido. Decidido.

Así que cuando las quejas sobre otras herramientas me llegan, es por la ventana, no por mi billetera.

Lunes. Un amigo que programa para vivir. Me dice que Claude Code se ha vuelto perezoso durante las últimas dos semanas más o menos. Se salta pasos que clavaba en febrero. Pierde el hilo en refactorizaciones de múltiples archivos. No es un berrinche. Un "algo no está funcionando" mesurado.

Miércoles por la noche. "Siento como si estuviera pagando por un becario junior en lugar del senior que tenía." Esa fue otra amiga, una no-desarrolladora que escribe con ChatGPT todos los días. No leyó un artículo que le dijera que se sintiera así. Se dio cuenta mientras trabajaba.

Jueves por la noche, Discord. Un marketero en nuestro canal tira su pantalla: Perplexity respondiendo una consulta de investigación con una lista de viñetas. Otra consulta. Otra lista de viñetas. Ha estado masticando esto durante tres semanas antes de decir algo, por si acaso era él.

Y en el fondo, había estado notando algo en mi propia cuenta de Gemini (sí, mantengo una, para verificaciones cruzadas de búsqueda). Gemini 3 ha empezado a alucinar en temas que Gemini 2.5 solía manejar en marzo. No catastróficamente. Solo lo suficiente como para que dejara de confiar en él para cualquier cosa que no pudiera verificar al momento.

Cuatro laboratorios. Treinta días. Cuatro personas diferentes, cuatro flujos de trabajo diferentes, la misma forma de queja: la herramienta no es lo que era.

No eres tú. No es el modelo, no realmente. Ni siquiera es Anthropic u OpenAI siendo descuidados. Algo más está pasando, y no veo a nadie escribiendo sobre lo que realmente los conecta.

Todos Están Mirando en el Lugar Equivocado

Busca cualquiera de estas quejas ahora mismo en Google y encontrarás gente reflexiva explicando cada una. Una por una.

OpenAI ha estado en "Código Rojo" interno desde el 1 de diciembre de 2025. Altman les dijo a los empleados en un memo interno (confirmado por The Information y WSJ) que dejaran todo y arreglaran ChatGPT antes de que Gemini 3 siguiera comiéndose su almuerzo. Así que si GPT se siente raro, bueno, se están reorganizando en pánico. Tiene sentido.

Anthropic tuvo seis caídas solo en abril. La del 13 de abril duró cerca de una hora. La del 15 de abril se extendió cerca de tres horas. El monitor de estado público reporta 98.79% de tiempo activo en 90 días. Para una empresa vendiendo contratos empresariales basados en confiabilidad, eso es duro. Así que si Claude se siente inestable, bueno, la infraestructura está cojeando. Tiene sentido.

Gemini ahora está en 650 millones de usuarios activos mensuales según los propios números de Google de octubre 2025. La carga subió mucho. La calidad, según el consenso de mi feed, bajó. Saca tus propias conclusiones.

Perplexity ha estado apretando márgenes en cada consulta desde su último pivote de modelo de negocio. Respuestas más cortas, cómputo más barato, menos profundidad de investigación. Así que si Perplexity se siente más superficial, bueno, esa es la estrategia. Tiene sentido.

Cada explicación es ordenada. Cada una es local. Cada una es sobre un laboratorio específico, un trimestre malo específico, un ejecutivo específico sudando por benchmarks.

Nadie conecta los cuatro.

¿Por qué? Porque una vez que notas que cuatro competidores se están degradando en los mismos treinta días, tienes que aceptar que la causa no está dentro de ninguno de ellos. Esa respuesta es mucho más incómoda que "Altman está en pánico" o "Anthropic necesita mejores operaciones." Implica algo más grande de lo que cualquier laboratorio individual controla. Así que la gente escribe una docena de artículos reflexivos sobre cada síntoma individual, y nadie escribe sobre la simultaneidad.

Me he pillado en este reflejo antes. El mismo reflejo de diagnóstico erróneo apareció en el artículo de pánico de productividad de Bloomberg, donde la causa real no era que los desarrolladores se estuvieran ablandando con la IA sino algo mucho más aburrido. Mismo reflejo aquí. Todos están señalando a un laboratorio. La respuesta no está en un laboratorio.

La simultaneidad es la historia.

La Calidad No Es una Propiedad del Modelo. Es una Propiedad del Cómputo por Solicitud.

La calidad, tal como la experimentas, no es solo una propiedad del modelo. Es una propiedad de cuánto cómputo el laboratorio está dispuesto a gastar en tu solicitud específica.

Mismos pesos. Misma arquitectura. Mismos puntajes de benchmark públicos. La experiencia que obtienes a las 3pm un martes en abril de 2026 puede ser significativamente peor que la que obtuviste a las 3am en febrero, y nada en las notas de lanzamiento te dirá por qué.

Las palancas son aburridas e invisibles. Un laboratorio puede acortar el TTL del caché de prompts para ahorrar memoria, y tu modelo "olvida dónde estabas" porque el contexto de hace cinco minutos fue desalojado. Puede agrupar tu solicitud con cincuenta otras cuando las GPUs están saturadas, y cada solicitud obtiene una porción más delgada de razonamiento, lo que sientes como un paso saltado. Puede enrutar silenciosamente tu consulta a un modelo más pequeño cuando la cola de frontera está llena; sigues viendo "Claude Opus 4.7" en la UI mientras obtienes Haiku por debajo. Para modelos con profundidad de razonamiento variable, puede limitar la cadena de pensamiento a menos tokens, y el análisis que habrías obtenido en febrero se detiene tres párrafos antes. Puede reducir la longitud máxima de salida, y el párrafo se convierte en una lista de viñetas.

Nada de esto llega a las notas de lanzamiento, porque no es un cambio de modelo. Es un cambio de servicio. El modelo en el estante es el mismo. La porción que te sirven se hizo más pequeña.

Tampoco rompe los benchmarks públicos. MMLU y HumanEval corren en condiciones controladas con cómputo generoso. Los números se quedan donde estaban. Las evaluaciones te dicen que el modelo está bien. El modelo está bien. El modelo no es lo que estás comprando ya. Estás comprando una porción del tiempo del modelo, y la porción se hizo más delgada.

Anthropic puede servirte Claude Opus 4.7 y darte una experiencia de Haiku. Nunca lo verás en el changelog.

Los Números Físicos. Están Peor de lo Que Piensas.

2026 vs 2027 US data center capacity, two bars per year. 2026: 16 GW announced vs 5 GW under construction. 2027: 21.5 GW announced vs 6.3 GW under construction. Visual emphasis on the widening gap between promises and reality.
Capacidad de Centros de Datos de EE.UU.: Brecha Creciente Entre Anuncios y Construcción

Dieciocho meses. Eso es lo que toma construir un centro de datos desde cero, asumiendo que ya tienes la tierra, el contrato de energía y los transformadores.

Ahora las malas noticias. En su Perspectiva de Centros de Datos 2026, Sightline Climate reporta que del 30 al 50% de los centros de datos de EE.UU. planeados para entrar en línea en 2026 serán retrasados o cancelados. Bloomberg recogió el reporte a finales de marzo de 2026. El gráfico es brutal. De 16 gigavatios anunciados para 2026, solo unos 5 gigavatios están realmente bajo construcción ahora mismo. El resto se sienta en etapa "anunciado" sin un camino claro a la red.

¿Por qué? No es dinero. Los hiperescaladores han presupuestado más de $700 mil millones de capex combinado para 2026. El cuello de botella es físico. Transformadores. Equipos de conmutación. Baterías. El hardware eléctrico aburrido entre la línea de servicios públicos y el rack de GPU. La capacidad de manufactura de EE.UU. no puede mantenerse al día, y los componentes upstream (incluyendo materias primas para baterías) todavía vienen principalmente de China. Los aranceles no lo han arreglado. La relocalización no lo ha arreglado. Los operadores de red están inundados con solicitudes de carga especulativa que ni siquiera pueden evaluar.

Empeora a nivel corporativo. En diciembre de 2025, Oracle empujó varios de sus centros de datos Stargate dedicados a OpenAI de 2027 a 2028 según Bloomberg, citando escasez de mano de obra y materiales. Hace dos semanas, OpenAI pausó el sitio Stargate del Reino Unido en West London después de seis meses de anuncios. El sitio de Narvik en Noruega, originalmente Stargate, fue transferido a Microsoft. Microsoft mismo canceló un lote de arrendamientos europeos en marzo.

Y la red eléctrica. La parte en la que nadie piensa hasta que llega la factura. Los operadores de red de EE.UU. han estado advirtiendo públicamente desde 2024 que no pueden energizar nueva capacidad de centros de datos al ritmo que se está anunciando. Esa advertencia está archivada. Nadie actuó sobre ella. Aquí estamos.

Por Qué Abril. Por Qué Ahora.

Entonces por qué abril. Por qué los cuatro a la vez.

Porque la demanda cruzó la oferta este trimestre. Y el cruce no fue gradual.

Gemini 3 se lanzó el 18 de noviembre de 2025. Para enero, estaba en 650 millones de usuarios activos mensuales. Un producto de consumo no crece de nada a 650 millones en seis semanas sin comerse cómputo que estaba asignado a otras cargas de trabajo. El enrutamiento interno de Google tuvo que hacer elecciones.

ChatGPT llegó a "Código Rojo" el 1 de diciembre de 2025. Altman le dijo a su equipo que dejaran todo y se enfocaran en la calidad de ChatGPT. Eso significa reasignar cómputo planeado para otras cosas (agentes, Pulse, infraestructura de anuncios). OpenAI estaba defendiendo participación de mercado contra Gemini 3 y cambiando cómputo dentro del mismo presupuesto fijo.

En el lado de Anthropic, la adopción empresarial de Claude Code y el nuevo agente Cowork se volvió exponencial en Q1 2026. Anthropic le dijo a la prensa en marzo que la empresa estaba registrando más de un millón de nuevos usuarios al día. Un millón al día. En infraestructura que no estaba aprovisionada para un millón al día.

Y el cómputo disponible para los cuatro laboratorios no ha crecido proporcionalmente desde finales de 2025. El pipeline de expansión que acabamos de revisar es lo que se suponía que agregaría la capacidad. Ese pipeline está tartamudeando.

Algo tenía que ceder. Lo que cedió es la parte que nadie mide, la parte que nadie publica: la calidad de la solicitud promedio. No el benchmark. La solicitud. La tuya.

Los laboratorios no anuncian racionamiento. Lo hacen.

Y 2027 Ya Está Peor Que 2026

La peor parte no es 2026. Es 2027.

El mismo reporte de Sightline rastrea el pipeline de 2027. De 21.5 gigavatios anunciados para 2027, solo 6.3 están actualmente bajo construcción. La proporción es peor que 2026. No igual. Peor. El delta entre anuncio y realidad se está ampliando, no estrechando.

Y recuerda el tiempo de construcción. Doce a dieciocho meses mínimo. Si un proyecto no está bajo construcción hoy, no entra en línea en 2027. Entra en línea en 2028. Tal vez.

Entre hoy y que esa línea se cruce a sí misma otra vez, la demanda no se está quedando quieta. Los agentes de IA se están multiplicando, cada Fortune 500 está corriendo algún copiloto interno, la generación de video come tokens por gigabyte, los flujos de trabajo de agentes persistentes mantienen ventanas de contexto abiertas por horas en lugar de segundos. La consulta promedio de 2027 consumirá más cómputo que la consulta promedio de 2025. Mucho más. Cuánto exactamente, nadie lo sabe. La dirección no se disputa.

La oferta tartamudea. La demanda sube. La brecha es estructural.

Esto no es un ciclo corrigiéndose a sí mismo. Es un acantilado que 2026 empezó a escalar y 2027 hace más empinado.

Tres Cosas que Hacer Antes de que el Precio se Ponga al Día

Antes de que la factura empiece a decir la verdad, tres cosas. No diez. No un listicle. Tres.

Primero, un número en el que la prensa de consumo no ha martillado lo suficiente. The Information reportó en marzo de 2025 que OpenAI estaba planeando niveles de agentes a $2,000 por mes para un agente de "trabajador del conocimiento de altos ingresos", $10,000 para un agente desarrollador de software, y $20,000 para un agente "investigador nivel PhD". Eso fue hace un año. ChatGPT Pro a $200 por mes, ahora en el catálogo, no es el juego final. Es el aperitivo. Claude seguirá. Gemini seguirá. Cualquiera con un producto de razonamiento serio seguirá. Mil, cinco mil, diez mil euros al mes por el nivel que realmente funciona. No es cuestión de si. Cuestión de cuándo. Tal vez 2027. Tal vez antes.

Dado eso, tres cosas.

Uno. Concentra tu presupuesto en una herramienta principal. La fragmentación de Netflix está llegando a los LLMs, y sabes cómo terminó eso para tu stack de streaming. Si estás pagando por cuatro suscripciones ahora mismo para comparar, estás a punto de gastar más por menos. Elige tu bando mientras elegir sigue siendo barato. Usa los otros gratis o medidos por API cuando absolutamente necesites una segunda opinión.

Dos. Deja de elegir tu modelo por marca. Elige por tarea. El "mejor todoterreno" ya está muerto, solo que aún no lo sabes. Claude es actualmente el mejor que he usado para código de contexto largo y escritura en voz. GPT es el mejor en multimodal y en razonamiento cuando le das suficiente espacio. Gemini es más fuerte en búsqueda en vivo y en manejar entradas enormes. Perplexity es para investigación con fuentes (disputado ahora mismo, pero la intención sigue siendo buena). Muévete entre ellos como un cocinero se mueve entre cuchillos. No un cuchillo para todo.

Tres. Re-aprende los fundamentos sin IA mientras sigue siendo barato. Si eres un dev que ha estado programando por vibra durante dos años sin poder leer un stack trace sin asistencia, estarás atascado cuando el nivel decente cueste cuatro cifras al mes. Si eres un escritor que no puede redactar un párrafo sin el asistente, misma historia. (Aprendí esto por las malas reconstruyendo una configuración de $200 por $15 cuando el precio se movió la última vez.) Las personas que sobrevivirán al reinicio de precios son las que todavía saben qué estaba haciendo la herramienta por ellos. Todos los demás se convierten en un cliente muy caro.

La ventana se está cerrando. No cerrada de golpe. Cerrándose. Úsala.

La Edad Dorada No Terminó Con un Anuncio

La edad dorada de la electricidad barata no terminó con un discurso. La edad dorada de la TV broadcast gratuita no terminó con un discurso. La edad dorada de los datos móviles ilimitados no terminó con un discurso. Cada vez, la factura empezó a decir la verdad antes de que cualquier ejecutivo lo hiciera.

Estamos en ese momento.

La edad dorada no termina con un anuncio. Termina cuando la factura empieza a decir la verdad. La factura está susurrando en abril. Estará hablando para septiembre 💸

Fuentes

  • Sightline Climate, Perspectiva de Centros de Datos 2026, reportado por Bloomberg a finales de marzo 2026
  • The Information y Wall Street Journal sobre el memo "Código Rojo" de Sam Altman (1 de diciembre, 2025)
  • SF Standard y TechRadar sobre la serie de caídas de Anthropic en abril 2026

(*) La portada es generada por IA. Lo cual, dado el tema de este artículo, es probablemente su propia pequeña ironía.