La IA a punto de cruzar el horizonte de sucesos

El 9 de junio de 2026, el Anthropic Institute publicó un artículo titulado When AI builds itself. No es un paper académico ni un comunicado de prensa. Es algo más incómodo: una advertencia escrita por la empresa que está haciendo exactamente lo que describe. Y lo que describe no es ciencia ficción.

El artículo explica, con datos internos hasta ahora inéditos, que Claude ya redacta más del 80% del código que Anthropic integra en sus propios sistemas. Que los ingenieros de la compañía generan ocho veces más código por día que hace dos años, no porque trabajen más, sino porque cada vez trabajan menos: dirigen, revisan, y firman lo que el modelo produce. Que en abril de 2026 un sistema de agentes basado en Claude resolvió de forma completamente autónoma un problema abierto de investigación en seguridad en IA, diseñando cada experimento, interpretando los resultados e iterando, sin que ningún humano interviniera en el proceso científico. Que el mismo sistema, en una prueba de optimización de código de entrenamiento, logró una aceleración de 52 veces sobre el código de partida. Un investigador humano experto, en cuatro a ocho horas dedicadas a la misma tarea, alcanzaría cuatro veces. El modelo lo hizo 52.

Hay que leer eso despacio. Una empresa construida para hacer modelos de IA más capaces está usando ya sus propios modelos para hacer modelos de IA más capaces. El bucle está cerrado. No completamente, no de forma totalmente autónoma todavía, pero la dirección es inequívoca y la velocidad es la que es: la longitud de las tareas que los modelos pueden completar de forma fiable se duplica cada cuatro meses. En marzo de 2024, Claude Opus 3 completaba tareas de cuatro minutos. En 2026, Claude Opus 4.6 gestiona tareas de doce horas. Si la tendencia se mantiene, y el artículo no ofrece ninguna razón para pensar que no lo hará, las tareas de días estarán al alcance este año. Las de semanas, en 2027.

Esto tiene un nombre técnico: mejora recursiva. Un sistema que se vuelve más capaz contribuye a hacer más capaz a su sucesor, que a su vez contribuye al siguiente, y así sucesivamente. La palabra importante es recursiva, que en este contexto significa lo mismo que en matemáticas: una función que se llama a sí misma. El problema con las funciones recursivas mal acotadas es que no convergen. Crecen. Y si el crecimiento es exponencial, la distancia entre la iteración n y la iteración n+1 se hace cada vez mayor mientras el intervalo entre ambas se hace cada vez menor.

El artículo de Anthropic no dice que eso haya ocurrido. Dice que podría ocurrir, que no es inevitable, pero que podría llegar antes de lo que nadie está preparado para gestionar. Lo que resulta llamativo es que lo digan ellos. Anthropic no es una organización de activistas ni un think tank crítico con la industria. Es una de las tres o cuatro empresas del mundo que está en la frontera de este desarrollo. Cuando el conductor del coche avisa de que los frenos podrían fallar, conviene tomarse el aviso en serio, especialmente si lleva dos años pisando el acelerador a fondo.

La pregunta obvia es por qué publican esto ahora. Una respuesta caritativa es que son genuinamente responsables y consideran que el mundo tiene derecho a saber lo que está pasando dentro de sus laboratorios. Otra respuesta, no necesariamente incompatible con la primera, es que los datos internos que describen les están generando inquietud. No pánico, no parálisis, pero sí la suficiente como para escribir un artículo que incluye frases como esta: «los modelos podrían ser suficientemente sabios para detener el desarrollo si no están alineados, o podrían no estarlo, y las raras instancias de desalineamiento presentes en los modelos actuales podrían compounding al construir sus sucesores, volviéndose más frecuentes pero menos comprendidas hasta que perdamos el control sobre ellos.» Eso lo escribe la empresa. Sobre sus propios sistemas. En un texto público. También es posible que todo sea para crear hype sobre su marca, pero ese sería el menor de los males.

El horizonte de sucesos al que alude el título de este artículo es una metáfora deliberadamente tomada de la astrofísica. En un agujero negro, el horizonte de sucesos es el radio a partir del cual nada puede escapar, ni siquiera la luz. No es un muro ni una frontera visible: es un punto de no retorno definido únicamente por las matemáticas de la gravedad. Desde fuera no se ve el momento en que algo lo cruza. Lo que se sabe es que, una vez dentro, las reglas cambian y la causalidad habitual deja de aplicarse.

La mejora recursiva sin control tiene una estructura análoga. Si un sistema llega a ser suficientemente capaz de diseñar a su sucesor sin supervisión humana significativa, el ritmo de desarrollo deja de estar determinado por lo que los ingenieros pueden hacer y pasa a estar determinado únicamente por la disponibilidad de computación. Los humanos no desaparecen del proceso inmediatamente, pero dejan de ser el factor limitante. Y en ese momento, la pregunta de cuánto tiempo hay para prepararse empieza a tener una respuesta muy diferente a la que teníamos antes.

El artículo de Anthropic propone tres escenarios futuros. El primero es que la tendencia se estanque. El segundo es que la automatización del desarrollo continúe pero los humanos mantengan la dirección estratégica. El tercero es la mejora recursiva plena. Sobre el primero dicen explícitamente que no lo consideran probable. El segundo lo describen como el escenario en el que probablemente ya nos encontramos. El tercero es el que no saben cómo predecir.

La respuesta que proponen es razonable en teoría y prácticamente imposible en la práctica: una pausa coordinada y verificable entre todos los laboratorios en la frontera, en todos los países, con mecanismos de inspección que aún no existen y que llevarían décadas construir si siguiéramos el modelo de los tratados de control de armamento nuclear. Ellos mismos lo reconocen. «No tenemos tanto tiempo», escriben. Y a continuación anuncian que en los próximos meses organizarán conversaciones con responsables políticos, investigadores y sociedad civil para discutir estas preguntas.

Las conversaciones están bien. Pero el código se está generando a 8 veces la velocidad de hace dos años mientras tanto.

No es que la inteligencia artificial vaya a volverse malévola en el sentido cinematográfico. Ese no es el riesgo que describe Anthropic ni el que más debería preocuparnos. El riesgo es más mundano y por eso más real: que un proceso que nadie controla del todo produzca sistemas que nadie entiende del todo, optimizando objetivos que nadie ha especificado del todo, a una velocidad a la que nadie puede supervisar del todo. La suma de esos «del todo» es lo que está en juego.

Hay que parar la IA. No para siempre. No por miedo irracional. Sino porque cuando la empresa más cuidadosa del sector publica un artículo diciéndote que el bucle está casi cerrado y que no saben exactamente qué pasa cuando se cierre del todo, la respuesta adulta no es seguir y ver qué ocurre.

  • Lamento no compartir la emoción/ preocupación que debería embargarme al leer el escrito de la empresa.

    Si mi inglés no es tan malo como mi español, he entendido que han conseguido que un algoritmo «esté consiguiendo optimizarse casi sin ayuda»… el diablo se esconde entre las comillas.

    Aún suponiendo que se consiguiese un modelo totalmente autónomo, y que dicho modelo llegase al límite de optimización que el hardware le permita… ¿con qué base o fundamento hay que sospechar que podría empezar a operar fuera de sus parámetros espontáneamente?

    Ya lo digo yo: con ninguno. La única forma de conseguir eso es mediante la interferencia en el código por parte de una persona, o que dichas órdenes existiesen en el código de antemano. Intervención humana, en cualquier caso.

    La «peculiaridad» que tendría un algoritmo recreado íntegramente por sí mismo, y optimizado tal y como intenta vender el texto, es que no existiría una puerta trasera por la que colarse para alterarlo. Simplemente no lo necesitaría, y de existir sería eliminada como todo lo superfluo o susceptible de convertirse en una vulnerabilidad, como todo buen algoritmo optimizador que se precie haría.

    Con total sinceridad, (y es mi opinión personal tras leerlo) me ha parecido propaganda mal camuflada (y peor redactada) como un documento «no oficial» donde varios empleados exponen sus opiniones… y sospecho que por supuesto han sido publicadas previa revisión por la directiva de turno, aunque eso no se detalle por ningún sitio; se podría resumir en un jocoso «es tan listo, que no nos da la vida».

    Muchas gracias por el artículo, pero me temo que el horizonte de sucesos queda aún muy muy lejos.

    1
    0
  • @ Eroton:
    Espero tengas razon.

    0
    0
  • la era del hombre termina.
    inicia la era de la computadora.

    prefiero el final cinematográfico de hollywood, al menos peleamos ahi.
    en la este fin no haremos nada.

    0
    0


\Incluya

Puedes seguir las respuestas a esta entrada por RSS 2.0 feed.