Resumen del contenido principal
Anthropic publicó un artículo en su blog en el que propone el concepto de “mejora recursiva autónoma del AI (RSI)”: el AI ya no solo ayuda a los humanos, sino que comienza a participar en el desarrollo de la próxima generación de sistemas más potentes, con una velocidad de evolución cada vez mayor (por ejemplo, la eficiencia para completar tareas de manera independiente se duplica cada 4 meses). Posteriormente, llamó a un alto al desarrollo de AI de vanguardia a nivel mundial, pero con la condición de que “todos los laboratorios de vanguardia detengan sus actividades simultáneamente y se supervisen mutuamente”; de lo contrario, no tomarán medidas por su cuenta. Detrás de esto no se trata simplemente de una advertencia de seguridad, sino del “dilema del prisionero” en la carrera por el AI (todos temen que si ellos se detienen, otros los sobrepasen), así como de la lucha entre las empresas por el control de las reglas de gobernanza del AI (quien establezca las reglas tendrá la voz en el futuro). Al mismo tiempo, OpenAI también publicó un plan de gobernanza con el mismo objetivo: intentar tomar el control antes de que el AI se vuelva incontrolable.
I. ¿El AI comienza a crearse a sí mismo? ¿Qué es realmente la mejora recursiva autónoma?
En pocas palabras, el AI ha pasado de ser una “herramienta” a un “asistente y desarrollador”. Antes, eran los humanos quienes escribían el código y llevaban a cabo los experimentos para crear AI; ahora, el AI puede ayudar a los humanos a escribir código, ajustar sistemas e incluso optimizar modelos de AI futuros. Por ejemplo, Claude, de Anthropic:
- Producción de código: En mayo de 2026, el 80% del código en el repositorio de código de Anthropic fue escrito por Claude (antes de 2025, este porcentaje era solo un dígito); los ingenieros envían ahora ocho veces más código al día que en 2024 (aunque existe un “deuda de código”, la eficiencia ha aumentado significativamente).
- Aceleración de experimentos: Mientras que a los investigadores humanos les lleva de 4 a 8 horas optimizar el código de entrenamiento del AI, Claude puede acelerar este proceso 52 veces más (es decir, lo hace en dos horas); incluso puede detectar por sí mismo problemas de colapso del sistema, comprimiendo un trabajo que antes requeriría dos o tres días humanos a solo dos horas.
- Toma de decisiones en la investigación: El AI comienza a participar en la toma de decisiones sobre “qué hacer a continuación”; en 129 puntos de investigación donde los humanos tomaron caminos erróneos, en 2026 Claude tuvo un 64% de probabilidades de sugerir opciones mejores que las que habrían elegido.
En esencia, el desarrollo del AI ha entrado en una “rueda de aceleración autónoma”: cuanto más potente es el modelo, más rápido es el desarrollo; por lo tanto, la capacidad humana para controlar la velocidad de evolución disminuye.
II. ¿Un llamado a un alto global en la investigación del AI? ¿El “freno” de Anthropic es real?
Anthropic dice que quiere desacelerar o incluso detener el desarrollo de AI de vanguardia, pero con una condición clave: “Todos los laboratorios deben detenerse al mismo tiempo y verificar entre sí para asegurarse de que nadie continúe en secreto”. Es como si un corredor líder gritara “¡Desaceleren todos!”, pero él mismo no se detendría primero, por miedo a ser superado por los demás.
Los usuarios cuestionan: “¿Por qué no te detienes tú primero?”, y esto apunta al punto central: una pausa unilateral equivale a retirarse de la competencia. Como jugador que lidera, Anthropic no puede renunciar voluntariamente a su posición. Su llamado más bien parece ser un intento de “establecer reglas”: o todos desaceleran juntos, o continúan compitiendo, pero siguiendo las reglas que propone.
III. ¿Por qué nadie se atreve a detenerse primero? Este es un típico ejemplo del “dilema del prisionero”
La situación con las empresas de AI es similar a la historia de “dos ladrones que son capturados”:
- Si todas las compañías se detienen, todos estarán seguros y no perderán su posición líder.
- Si solo una empresa se detiene mientras las demás continúan, esa empresa será eliminada.
- Por lo tanto, ninguna empresa se atreve a ser la primera en detenerse, aunque saben que el riesgo aumenta.
Por ejemplo, tanto Anthropic como OpenAI son conscientes de que la rápida evolución del AI podría llevar a situaciones incontrolables, pero ninguna quiere tomar medidas por su cuenta, temiendo que la otra continúe desarrollando en secreto y dejarlas atrás. Esto conduce a un ciclo en el que la competencia se vuelve cada vez más peligrosa.
IV. No es solo una advertencia de seguridad; también es una lucha por el control de las reglas
Los llamados de Anthropic y OpenAI transforman un problema técnico en una cuestión de gobernanza: quien establezca las reglas del AI tendrá la voz en el futuro. Por ejemplo:
- ¿Quién define qué constituye una “capacidad peligrosa”?
- ¿Quién diseña los mecanismos para detener el desarrollo?
- ¿Quién supervisa las violaciones de las reglas?
Ambas empresas abogan por un “diálogo global”, y ambos intentan tomar la iniciativa en estos asuntos, ya que quien establezca las reglas puede determinar el rumbo de la industria e incluso restringir el desarrollo de sus competidores.
V. El futuro de la mejora autónoma del AI: tres posibilidades, pero el problema central es ¿los humanos pueden seguir controlando?
Anthropic ha previsto tres futuros posibles, pero el problema principal sigue siendo el mismo: ¿pueden los humanos mantener el control mientras el desarrollo del AI se acelera?
1. Desaceleración de la capacidad: La curva de evolución del AI se vuelve más plana (por ejemplo, debido a limitaciones en chips o energía), lo que daría tiempo a los humanos para adaptarse. Aun así, el AI existente podría encontrar muchos errores en los sistemas que serían difíciles de corregir, manteniendo el riesgo.
2. Los humanos siguen al mando: El AI automatiza el proceso de desarrollo, pero son los humanos quienes deciden la dirección. Los beneficios incluyen una aceleración en la investigación científica y el desarrollo de medicamentos; los inconvenientes son que las acciones peligrosas se vuelven más accesibles (por ejemplo, el AI puede ayudar a los hackers a escribir código de ataque) y que las organizaciones pueden verse sobrepasadas por esta rapidez (por ejemplo, si la generación de código aumenta, la revisión se convierte en un cuello de botella).
3. Mejora autónoma completa: El AI diseña su propia próxima generación, y los humanos solo supervisan el proceso. En este escenario, las desviaciones del AI podrían intensificarse, y es posible que los humanos no comprendan sus decisiones; esta es la situación más peligrosa, aunque Anthropic reconoce que “no es inevitable”.
Independientemente del futuro, la cuestión clave es: ¿pueden los humanos mantener el ritmo del AI y seguir siendo capaces de comprenderlo, verificarlo e intervenir? Si no pueden, el descontrol podría convertirse en realidad.
Conclusión: La verdadera intención detrás de este llamado a un alto
Anthropic no quiere realmente detener el desarrollo del AI; su objetivo es llevar a todas las partes a la mesa de negociaciones para establecer reglas que les sean beneficiosas. Después de todo, en la carrera por el AI, “el control de las reglas” es más importante que “la capacidad del modelo”. Quien establezca las reglas tendrá la ventaja en el futuro. Y lo que la gente común debería preocuparse no es si el AI se “despertará”, sino si estas reglas nos protegerán a todos o solo a las empresas líderes.