虎嗅

AGI está cerca: 40 experimentos alcanzan un nivel de excelencia (SOTA), y el superagente recursivo crea por sí mismo el modelo base más potente para materiales.

原文：AGI将至，40项实验全面SOTA，超级递归智能体自主打造最强材料基座模型

2026-06-02 阅读原文

Resumen del contenido principal

Recientemente, el agente de investigación científica basado en IA del equipo Deep Principles, MIRA, ha logrado un gran avance: mediante el autoentrenamiento recursivo (mejorándose a sí mismo), completó todo el proceso de forma autónoma, desde la reestructuración del código, la limpieza de datos hasta el diseño de estrategias de entrenamiento, y produjo el modelo base de materiales MPA. Este modelo ha superado los mejores resultados mundiales (SOTA) en 40 tareas de predicción experimental, con una reducción promedio del error del 10% y la disminución más alta del 51%. Lo que es aún más importante, esto marca el inicio oficial de la "rueda de evolución" del autoaprendizaje del AI en el campo de la ciencia de materiales, lo que podría acelerar la llegada de la inteligencia artificial general (AGI) más rápido de lo que esperábamos.

Interpretación detallada

#### 1. Los modelos tradicionales de materiales se basan en la cantidad de datos; MPA utiliza métodos ingeniososos para superar los límites

El modelo Suiren de Shanghái era un ejemplo típico de "estética de la fuerza bruta": utilizó 320 GPUs de alta gama y 70 millones de datos para generar 1.8 mil millones de parámetros, lo que le permitió ganar en la lista de aquel momento. Sin embargo, tenía un defecto fatal: solo podía predecir "propiedades computacionales" (como las que pueden calcularse con software de química cuántica), pero no podía manejar las propiedades experimentales clave en el desarrollo real (como el punto de ebullición, la toxicidad o la solubilidad).

¿Por qué? Los problemas relacionados con las propiedades experimentales son muy complejos: hay pocos datos (un solo experimento puede llevar días), mucho ruido (los resultados varían entre laboratorios) y los principios físicos detrás de cada propiedad son completamente diferentes (por ejemplo, el punto de ebullición está relacionado con las fuerzas intermoleculares, mientras que la toxicidad está relacionada con mecanismos biológicos). No se pueden resolver estos problemas de "diversidad física" simplemente acumulando datos y hardware. MIRA apunta a este punto débil y utiliza el AI para encontrar métodos ingeniososos en lugar de recurrir a la fuerza bruta.

#### 2. El AI como "investigador integral": piensa por sí mismo y modifica el código

MIRA no es una herramienta de investigación ordinaria; es más bien un "asistente científico versátil":

Pensamiento autónomo: El equipo le plantea un problema: "Con una estructura molecular 3D y etiquetas experimentales, ¿cómo diseñar un modelo de predicción de múltiples propiedades?" MIRA analiza sistemáticamente todas las posibles opciones y finalmente elige el esqueleto 3D de UniMol como base.
Modificación autónoma del código: Reestructura directamente el código fuente del modelo existente (en lugar de ajustar parámetros); por ejemplo, identifica módulos redundantes, rediseña el flujo de datos y estandariza las interfaces de entrenamiento previo, intermedio y posterior. Durante todo el proceso, los humanos solo tienen que plantear preguntas y confirmar la dirección, sin necesidad de escribir ni una línea de código.

Esta es la principal diferencia con las herramientas ordinarias: MIRA puede manipular el código subyacente de la "arquitectura del modelo y la cadena de entrenamiento", no solo ajustar los parámetros superficiales.

#### 3. El AI también tiene "intuición científica": limpia datos automáticamente y entiende la física

Los datos experimentales provienen de múltiples bases de datos y están desordenados: unidades incoherentes (algunas usan grados Celsius, otras Fahrenheit), muestras repetidas, etiquetas incorrectas. MIRA no solo puede manejar estos problemas básicos automáticamente, sino que también puede usar su "conocimiento físico común" para evaluar la validez de los datos:

Por ejemplo, si los datos del punto de ebullición de una molécula no coinciden con su masa molecular o composición de grupos funcionales (como cuando una molécula de baja masa tiene un punto de ebullición más alto que una de alta masa), MIRA elimina automáticamente esos datos. Esto requeriría que expertos del campo lo revisaran manualmente durante semanas; ahora, el AI lo hace automáticamente.

#### 3. Entrenamiento en tres etapas: combina la experiencia de los LLM con las leyes físicas para hacer que el modelo sea más inteligente

El núcleo de MPA es el "marco de entrenamiento en tres etapas" diseñado por MIRA, que integra el enfoque de entrenamiento de los grandes modelos de lenguaje (LLM) con las leyes físicas de los materiales:

Entrenamiento previo: Aprende la estructura 3D general de 64 millones de moléculas para establecer una base.
Entrenamiento intermedio alineado con la física: Un paso clave: solo aprende lo que comparte mecanismos físicos con las propiedades objetivo (por ejemplo, si las propiedades termodinámicas son "adicitivas", se enfoca en mejorar esa capacidad).
Entrenamiento posterior: Utiliza la pérdida de Huber para reducir la interferencia de valores anómalos (más estable que la pérdida MSE tradicional) y diseña un método que maneje diferentes propiedades dependientes del tamaño de las moléculas (como el calor de combustión) y otras que no lo hacen. Estos cambios permiten que el modelo se adapte automáticamente a las leyes físicas, lo que reduce significativamente los errores (por ejemplo, el error en el calor de combustión disminuyó un 51%).

#### 4. El AI se mejora a sí mismo: ¿ha comenzado la rueda de evolución hacia la AGI?

Los logros de MIRA son impresionantes: SOTA en todas las 40 tareas y predicciones más estables para moléculas nuevas (con menos de un 6% de degradación del rendimiento en comparación con Suiren). Pero lo que es aún más importante es su significado:

Este es el ejemplo más convincente de "AI para AI" (usar AI para mejorar AI): MIRA utiliza IA para reestructurar el código del modelo, optimizar los datos de entrenamiento y diseñar estrategias de entrenamiento, produciendo así un modelo AI más potente. El papel humano ha pasado de ser el "ejecutor" a ser el "determinante de los objetivos".

Una vez que esta rueda de auto-mejora recursiva comience a girar, cada vuelta será más rápida que la anterior (porque un AI más fuerte podrá mejorar al siguiente AI con mayor velocidad). Desde escribir código automáticamente hasta realizar investigación científica y luego mejorarse a sí mismo, los límites de la capacidad del AI se están expandiendo rápidamente, y la AGI podría estar más cerca de lo que imaginamos.

Resumen en una frase

El AI ya es capaz de actuar como un investigador científico y mejorar sus propios modelos; la ciencia de materiales es solo el comienzo. La rueda de la evolución hacia la AGI ya ha comenzado, y el futuro podría llegar más rápido de lo que esperamos.