虎嗅

**AGI est sur le point d'arriver : 40 expériences atteignent un niveau de performance inégalé (SOTA), permettant à l'agent intelligent super-récursif de créer de manière autonome le modèle de base le plus puissant pour les matériaux.**

原文:AGI将至,40项实验全面SOTA,超级递归智能体自主打造最强材料基座模型

Résumé des principaux points

Récemment, l'agent de recherche en intelligence artificielle MIRA, développé par l'équipe Deep Principles, a réalisé une avancée majeure : il a réussi à s'améliorer de manière récursive (en se perfectionnant lui-même), accomplissant entièrement le processus allant de la restructuration du code, du nettoyage des données à la conception de stratégies d'entraînement, et a ainsi créé le modèle de base MPA. Ce modèle a battu tous les records mondiaux (SOTA) dans 40 tâches de prédiction expérimentale, avec une réduction moyenne de l'erreur de 10 % et une baisse maximale de 51 %. Plus important encore, cela marque le début du mécanisme d'évolution autonome de l'IA dans le domaine des sciences matérielles, ce qui pourrait accélérer l'avènement de l'intelligence artificielle générale (AGI) plus rapidement que nous ne l'avions anticipé.

Interprétation détaillée

#### 1. Les modèles matériels traditionnels reposent sur la quantité de données, tandis que MPA utilise une approche plus ingénieuse pour surmonter les limites**

Le modèle Suiren, développé à Shanghai, était un exemple typique d'une approche “brutale” : il utilisait 320 cartes graphiques haut de gamme et 70 millions de données pour atteindre une capacité de 1,8 billion de paramètres, ce qui lui a permis de remporter les classements de l'époque. Cependant, il présentait un défaut majeur : il ne pouvait prédire que des propriétés “calculables” (comme celles gérées par des logiciels de chimie quantique), mais pas les propriétés “expérimentales” essentielles dans la recherche et le développement (telles que le point d'ébullition, la toxicité ou la solubilité). Pourquoi ? Les propriétés expérimentales sont extrêmement complexes : les données sont rares (une expérience peut prendre plusieurs jours), il y a beaucoup de bruit (les résultats varient d'un laboratoire à l'autre) et les principes physiques sous-jacents diffèrent fortement (par exemple, le point d'ébullition dépend des interactions moléculaires, tandis que la toxicité est liée à des mécanismes biologiques). La simple accumulation de données et d'équipements ne suffit pas à résoudre ces problèmes de diversité physique. MIRA, quant à lui, utilise l'IA pour trouver des méthodes plus efficaces, sans recourir à une approche brute.

#### 2. L'IA en tant que “chercheur complet” : il pense par lui-même et modifie le code

MIRA n'est pas un simple outil de recherche ; il fonctionne comme un assistant scientifique polyvalent :

  • Réflexion autonome : L'équipe lui pose une question (par exemple : “Avec des structures moléculaires 3D et des étiquettes d'expérience, comment concevoir un modèle de prédiction multi-propriétés ?”). Il analyse systématiquement toutes les options possibles avant de choisir le squelette 3D de UniMol comme base.
  • Modification autonome du code : Il réstructure directement le code source des modèles existants (plutôt que de simplement ajuster les paramètres) ; il identifie les modules redondants, redessine les flux de données et standardise les interfaces entre l'entraînement préliminaire, intermédiaire et final. L'humain n'a qu'à poser les questions et à orienter le processus, sans avoir à écrire une seule ligne de code.

C'est la différence majeure avec les outils traditionnels : MIRA peut modifier le code de base qui gère l'architecture du modèle et le pipeline d'entraînement, plutôt que simplement ajuster des paramètres superficiels.

#### 3. L'IA possède également une “intuition scientifique” : il nettoie automatiquement les données et comprend la physique

Les données expérimentales proviennent de plusieurs bases de données et sont souvent désordonnées (unités incohérentes, échantillons dupliqués, étiquettes incorrectes). MIRA peut non seulement gérer ces problèmes, mais aussi juger la pertinence des données en se basant sur des connaissances physiques fondamentales. Par exemple, s'il constate que les données de point d'ébullition d'une molécule ne correspondent pas à sa masse moléculaire ou à sa composition fonctionnelle, il supprime ces données automatiquement. Cela aurait normalement nécessité plusieurs semaines de travail manuel par un expert du domaine.

#### 4. Une approche d'entraînement en trois étapes : combiner l'expérience des modèles linguistiques et les lois physiques pour rendre le modèle plus performant

Le cœur de MIRA est un cadre d'entraînement en trois étapes conçu par lui-même, qui combine les méthodes des grands modèles linguistiques (LLM) avec les lois physiques des matériaux :

  • Entraînement préliminaire : Apprendre les structures 3D générales de 64 millions de molécules pour poser une base solide.
  • Entraînement intermédiaire aligné sur la physique : Une étape clé ! Se concentrer uniquement sur les propriétés partageant des mécanismes physiques similaires (par exemple, les propriétés thermodynamiques sont additives, donc se spécialiser dans cette capacité).
  • Entraînement final : Utiliser une fonction de perte Huber pour réduire l'impact des valeurs aberrantes (plus stable que la fonction de perte MSE traditionnelle) et concevoir des algorithmes mixtes pour traiter les propriétés qui varient avec la taille des molécules (comme l'enthalpie de combustion) et celles qui restent constantes (comme le point d'éclair).

Ces approches permettent au modèle d'adapter automatiquement aux lois physiques différentes, ce qui a considérablement réduit les erreurs (par exemple, l'erreur pour l'enthalpie de combustion a été réduite de 51 %).

#### 5. L'IA s'améliore elle-même : le mécanisme d'évolution de l'AGI est en marche ?

Les performances de MIRA sont impressionnantes (SOTA dans toutes les 40 tâches) et sa capacité à prédire des molécules inconnues est plus fiable (avec seulement 6 % de dégradation des performances par rapport à Suiren). Mais l'aspect le plus important est son impact sur la recherche scientifique : il s'agit d'une application concrète et convaincante de l'idée “AI pour l'IA” (utiliser l'IA pour améliorer l'IA elle-même). MIRA réstructure le code des modèles, optimise les données d'entraînement et conçoit des stratégies d'entraînement, aboutissant à un modèle encore plus performant. Le rôle de l'humain passe de celui d'exécutant à celui de définitionnaire des objectifs. Une fois ce mécanisme d'amélioration récursive en marche, chaque itération sera plus rapide que la précédente (car une IA plus puissante pourra améliorer encore davantage l'IA suivante). De l'automatisation de la rédaction de code à l'automatisation de la recherche scientifique, puis à l'amélioration de soi-même, les capacités de l'IA se développent rapidement, et l'AGI pourrait être plus proche que nous ne le pensons.

En une phrase

L'IA est désormais capable de fonctionner comme un chercheur scientifique et d'améliorer ses propres modèles. Les sciences matérielles ne sont qu'un début : les roues de l'AGI tournent déjà, et l'avenir pourrait arriver plus rapidement que nous l'avions imaginé.