虎嗅

**AGI steht bevor – 40 Experimente erreichen das beste bisherige Niveau (SOTA); der super-rekursive intelligente Agent entwickelt eigenständig das stärkste Materialbasismodell.** *(AGI is approaching; 40 experiments have reached the best-ever level (SOTA). The super-recurrent intelligent agent has independently created the strongest material-based model.)*

原文:AGI将至,40项实验全面SOTA,超级递归智能体自主打造最强材料基座模型

Zusammenfassung der Kerninhalte:

Kürzlich hat das AI-Forschungsagentur MIRA des Deep Principles Teams einen bedeutenden Durchbruch erzielt: Es hat mithilfe von rekursivem Selbsttraining (dem kontinuierlichen Verbessern seiner eigenen Fähigkeiten) den gesamten Prozess – von der Codeumstrukturierung über die Datenreinigung bis zur Gestaltung der Trainingsstrategie – vollständig eigenständig durchgeführt und das Materialbasismodell MPA entwickelt. Dieses Modell hat in 40 experimentellen Vorhersageaufgaben die weltweit besten Ergebnisse (SOTA) erzielt, wobei der Durchschnittsfehler um 10% und der maximale Fehler sogar um 51% reduziert wurde. Noch wichtiger ist jedoch, dass dies das „Antriebsrad“ der selbstständigen Evolution von AI im Bereich der Materialwissenschaften in Gang gesetzt hat und möglicherweise dazu führt, dass die Ankunft des allgemeinen künstlichen Intelligenzes (AGI) schneller stattfindet, als wir erwartet haben.

Detaillierte Erklärung:

#### 1. Herkömmliche Materialmodelle basieren auf „Masse“, MPA nutzt „Einfallsreichtum“, um Engpässe zu überwinden**

Das frühere Suiren-Modell aus Shanghai war ein typisches Beispiel für die „Violent-Aesthetics“-Ansatz: Es verwendete 320 hochleistungsstarke GPUs und 70 Millionen Datensätze, um ein Modell mit 1,8 Milliarden Parametern zu erstellen und damit die damaligen Bestleistungen zu übertreffen. Allerdings hatte es einen entscheidenden Nachteil: Es konnte nur „rechenbasierte Eigenschaften“ vorhersagen (die beispielsweise von Quantenchemie-Software berechnet werden können), aber nicht die für die praktische Forschung wichtigen „experimentellen Eigenschaften“ (wie Siedepunkte, Toxizität, Löslichkeit). Der Grund dafür ist, dass experimentelle Eigenschaften äußerst schwierig zu erfassen sind: Es gibt wenig Daten (eine einzelne Experimentierung dauert oft mehrere Tage), viel Rauschen (die Ergebnisse variieren zwischen verschiedenen Laboren) und die physikalischen Prinzipien hinter diesen Eigenschaften sind sehr unterschiedlich (z. B. hängt der Siedepunkt von den Wechselwirkungen zwischen Molekülen ab, während Toxizität mit biologischen Mechanismen zusammenhängt). Die bloße Anreicherung von Daten und Hardware reicht nicht aus, um diese Probleme zu lösen. MPA zielt genau auf dieses Problem ab und nutzt künstliche Intelligenz, um „einfallsreiche“ Lösungen zu finden – anstatt blinden Kraftaufwand zu betreiben.

#### 2. AI als „Full-Stack-Forscher“: Es denkt selbst und ändert den Code

MIRA ist kein gewöhnliches Forschungswerkzeug, sondern eher ein „allrounder Forschungsassistent“:

  • Selbstständiges Denken: Das Team stellt MIRA eine Frage – „Mit einer 3D-Molekularstruktur und Experimentdatenetiketten: Wie kann man ein Modell für die Vorhersage mehrerer Eigenschaften entwickeln?“ MIRA analysiert zunächst alle möglichen Ansätze systematisch und wählt schließlich das 3D-Gerüst von UniMol als Grundlage aus.
  • Selbstständige Codeänderungen: Es rekonstruiert den Quellcode des bestehenden Modells direkt (anstatt nur Parameter zu anpassen); beispielsweise erkennt es überflüssige Module, gestaltet die Datenflüsse um und standardisiert die Schnittstellen für das Vor-Training, Zwischentraining und Nachtraining. Der Mensch ist während des gesamten Prozesses lediglich dafür verantwortlich, Fragen zu stellen und die Richtung vorzugeben – ohne selbst einen einzigen Codezeilenschreibzug ausführen zu müssen.

Dies unterscheidet MIRA von herkömmlichen Werkzeugen: Es kann den zugrundeliegenden Code der Modellarchitektur und des Trainingsprozesses direkt bearbeiten, anstatt nur die Oberflächenparameter anzupassen.

#### 3. AI besitzt auch „forschungsmäßiges Gespür“: Es reinigt Daten automatisch und versteht die Physik

Die Experimentaldaten stammen aus verschiedenen Datenbanken und sind oft unordentlich strukturiert (ungleiche Einheiten, Duplikate, fehlerhafte Etiketten). MIRA kann nicht nur diese grundlegenden Probleme automatisch lösen, sondern auch mithilfe von physikalischen Kenntnissen die Gültigkeit der Daten beurteilen. Wenn beispielsweise die Siedepunktdaten eines Moleküls offensichtlich nicht mit seiner Molekülmasse oder seinen funktionellen Gruppen übereinstimmen, wird dieses Datenelement automatisch entfernt. Dieser Prozess, der früher Wochen manueller Überprüfung durch Fachleute erforderte, wird nun von AI in Sekundenschnelle abgewickelt.

#### 4. Dreistufiges Training: Kombination von LLM-Erfahrung und physikalischen Gesetzen macht das Modell intelligenter

Der Kern von MPA ist das von MIRA selbst entwickelte „Dreistufige Trainingsframework“, das die Trainingsmethoden großer Sprachmodelle (LLMs) mit den physikalischen Gesetzen der Materialwissenschaften verbindet:

  • Vortraining: Es lernt die allgemeinen 3D-Strukturen von 64 Millionen Molekülen, um eine solide Grundlage zu schaffen.
  • Physikalisch ausgerichtetes Zwischentraining: Ein entscheidender Schritt – es konzentriert sich nur auf Inhalte, die mit den Ziel Eigenschaften gemeinsame physikalische Mechanismen haben (z. B. thermodynamische Eigenschaften, die additiv sind).
  • Nachtraining: Mithilfe der Huber-Loss-Funktion werden Abweichungen reduziert; außerdem wird ein „gemischtes Lernverfahren“ eingesetzt: Ein Teil des Modells kümmert sich um Eigenschaften, die mit der Molekülgröße variieren (z. B. Verbrennungsenthalpie), der andere Teil um unveränderliche Eigenschaften (z. B. Flashpoint). Diese Ansätze ermöglichen es dem Modell, sich automatisch an verschiedene physikalische Gesetze anzupassen, wodurch die Fehler erheblich verringert werden (z. B. der Fehler bei der Verbrennungsenthalpie um 51%).

#### 5. AI verbessert sich selbst – beginnt der „Antriebsprozess für AGI“?

Die Leistung von MPA ist beeindruckend: In allen 40 Aufgaben erreicht es die besten Ergebnisse weltweit, und die Vorhersagen für unbekannte Moleküle sind stabiler (der Leistungsverfall ist nur halb so hoch wie beim Suiren-Modell). Noch wichtiger ist jedoch der tiefere Sinn dahinter: Dies ist ein überzeugendes Beispiel für den Ansatz „AI for AI“ – MIRA nutzt künstliche Intelligenz, um den Modellcode zu verbessern, die Trainingsdaten zu optimieren und die Trainingsstrategien zu entwickeln, wodurch letztendlich ein stärkeres AI-Modell entsteht. Die Rolle des Menschen hat sich von einem „Ausführer“ in einen „Zielsetzer“ verwandelt. Sobald dieser „rekursive Selbstverbesserungsprozess“ in Gang kommt, wird jede weitere Runde schneller verlaufen (denn ein stärkeres AI-System kann das nächste System noch effizienter verbessern). Von der automatischen Codeerstellung über die Forschung bis hin zur Selbstverbesserung dehnen sich die Möglichkeiten künstlicher Intelligenz rasant aus – die Ankunft von AGI könnte tatsächlich schneller eintreten, als wir es uns vorstellen.

Zusammenfassung in einem Satz:

Künstliche Intelligenz ist bereits in der Lage, selbst als Forscher zu fungieren und ihre eigenen Modelle zu verbessern. Die Materialwissenschaften sind nur der Anfang – das Rad der Entwicklung von AGI hat sich bereits in Bewegung gesetzt, und die Zukunft könnte schneller kommen, als wir erwarten.