虎嗅

**AGIの到来に向けて、40件の実験でSOTAを達成!超高度な再帰型知能エージェントが独自に最強の材料ベースモデルを構築**

原文:AGI将至,40项实验全面SOTA,超级递归智能体自主打造最强材料基座模型

核心内容の要約

最近、Deep Principlesチームが開発したAI研究エージェント「MIRA」は大きな進歩を遂げました。MIRAは再帰的自訓練(自己改善)により、コードの再構築からデータのクリーニング、トレーニング戦略の設計までの全プロセスを完全に自律的に行い、MPAというモデルを生成しました。このMPAは40項目の実験的予測タスクにおいて世界最高の成績(SOTA)を更新し、平均誤差を10%削減し、最大で51%もの改善を達成しました。何よりも重要なのは、これが材料科学分野におけるAIの自己進化の「飛輪」が本格的に始動したことを意味し、汎用人工知能(AGI)の到来が私たちが予想していたよりも早くなる可能性があるということです。

詳細な解説

#### 1. 従来の材料モデルは「量」に頼っていたが、MPAは「工夫」でボトルネックを突破

以前、上海のSuirenモデルは典型的な「ハードコアなアプローチ」でした。320枚の高性能GPUと7000万件のデータを使って18億個のパラメータを構築し、当時のランキングで勝利しました。しかし、このモデルには致命的な欠点がありました。それは「計算上の性質」(例えば量子化学ソフトウェアで一括処理できるもの)しか予測できず、実際の研究開発で重要な「実験上の性質」(沸点、毒性、溶解度など)を予測することができなかったのです。

なぜでしょうか?実験上の性質は非常に複雑で、データが少なく(1回の実験に数日かかる)、ノイズが多く(異なる研究室で結果が異なる)、各性質の背後にある物理的原理もまったく異なるからです(例えば沸点は分子間の相互作用に関連し、毒性は生物学的メカニズムに関連する)。データやハードウェアを増やすだけではこれらの問題を解決できません。MPAはこの痛点に焦点を当て、AIを使って「工夫」を凝らし、力任せではなく効率的な方法を見つけ出しました。

#### 2. AIが「フルスタックの科学研究者」として機能する

MIRAは単なる研究ツールではありません。まるで「全能の研究アシスタント」のようです:

  • 自律的な思考:チームがMIRAに問題を提示すると(「3D分子構造と実験データがある場合、複数の性質を予測するモデルをどのように設計するか?」)、MIRAはすべての可能性を系統的に分析し、最終的にUniMolの3D骨格を基盤として選択します。
  • 自律的なコードの改修:MIRAは既存のモデルのソースコードを直接再構築します(パラメータを調整するだけではありません)。例えば、冗長な部分を削除したり、データフローを再設計したり、事前トレーニング/中間トレーニング/後処理のインターフェースを標準化します。このプロセス全体で人間が行うのは問題を提起し方向性を確認することだけで、コードを1行も書く必要はありません。

これがMIRAと一般的なツールの大きな違いです。MIRAはモデルアーキテクチャやトレーニングパイプラインの低レベルのコードを操作できるのです。

#### 3. AIにも「科学研究の直感」がある:自動的なデータクリーニングと物理的な判断

実験データは複数のデータベースから集められており、非常に乱雑です。単位が統一されていない(摂氏度と華氏度が混在している)、重複するサンプルがあったり、ラベルに誤りがあったりします。MIRAはこれらの基本的な問題を自動的に処理するだけでなく、「物理的な常識」を使ってデータの信頼性を判断します。例えば、ある分子の沸点データがその分子量や官能基の組成と明らかに一致しない場合(小さな分子量の分子の方が大きな分子量の分子よりも沸点が高い)、MIRAはそのデータを自動的に除外します。これは専門家が数週間かけて手作業で行う必要がある作業ですが、今ではAIが自動的に処理してくれます。

#### 3段階のトレーニング:LLMの知識と物理法則を組み合わせてモデルをより賢くする

MPAの核心は、MIRAが独自に設計した「3段階のトレーニングフレームワーク」です。これにより、大規模言語モデル(LLM)のトレーニング手法と材料科学の物理法則を組み合わせています:

  • 事前トレーニング:6400万個の分子の一般的な3D構造を学び、基盤を築きます。
  • 物理的に整合した中間トレーニング:重要なステップです!目標とする性質と「物理的なメカニズムが共通する内容」のみを学びます(例えば熱力学性質は加法的であるため、その計算能力を特化して訓練します)。
  • 後処理トレーニング:Huber損失を使用して異常値の影響を減らし(従来のMSE損失よりも安定性が高い)、分子のサイズに応じて変化する性質(例えば燃焼熱)と変わらない性質(例えば引火点)をそれぞれ処理します。

これらの設計により、モデルは異なる物理法則に自動的に適応し、誤差が大幅に削減されました(燃焼熱の誤差は51%も減少しました)。

#### 4. AIが自己改善する:AGIの飛輪が回り始めた?

MPAの成果は非常に顕著です。40項目のタスクでSOTAを達成し、見たことのない新しい分子の予測も安定しています(性能の劣化はSuirenよりも6%少ない)。しかし、何よりも重要なのはその背後にある意味です。これは「AI for AI」(AIを使ってAIを改善する)の最も説得力のある実証例です。MIRAはAIを使ってモデルコードを再構築し、トレーニングデータを最適化し、トレーニング戦略を設計し、より強力なAIモデルを生み出しています。人間の役割は「実行者」から「目標設定者」へと変わりました。

この「再帰的自改善」のプロセスが始まると、毎回前回よりも速く進化します(より強力なAIが次のAIをより迅速に改善するからです)。コードの自動生成から科学研究の自動化、そして自己改善まで、AIの能力の限界は急速に拡大しており、AGIの実現はもう遠くないかもしれません。

一言での要約

AIはすでに科学研究者として機能し、自分自身のモデルを改善することができます。材料科学はその始まりに過ぎません——AGIの歯車はすでに回り始めており、未来は私たちが想像しているよりも早くやってくるかもしれません。