虎嗅

AGI将至,40项实验全面SOTA,超级递归智能体自主打造最强材料基座模型

核心内容总结

最近,深度原理团队的AI科研智能体MIRA搞了个大突破:它通过递归自训练(自己改进自己),全程自主完成从代码重构、数据清洗到训练策略设计的全流程,产出了材料基座模型MPA。这个模型在40项实验性质预测任务中全面刷新全球最好成绩(SOTA),平均误差降低10%,最高降幅达51%。更重要的是,这标志着AI自我进化的“飞轮”在材料科学领域正式启动,可能让通用人工智能(AGI)的到来比我们预想的更快。

详细解读

#### 1. 传统材料模型靠“堆”,MPA靠“巧”破瓶颈

之前上海的Suiren模型是典型的“暴力美学”:用320张高端GPU、7000万条数据堆出1.8B参数量,赢了当时的榜单。但它有个致命缺陷——只能预测“计算性质”(比如量子化学软件能批量算的),却搞不定实际研发中关键的“实验性质”(比如沸点、毒性、溶解度)。

为啥?实验性质的问题太棘手:数据少(一次实验要几天)、噪声大(不同实验室结果不一样)、每个性质背后的物理原理完全不同(比如沸点和分子间作用力有关,毒性和生物机制有关)。靠堆数据堆硬件根本解决不了这些“物理多样性”的问题。MPA就瞄准这个痛点,用AI自主找“巧方法”,不用蛮力。

#### 2. AI当“全栈科研员”:自己想问题、改代码

MIRA不是普通的科研工具,它像个“全能科研助手”:

  • 自主思考:团队抛给它一个问题——“有3D分子结构和实验标签,怎么设计多性质预测模型?”它会先系统性分析所有可能路径,最终选了UniMol的3D骨架作为基础。
  • 自主改代码:它直接重构现有模型的源代码(不是调参数)——比如识别冗余模块、重新设计数据流、把预训练/中间训练/后训练的接口标准化。整个过程人类只负责提问题和确认方向,不用动手写一行代码。

这是它和普通工具的最大区别:它能操作“模型架构和训练管线”的底层代码,而不是只调表面的超参数。

#### 3. AI也有“科研直觉”:自动清理数据还懂物理

实验数据来自多个数据库,乱七八糟的:单位不一致(比如有的用摄氏度有的用华氏度)、重复样本、标签错误。MIRA不仅能自动处理这些基础问题,还能靠“物理常识”判断数据合理性:

比如某个分子的沸点数据,和它的分子量、官能团组成明显不匹配(比如一个小分子量分子沸点比大分子量的还高),MIRA会直接把这个数据删掉。这本来要领域专家花几周人工审核,现在AI自动搞定。

#### 4. 三阶段训练:把LLM经验+物理规律,让模型更聪明

MPA的核心是MIRA自主设计的“三阶段训练框架”,把大语言模型(LLM)的训练思路和材料物理规律结合:

  • 预训练:学6400万分子的通用3D结构,打下基础;
  • 物理对齐中间训练:关键一步!只学和目标性质“共享物理机制”的内容(比如热力学性质是“加和性”的,就专门练加和能力);
  • 后训练:用Huber损失减少异常值干扰(比传统MSE损失更稳),设计“混合读出头”——一部分处理随分子大小变化的性质(比如燃烧焓),一部分处理不变的性质(比如闪点)。

这些设计让模型能自动适配不同性质的物理规律,误差降了很多(比如燃烧焓误差直接降了51%)。

#### 5. AI自己改进自己,AGI的飞轮转起来了?

MPA的战绩很亮眼:40项任务全SOTA,对没见过的新分子预测也更稳(性能退化比Suiren少6%)。但更重要的是它背后的意义:

这是“AI for AI”(用AI改进AI)最有说服力的落地——MIRA用AI重构模型代码、优化训练数据、设计训练策略,最终产出更强的AI模型。人类的角色从“执行者”变成了“目标设定者”。

一旦这个“递归自改进”的飞轮转起来,每一圈都会比上一圈更快(因为更强的AI能更快改进下一个AI)。从自动写代码到自动做科研,再到自动改进自己,AI的能力边界正在加速扩展,AGI可能真的离我们不远了。

一句话总结

AI已经能自己当科研员,改进自己的模型,材料科学只是开始——AGI的齿轮已经转动,未来可能比我们想的来得更快。