虎嗅

AGI将至，40项实验全面SOTA，超级递归智能体自主打造最强材料基座模型

2026-06-02 阅读原文

核心内容总结

最近，深度原理团队的AI科研智能体MIRA搞了个大突破：它通过递归自训练（自己改进自己），全程自主完成从代码重构、数据清洗到训练策略设计的全流程，产出了材料基座模型MPA。这个模型在40项实验性质预测任务中全面刷新全球最好成绩（SOTA），平均误差降低10%，最高降幅达51%。更重要的是，这标志着AI自我进化的“飞轮”在材料科学领域正式启动，可能让通用人工智能（AGI）的到来比我们预想的更快。

详细解读

#### 1. 传统材料模型靠“堆”，MPA靠“巧”破瓶颈

之前上海的Suiren模型是典型的“暴力美学”：用320张高端GPU、7000万条数据堆出1.8B参数量，赢了当时的榜单。但它有个致命缺陷——只能预测“计算性质”（比如量子化学软件能批量算的），却搞不定实际研发中关键的“实验性质”（比如沸点、毒性、溶解度）。

为啥？实验性质的问题太棘手：数据少（一次实验要几天）、噪声大（不同实验室结果不一样）、每个性质背后的物理原理完全不同（比如沸点和分子间作用力有关，毒性和生物机制有关）。靠堆数据堆硬件根本解决不了这些“物理多样性”的问题。MPA就瞄准这个痛点，用AI自主找“巧方法”，不用蛮力。

#### 2. AI当“全栈科研员”：自己想问题、改代码

MIRA不是普通的科研工具，它像个“全能科研助手”：

自主思考：团队抛给它一个问题——“有3D分子结构和实验标签，怎么设计多性质预测模型？”它会先系统性分析所有可能路径，最终选了UniMol的3D骨架作为基础。
自主改代码：它直接重构现有模型的源代码（不是调参数）——比如识别冗余模块、重新设计数据流、把预训练/中间训练/后训练的接口标准化。整个过程人类只负责提问题和确认方向，不用动手写一行代码。

这是它和普通工具的最大区别：它能操作“模型架构和训练管线”的底层代码，而不是只调表面的超参数。

#### 3. AI也有“科研直觉”：自动清理数据还懂物理

实验数据来自多个数据库，乱七八糟的：单位不一致（比如有的用摄氏度有的用华氏度）、重复样本、标签错误。MIRA不仅能自动处理这些基础问题，还能靠“物理常识”判断数据合理性：

比如某个分子的沸点数据，和它的分子量、官能团组成明显不匹配（比如一个小分子量分子沸点比大分子量的还高），MIRA会直接把这个数据删掉。这本来要领域专家花几周人工审核，现在AI自动搞定。

#### 4. 三阶段训练：把LLM经验+物理规律，让模型更聪明

MPA的核心是MIRA自主设计的“三阶段训练框架”，把大语言模型（LLM）的训练思路和材料物理规律结合：

预训练：学6400万分子的通用3D结构，打下基础；
物理对齐中间训练：关键一步！只学和目标性质“共享物理机制”的内容（比如热力学性质是“加和性”的，就专门练加和能力）；
后训练：用Huber损失减少异常值干扰（比传统MSE损失更稳），设计“混合读出头”——一部分处理随分子大小变化的性质（比如燃烧焓），一部分处理不变的性质（比如闪点）。

这些设计让模型能自动适配不同性质的物理规律，误差降了很多（比如燃烧焓误差直接降了51%）。

#### 5. AI自己改进自己，AGI的飞轮转起来了？

MPA的战绩很亮眼：40项任务全SOTA，对没见过的新分子预测也更稳（性能退化比Suiren少6%）。但更重要的是它背后的意义：

这是“AI for AI”（用AI改进AI）最有说服力的落地——MIRA用AI重构模型代码、优化训练数据、设计训练策略，最终产出更强的AI模型。人类的角色从“执行者”变成了“目标设定者”。

一旦这个“递归自改进”的飞轮转起来，每一圈都会比上一圈更快（因为更强的AI能更快改进下一个AI）。从自动写代码到自动做科研，再到自动改进自己，AI的能力边界正在加速扩展，AGI可能真的离我们不远了。

一句话总结

AI已经能自己当科研员，改进自己的模型，材料科学只是开始——AGI的齿轮已经转动，未来可能比我们想的来得更快。