Краткое содержание
Недавно искусственный интеллект MIRA из команды Deep Principles добился значительного прорыва: благодаря алгоритму рекуррентного самообучения он полностью автономно выполнил весь процесс от перестройки кода, очистки данных до разработки стратегии обучения и создал модель MPA. Эта модель побила все существующие мировые рекорды (SOTA) по 40 задачам прогнозирования характеристик материалов, снизив средний процент ошибок на 10%, а в некоторых случаях — даже на 51%. Более того, это означает, что механизм самоусовершенствования ИИ начал активно функционировать в области материаловедения, что может ускорить появление всеобъемлющего искусственного интеллекта (AGI) раньше, чем мы ожидали.
Подробное объяснение
#### 1. Традиционные модели материалов основывались на количественных методах; MPA использует интеллектуальный подход
Прежняя модель Suiren из Шанхая была примером «грубой силы»: для ее создания использовалось 320 высокопроизводительных GPU и 70 миллионов данных, в результате чего получилась модель с 1,8 миллиарда параметров, победившая на тот момент. Однако у нее был серьезный недостаток — она могла прогнозировать только «расчетные характеристики» (которые можно вычислить с помощью программного обеспечения для квантовой химии), но не могла учитывать важные экспериментальные показатели (температуру кипения, токсичность, растворимость).
Почему? Проблемы с экспериментальными данными крайне сложны: их мало (один эксперимент занимает несколько дней), они сильно зависят от условий (результаты могут отличаться в разных лабораториях), и физические принципы, лежащие в основе этих характеристик, сильно различаются (например, температура кипения зависит от взаимодействия молекул, а токсичность — от биологических процессов). Простое накопление данных и увеличение вычислительных ресурсов не помогает решить эти проблемы. MIRA же использует интеллектуальные методы для нахождения эффективных подходов.
#### 2. ИИ как «всесторонний исследователь»
MIRA не просто инструмент для обработки данных — он действует как полноценный помощник в научных исследованиях:
- Автономное мышление: команда задает ему задачу (например, «Из 3D-структуры молекулы и экспериментальных данных как создать модель для прогнозирования нескольких характеристик?»), и MIRA систематически анализирует все возможные варианты, выбирая наиболее подходящий подход (в данном случае используется структура молекулы UniMol).
- Автономная модификация кода: он самостоятельно перестраивает исходный код существующей модели (а не просто изменяет параметры): удаляет ненужные части, переопределяет потоки данных, стандартизирует интерфейсы между этапами обучения. Люди лишь формулируют задачи и контролируют процесс, не занимаясь написанием кода.
Это отличает MIRA от обычных инструментов: он может вносить изменения на уровне архитектуры модели и алгоритмов обучения, а не просто корректировать параметры.
#### 3. У ИИ есть «научный интуит»: автоматическая обработка данных с учетом физических закономерностей
Экспериментальные данные собираются из разных источников и часто содержат ошибки (несогласованные единицы измерения, повторяющиеся записи, неверные метки). MIRA не только автоматически устраняет эти проблемы, но и использует физический здравый смысл для проверки достоверности данных. Например, если данные о температуре кипения молекулы не соответствуют ее размеру или составу функциональных групп, модель автоматически их отбрасывает. Раньше это требовало многочисленной ручной проверки экспертами.
#### 3-этапная схема обучения: комбинация методов больших языковых моделей и физических закономерностей
Основой MPA является трехэтапная схема обучения, разработанная самим ИИ. Она сочетает в себе подходы больших языковых моделей (LLM) и физические принципы материаловедения:
- Предварительное обучение: изучение структур 64 миллионов молекул для получения общих знаний.
- Средний этап обучения с учетом физических закономерностей: выбираются только те аспекты, которые связаны с целевыми характеристиками (например, термодинамические свойства).
- Последний этап обучения: используется специальный алгоритм для устранения аномалий (в отличие от традиционного метода MSE); часть модели занимается прогнозированием характеристик, зависящих от размера молекул, другая — постоянных характеристик. Это позволяет модели лучше адаптироваться к различным физическим условиям и снижает количество ошибок (например, ошибка прогноза теплоты сгорания уменьшилась на 51%).
#### 4. Алгоритм рекуррентного самообучения: начало эры AGI?
Результаты MIRA впечатляют: по всем 40 задачам модель показала лучшие результаты; кроме того, она более стабильно прогнозирует характеристики незнакомых молекул (по сравнению со Suiren произошло уменьшение ошибок на 6%). Более важно понимание смысла этого достижения: это яркий пример применения подхода «ИИ для ИИ» — ИИ использует свои возможности для улучшения собственных алгоритмов, данных и стратегий обучения. Роль человека изменилась с исполнителя на определение целей. Как только механизм рекуррентного самоусовершенствования начнет работать эффективно, процесс будет ускоряться (более сильный ИИ будет быстрее развивать следующие версии себя). От автоматического написания кода до выполнения научных исследований и самоусовершенствования границы возможностей ИИ стремительно расширяются, и появление AGI может стать реальностью уже в ближайшем будущем.
Вывод
ИИ уже способен самостоятельно заниматься научными исследованиями и улучшать свои модели; материаловедение — это лишь начало. Шестерня развития AGI уже в движении, и будущее может наступить раньше, чем мы ожидаем.