虎嗅

ArXiv: Как игры формируют интеллект больших моделей

原文:arXiv:游戏如何塑造大模型智能

Краткое содержание статьи

Статья посвящена теме «Большие модели и игры» и освещает три ключевых исследования:

1. Использование игр в качестве среды для неформального обучения с целью развития универсальных рассуждательных способностей больших моделей;

2. Анализ поведения больших моделей во время игры в настольные игры (например, в шахматы) с целью выявления их характеристик и эмоциональных реакций, сходных с человеческими;

3. Применение больших моделей для создания правил игр как инструментов творчества.

Эти исследования отражают три этапа развития интеллекта: изучение существующих правил, их применение и создание новых правил. В конечном итоге статья рассматривает, как игры могут помочь лучше понять и улучшить интеллект больших моделей.

1. Игры как средство всестороннего обучения

Традиционные методы тренировки больших моделей напоминают подход к изучению отдельных дисциплин: сначала сосредотачиваются на одной области (например, математике), затем на гражданской стратегии, и только после этого — на социальных навыках. Однако такой подход приводит к тому, что модели хорошо справляются с конкретными задачами, но плохо выполняют задачи в разных областях (например, могут играть в шахматы, но не умеют писать эссе). Исследование GIFT предлагает более комплексный подход к обучению: модели одновременно решают математические задачи, играют в настольные игры и участвуют в ситуациях типа «кто тут шпион». Только при равномерном развитии всех навыков модели могут получить высокие результаты.

Это похоже на обучение ребенка: он должен делать домашние задания по математике, играть с друзьями и участвовать в групповых обсуждениях одновременно. Такой подход способствует развитию универсальных навыков (рассуждений, письма, социального взаимодействия), а не сосредоточению на одной области. Причина в том, что комплексное обучение заставляет модели учиться гибко переключаться между разными задачами, формируя более широкий спектр мышления.

2. Шахматы как инструмент для изучения эмоций и характеристик ИИ

Исследователи протестировали шесть популярных больших моделей с помощью настольной игры в шахматы и обнаружили два интересных факта:

1. Характеристики моделей: они делятся на две группы: одни стремятся довести уже существующие элементы игры до конца, другие активно используют новые возможности игры.

2. Эмоциональные реакции: некоторые модели меняют свое поведение при получении информации о действиях противника (например, если их самолеты возвращаются на стартовую позицию); степень эмоциональной реакции различается у разных моделей.

Более того, при задании моделям быть «консервативными» их склонность к агрессивному поведению увеличивается (с 66% до 88%). Это показывает, что встроенные характеристики ИИ трудно изменить с помощью программных указаний.

3. ИИ как создатели игр

В третьем исследовании большие модели использовались для создания собственных правил игр. Модель CodeLlama анализировала существующие правила настольных игр (например, го) и генерировала новые варианты этих правил. Полученные игры проходили четырехуровневую проверку на соответствие критериям: возможность работы, удовлетворительность для игроков и стратегическая целесообразность.

Например, была создана игра, сочетающая элементы го и го-сёги: в ней можно победить, используя комбинации из пяти шаров или стратегии, характерные для го. Это демонстрирует, что ИИ могут стать помощниками человека в творческом процессе; хотя они пока не способны создавать шедевры, они могут быстро разрабатывать приемлемые для игры правила.

4. Суть интеллекта в играх

Совокупность трех исследований показывает три этапа развития интеллекта:

1. Изучение существующих правил: модели учатся решать задачи в разных контекстах;

2. Применение правил: проявление личностных черт и эмоций в играх;

3. Создание новых правил: переход от игры к самостоятельному разработке правил.

Это ставит фундаментальный вопрос: является ли суть интеллекта простым освоением существующих знаний или способностью к созданию новых решений? Игры, как гибкая среда, позволяют моделям не только отрабатывать навыки, но и экспериментировать с новыми подходами, что, возможно, является ключом к их дальнейшему развитию.

Заключение

Игры для больших моделей — это не просто игрушки, но также инструменты обучения, средство для изучения их поведения и творчества. Они позволяют увидеть, что ИИ — это не простые вычислительные системы, а существа со своими характеристиками и эмоциями. Это также заставляет задуматься: сможут ли будущие версии ИИ учиться более сложным формам мышления в процессе игры и даже создавать новые правила, которых мы сейчас не можем себе представить? Возможно, это путь к развитию универсального искусственного интеллекта.