Краткое содержание статьи
Статья посвящена теме «Большие модели и игры» и освещает три ключевых исследования:
1. Использование игр в качестве среды для неформального обучения с целью развития универсальных рассуждательных способностей больших моделей;
2. Анализ поведения больших моделей во время игры в настольные игры (например, в шахматы) с целью выявления их характеристик и эмоциональных реакций, сходных с человеческими;
3. Применение больших моделей для создания правил игр как инструментов творчества.
Эти исследования отражают три этапа развития интеллекта: изучение существующих правил, их применение и создание новых правил. В конечном итоге статья рассматривает, как игры могут помочь лучше понять и улучшить интеллект больших моделей.
1. Игры как средство всестороннего обучения
Традиционные методы тренировки больших моделей напоминают подход к изучению отдельных дисциплин: сначала сосредотачиваются на одной области (например, математике), затем на гражданской стратегии, и только после этого — на социальных навыках. Однако такой подход приводит к тому, что модели хорошо справляются с конкретными задачами, но плохо выполняют задачи в разных областях (например, могут играть в шахматы, но не умеют писать эссе). Исследование GIFT предлагает более комплексный подход к обучению: модели одновременно решают математические задачи, играют в настольные игры и участвуют в ситуациях типа «кто тут шпион». Только при равномерном развитии всех навыков модели могут получить высокие результаты.
Это похоже на обучение ребенка: он должен делать домашние задания по математике, играть с друзьями и участвовать в групповых обсуждениях одновременно. Такой подход способствует развитию универсальных навыков (рассуждений, письма, социального взаимодействия), а не сосредоточению на одной области. Причина в том, что комплексное обучение заставляет модели учиться гибко переключаться между разными задачами, формируя более широкий спектр мышления.
2. Шахматы как инструмент для изучения эмоций и характеристик ИИ
Исследователи протестировали шесть популярных больших моделей с помощью настольной игры в шахматы и обнаружили два интересных факта:
1. Характеристики моделей: они делятся на две группы: одни стремятся довести уже существующие элементы игры до конца, другие активно используют новые возможности игры.
2. Эмоциональные реакции: некоторые модели меняют свое поведение при получении информации о действиях противника (например, если их самолеты возвращаются на стартовую позицию); степень эмоциональной реакции различается у разных моделей.
Более того, при задании моделям быть «консервативными» их склонность к агрессивному поведению увеличивается (с 66% до 88%). Это показывает, что встроенные характеристики ИИ трудно изменить с помощью программных указаний.
3. ИИ как создатели игр
В третьем исследовании большие модели использовались для создания собственных правил игр. Модель CodeLlama анализировала существующие правила настольных игр (например, го) и генерировала новые варианты этих правил. Полученные игры проходили четырехуровневую проверку на соответствие критериям: возможность работы, удовлетворительность для игроков и стратегическая целесообразность.
Например, была создана игра, сочетающая элементы го и го-сёги: в ней можно победить, используя комбинации из пяти шаров или стратегии, характерные для го. Это демонстрирует, что ИИ могут стать помощниками человека в творческом процессе; хотя они пока не способны создавать шедевры, они могут быстро разрабатывать приемлемые для игры правила.
4. Суть интеллекта в играх
Совокупность трех исследований показывает три этапа развития интеллекта:
1. Изучение существующих правил: модели учатся решать задачи в разных контекстах;
2. Применение правил: проявление личностных черт и эмоций в играх;
3. Создание новых правил: переход от игры к самостоятельному разработке правил.
Это ставит фундаментальный вопрос: является ли суть интеллекта простым освоением существующих знаний или способностью к созданию новых решений? Игры, как гибкая среда, позволяют моделям не только отрабатывать навыки, но и экспериментировать с новыми подходами, что, возможно, является ключом к их дальнейшему развитию.
Заключение
Игры для больших моделей — это не просто игрушки, но также инструменты обучения, средство для изучения их поведения и творчества. Они позволяют увидеть, что ИИ — это не простые вычислительные системы, а существа со своими характеристиками и эмоциями. Это также заставляет задуматься: сможут ли будущие версии ИИ учиться более сложным формам мышления в процессе игры и даже создавать новые правила, которых мы сейчас не можем себе представить? Возможно, это путь к развитию универсального искусственного интеллекта.