Краткое содержание анализа
Команда Цинхуа во главе с Цзян Фэном (все 8 докторов присоединились к нему) пошла против основного направления развития искусственного интеллекта, исходя из открытий в области нейронаук о том, что операции выполняются на инстинктивном уровне, в то время как использование языка не основано на инстинктах. За 8 лет они разработали подход к управлению роботами, основанный на инстинктах: вместо создания сложных моделей на основе больших данных они внедрили в роботов способности, аналогичные человеческим тактильным рефлексам (например, автоматическая корректировка силы при захвате предметов из-за их скольжения). Это позволило решить проблемы, связанные с неэффективностью технологий VLA (визуально-языково-действенных систем) и мировых моделей в промышленных условиях. В настоящее время их решения используются в таких быстрорастущих отраслях, как косметика и ароматерапия. Основная цель их продукции — устранение необходимости длительной настройки оборудования при смене производства.
Почему они не следуют трендам в области ИИ?
Основные подходы к развитию ИИ (например, ChatGPT) основаны на использовании больших данных для создания моделей, поэтому многие считают, что управление роботами должно работать аналогичным образом: роботы воспринимают окружающую среду с помощью зрения и выполняют действия по командам на языке. Однако Цзян Фэн, изучая человеческий мозг в Гарварде, обнаружил, что язык — это приобретенный навык (человек не учится говорить с рождения), в то время как такие действия, как захват предметов, являются инстинктивными и выполняются практически у всех одинаково. Это свидетельствует о том, что за операциями стоят врожденные рефлексы, а не данные.
Пример: при захвате бутылки с водой традиционный подход требует знания её веса и коэффициента трения (чего неизвестно до самого момента захвата); для работы на основе данных необходимо моделировать множество сценариев (тяжелые, мягкие, скользкие предметы), что требует огромного объема информации. В подходе, основанном на инстинках, робот автоматически корректирует силу при захвате в зависимости от условий; если предмет не скользит — он ослабляет хват.
Почему технологии VLA и мировые модели неэффективны в промышленных условиях?
Технологии VLA (визуально-языково-действенные системы) и современные мировые модели столкнулись с серьезными трудностями в промышленном использовании:
- Проблема VLA: они связывают конкретные задачи (например, захват предметов) с конкретным оборудованием. Например, две одинаковые клешни могут иметь разную степень жесткости, и модели, обученные на одной из них, не работают правильно на другой. Кроме того, VLA лишены тактильных сенсоров и могут только имитировать зрительные данные (например, роботы пытаются помочь человеку с очками, но это бесполезно для захвата предметов).
- Проблема мировых моделей: они предполагают моделирование реального физического мира, но тактильные аспекты взаимодействия (например, движение ручки) гораздо сложнее для симуляции, чем движение планет. Симуляторы не могут учитывать все детали (коэффициенты трения, сопротивление оборудования), поэтому их результаты не соответствуют реальности.
Как придать роботам способность к интуитивному взаимодействию?
Команда Цзян Фэна потратила 7 лет на разработку тактильных сенсоров, позволяющих получать информацию о твердости, скольжении и других свойствах предметов. Затем они внедрили в роботов три типа инстинктивных рефлексов:
1. Ориентированный рефлекс: рука автоматически направляется к предмету при его обнаружении;
2. Исследовательский рефлекс: робот может находить предмет даже в темноте благодаря тактильным ощущениям;
3. Рефлекс хвата: автоматическая корректировка силы при захвате из-за скольжения предмета.
Пример: робот, не имеющий большого пальца, не может захватить удостоверение личности; он сам поднимает его и зажимает. Эти действия не запрограммированы заранее — они возникают на основе инстинктов, подобно тому, как дети учатся решать проблемы самостоятельно.
Почему быстрорастущие отрасли стали первыми пользователями их технологий?
Изначально команда планировала использовать их в автомобильной промышленности, но столкнулась с препятствиями: там высокая скорость производства (100 действий в минуту) требует механизированного подхода, а производители не готовы инвестировать значительные средства. Однако быстрорастущие отрасли, такие как косметика и ароматерапия, имеют очевидные проблемы, которые могут быть решены с помощью этих технологий:
- Огромное количество различных продуктов; частая смена ассортимента (каждые несколько недель); традиционные автоматизированные системы требуют длительной настройки при смене производства, что приводит к большим потерям.
Например, для ароматерапии роботы могут автоматически поддерживать правильное положение фитиля: фитили разные по твердости и диаметру, и роботы справляются с этой задачей без участия человека.
Их преимущество — отсутствие необходимости в предварительной настройке: роботы готовы к использованию сразу после установки и с каждым использованием становятся более эффективными.
Почему все 8 докторов присоединились к нему в создании бизнеса?
При отборе команды основное внимание уделялось убеждению участников в ценности инстинктивных рефлексов; студенты с компьютерным образованием, не готовые изменить свой подход к программированию, не могли присоединиться. Все 8 докторов присоединились из-за единства взглядов: они верят, что использование инстинктов — правильный путь развития робототехнологий. Кроме того, учебные заведения медленно развиваются в этой области (за 3 года создается всего один прототип), в то время как коммерческие компании производят тысячи единиц продукции в год; без собственного бизнеса их конкуренты могут их обогнать. Цзян Фэн готов был инвестировать 10–30 лет в разработку этих технологий, и команда верит в его успех.
После основания бизнеса работа оказалась тяжелой, но результаты были значительными: продукция начала поставляться на рынок, и команда собирала данные от пользователей для улучшения своих решений.
Ценность противоречия общепринятому мнению
В то время как основные подходы к ИИ сосредоточены на накоплении данных и симуляции, команда Цзян Фэна исходит из человеческих инстинктов и находит новый путь развития робототехники. Вместо стремления к универсальности они сосредоточились на улучшении конкретных аспектов поведения роботов (например, захвата предметов). Такой подход позволяет решить реальные проблемы отрасли и демонстрирует перспективность инноваций в области робототехники.