Краткое содержание анализа
В последнее время в области антропоморфного интеллекта (интеллекта роботов, способных воспринимать окружающую среду, принимать решения и действовать подобно людям) наблюдается следующая тенденция: те, кто занимается сбором данных для обучения роботов, уже заработали деньги, в то время как сами роботы пока не приносят значительной прибыли. Компании, специализирующиеся на сборе данных, получили крупные инвестиции и заказы; к этому процессу присоединились такие крупные игроки, как Bosch и JD.com. Данная ниша перешла от вспомогательного бизнеса роботостроительных компаний к самостоятельной сфере, ценность которой определяется капиталом. Причинами этого явления являются большой дефицит данных, высокий спрос и влияние инвестиций. Существует три основных типа участников рынка: специализированные компании, компании, разделяющие процесс производства роботов на отдельные этапы (включая сбор данных), и трансграничные гиганты. Вступление крупных игроков меняет логику развития индустрии, и в будущем качество и взаимосвязь данных станут ключевыми факторами ее успеха.
Почему сбор данных приносит больше доходов, чем производство роботов? Три основных причины
Чтобы понять этот феномен, необходимо учитывать важность данных для антропоморфного интеллекта:
1. Огромный дефицит данных: большие языковые модели (например, GPT) используют тексты с интернета, но антропоморфные модели нуждаются в данных о взаимодействии роботов с реальным миром (например, трехмерных траекториях движения для захвата предметов или обхода препятствий). Количество таких данных в мире составляет всего около 500 тысяч часов, что менее одной десятой от объема данных, используемых языковыми моделями. Кроме того, форматы данных различных роботов и сенсоров не унифицированы, что усугубляет проблему дефицита.
2. Высокий спрос: как компании, создающие модели, так и производители роботов стремятся приобрести данные в первую очередь, поскольку это позволяет быстрее начать их разработку и предоставить клиентам. Например, Bosch и CATL инвестируют значительные средства в сотрудничество с компаниями, занимающимися сбором данных, поскольку они понимают, что качество данных определяет возможности роботов.
3. Инвестиции капитала: с 2026 года порог инвестирований в производство роботов вырос (оценка ведущих компаний превышает 10 миллиардов), и малые организации не могут себе этого позволить, поэтому они переключаются на более перспективный сектор сбора данных.
Эти факторы вместе привели к тому, что сбор данных стал более прибыльным направлением.
Три типа участников рынка
Сейчас игроки на рынке сбора данных делятся на три категории:
1. Специализированные компании: они не занимаются производством роботов, а только созданием инфраструктуры для сбора данных. Например, Guanglu Intelligence стала первым в мире унисонером в этой области (оценка более 1 миллиарда долларов) и получила заказ на сумму 550 миллионов долларов в первом квартале; среди ее клиентов – Nvidia, ByteDance и Zhuyuan Robotics.
2. Компании, разделяющие процесс производства роботов на этапы: они выделяют бизнес по сбору данных в отдельную часть. Например, Zhuyuan Robotics создала компанию MeetBee Technology, которая получила инвестиции в размере нескольких миллиардов долларов за 10 дней; такой подход позволяет сосредоточиться на производстве роботов и одновременно получать доход от сбора данных.
3. Трансграничные гиганты: они используют свои преимущества в конкретных сферах для вступления на рынок. Например, JD.com мобилизовала 600 тысяч человек для сбора данных в реальных условиях (с использованием собственных логистических и складских ресурсов).
Вступление крупных компаний меняет правила игры
Участие крупных игроков приводит к двум ключевым изменениям в индустрии:
1. Эффект масштаба: JD.com обладает большими логистическими ресурсами, что позволяет собирать большие объемы данных; такой масштаб снижает затраты на сбор данных и делает его доступным для других компаний.
2. Строительство платформ: сервисы типа «супермаркетов данных» от Baidu и JD.com превращают разрозненные данные в стандартизированные ресурсы, которые могут использоваться всеми участниками рынка. Это вынуждает малые компании пересмотреть свою стратегию: либо стать поставщиками данных для платформ, либо разрабатывать инструменты для работы с данными, либо тесно сотрудничать с конкретными сценариями использования роботов.
Кто будет контролировать качество данных?
Победитель в этой гонке за данные определит правила развития индустрии антропоморфного интеллекта. Важны не объемы собранных данных, а следующие факторы:
1. Влияние на стандарты качества данных: компании, такие как CATL и Bosch, будут отбирать партнеров по сбору данных, предоставляющих данные промышленного уровня и проверенные в реальных условиях. Тот, кто сможет установить стандарты качества данных (например, точность захвата предметов менее 0,1 миллиметра), получит контроль над развитием индустрии.
2. Взаимосвязь данных: если данные из различных источников смогут быть объединены в единый стандарт, они станут ключевым ресурсом для антропоморфного интеллекта. Как и нефть в прошлом, данные будут определять динамику развития всей индустрии.
В конечном итоге изменение структуры рынка антропоморфного интеллекта будет зависеть не от самих роботов, а от данных, которые используются для их работы.