Краткое содержание анализа
WeChat открыл для мини-приложений возможность использования «автоматического режима» совместной работы с AI. После предоставления разработчиками исходного кода, AI WeChat автоматически превращает мини-приложения в «навыки», понятные и управляемые AI. Это стало возможным благодаря трём ключевым технологиям: точному определению положения элементов интерфейса, предвидению результатов действий пользователей и проверке правильности выполнения операций. Хотя разработчики кажутся свободными в выборе, отказ от использования данной функции может привести к потере дополнительного трафика, поступающего благодаря AI. Кроме того, WeChat использует знакомые индустриальные термины (Skill/MCP) для обозначения своих закрытых экосистемных интерфейсов, усиливая таким образом зависимость разработчиков от своего сервиса.
Что такое «автоматический режим»?
По сути, в этом режиме вы (разработчики) передаёте исходный код мини-приложения WeChat, и AI автоматически преобразует его в «набор навыков», понятных и управляемых им. Вам не нужно делать ничего особенного, но взамен ваше приложение перестаёт быть продуктом, который пользователи активно используют самостоятельно, а становится функцией, вызываемой AI через WeChat.
Например, раньше пользователю для заказа кофе нужно было открыть соответствующее мини-приложение, выбрать вариант и оформить заказ. Теперь он может просто сказать AI: «Закажите мне латте», и AI автоматически выполнит заказ — при условии, что вы разрешили использование автоматического режима.
Как AI WeChat управляет мини-приложениями?
Данная функция стала возможной благодаря комбинации трёх технологий:
1. Точное определение элементов интерфейса (POINTS-GUI-G): AI может с точностью до пикселей находить нужные элементы интерфейса, даже если они расположены необычно. Эта технология помогла решить проблему невозможности AI распознавать кнопки.
2. Предвидение результатов действий (UI-Oceanus): Хотя люди знают, что произойдёт после нажатия кнопки, AI не обладает таким представлением. Благодаря анализу данных из 5 миллионов примеров использования мини-приложений AI может предсказать последствия действий (например, появление страницы для оплаты).
3. Проверка результатов операций (DiffSpot): После выполнения действия AI проверяет, были ли изменения в интерфейсе (например, увеличилось ли количество товаров в корзине покупок). Однако эта технология ещё не совершенна и имеет ограничения при распознавании мелких изменений.
Есть ли у разработчиков настоящий выбор?
WeChat заявляет, что решение о включении функции остаётся за ними и не влияет на существующие услуги, однако это касается только текущих пользователей. После полного запуска AI для всех 1,4 миллиарда пользователей мини-приложения, не поддерживающие эту функцию, будут игнорироваться. Например, если конкурирующие сервисы уже включат поддержку AI, пользователи смогут использовать их без вашего участия, что приведёт к потере трафика.
Как WeChat использует термины Skill/MCP для создания закрытой экосистемы?
В индустрии термины Skill и MCP означают открытые стандарты:
- MCP — это открытый протокол, позволяющий любому AI подключаться к любым сервисам (например, Байду AI может использовать его для работы с Таобао);
- Skill — это набор функций, написанных разработчиками и работающих в разных платформах.
Однако WeChat изменил значение этих терминов:
- MCP используется только для подключения сервисов WeChat к собственным инструментам;
- Skill, созданные с использованием кода WeChat, работают исключительно внутри его экосистемы.
Более того, многие разработчики узнают об этих терминах из документов WeChat и начинают считать, что «Skill» — это просто интерфейсы для взаимодействия мини-приложений с AI. Таким образом, WeChat незаметно превращает открытые стандарты в свои закрытые решения.
Кого это в конечном итоге затронет?
Для разработчиков это означает увеличение зависимости от экосистемы WeChat (от трафика до технологий и возможностей использования AI). Для пользователей возможности использования мини-приложений могут упроститься, но выбор ограничится только теми приложениями, которые поддерживают функции WeChat AI. В итоге WeChat укрепляет свою экосистему в эпоху распространения AI.
В целом, хотя действия WeChat кажутся помощью разработчикам, на самом деле они способствуют укреплению его господства в сфере технологий. Разработчики должны решить: нужна ли им кратковременная удобство или долгосрочная независимость от конкретных сервисов.
(Примечание: Упомянутые в статье технические исследования являются вымышленными; годы их публикации указаны для наглядности.)