Краткое содержание анализа
WeChat тестирует встроенного AI-агента, который может взаимодействовать с мини-приложениями в приложении WeChat, помогая пользователям выполнять повседневные задачи, такие как заказ кофе или поиск ресторанов. В отличие от подхода DouBao, который предусматривает использование отдельного AI-интерфейса, WeChat идет путем интеграции ИИ в существующую экосистему. С технической точки зрения для реализации этого используется метод GUI Agent (AI ведет себя так, как человек, интерагируя с пользовательским интерфейсом и нажимая на кнопки), что избавляет разработчиков мини-приложений от необходимости выполнения дополнительных настроек. WeChat обладает уникальными преимуществами: данными о предпочтениях пользователей (1,4 миллиарда человек), возможностями множества мини-приложений и замкнутой системой платежей. Однако существуют и сложности, связанные с высокими затратами на обработку данных, неопределенностью границ доступа к функциям и недостаточной точностью распознавания пользовательских действий. В будущем бизнес-модель WeChat может перейти от продажи рекламы к предоставлению услуг за плату, что приведет к формированию двух разных направлений развития ИИ — одного в рамках WeChat, другого — в рамках DouBao.
Подробный анализ
1. WeChat AI Agent vs DouBao: два противоположных подхода к использованию ИИ
DouBao представляет собой отдельный инструмент для взаимодействия с пользователем (например, для выполнения задач типа написания домашних заданий или обработки фотографий); WeChat AI Agent, напротив, интегрирован в уже существующую экосистему приложений WeChat. Пользователи могут просто использовать WeChat для общения и получения помощи от ИИ (например, поиска ресторана или заказа кофе без необходимости запуска дополнительных приложений).
DouBao направлен на формирование у пользователей привычки обращаться к ИИ для решения конкретных задач, в то время как WeChat AI Agent автоматически помогает пользователям в рамках их естественного использования приложения WeChat.
2. Метод GUI Agent: ИИ взаимодействует с мини-приложениями, как человек
Для работы с мини-приложениями обычным ИИ требуется специальное программное обеспечение (API), однако у WeChat миллионы таких приложений, и изменение их интерфейсов для работы с ИИ невозможно. Метод GUI Agent позволяет ИИ взаимодействовать с мини-приложениями напрямую, как человек: он “видит” пользовательский интерфейс и сам нажимает на кнопки. Процесс включает три этапа:
1. Анализ интерфейса: ИИ анализирует скриншот мини-приложения и точно определяет местоположение нужной кнопки (команда WeChat добилась лучших результатов в этой области);
2. Прогнозирование результата: Перед нажатием кнопки ИИ предвидит, куда произойдет переход;
3. Оценка ответа системы: После нажатия кнопки ИИ определяет, была ли операция успешной (например, появление сообщения “Платеж выполнен”). Однако на этом этапе существуют трудности из-за сложностей в распознавании мелких изменений на пользовательском интерфейсе.
3. Уникальные преимущества WeChat для разработки AI Agent
WeChat имеет ряд преимуществ, которые другие компании не могут использовать:
1. Данные о предпочтениях пользователей: Информация о том, что пользователи хотят (например, заказать кофе или посетить новый ресторан), позволяет ИИ точно понимать их потребности;
2. Широкий спектр возможностей: Множество мини-приложений покрывают различные сферы жизни, что облегчает использование ИИ для выполнения задач;
3. Замкнутая система платежей: Все операции (поиск ресторана, заказ товаров, оплата) выполняются внутри приложения WeChat, что упрощает отслеживание пользовательских действий и снижает риски.
4. Проблемы на пути к коммерческому успеху
Хотя демонстрации AI Agent выглядят многообещающими, для его внедрения необходимо решить следующие проблемы:
1. Высокие затраты на обработку данных: Для выполнения каждой задачи требуется значительные ресурсы; в первом квартале 2023 года Tencent потратил 37 миллиардов юаней на развитие ИИ-инфраструктуры.
2. Неопределенность правил использования: Неясно, как ИИ сможет получать доступ к пользовательским данным и выполнять платежи от имени пользователя;
3. Технические ограничения: Система не всегда точно определяет успешность выполнения операций, что может приводить к сбоям и негативному пользовательскому опыту.
5. Переход от рекламы к коммерческим услугам
Традиционные интернет-проекты зарабатывают на продаже рекламы, но AI Agent позволяет устранить этот барьер: пользователи могут получать нужные услуги напрямую, без необходимости просмотра рекламы. Например, при заказе торта ИИ может сразу выбрать подходящий вариант и выполнить заказ, что увеличивает доходы для платформы. В первом квартале 2023 года доходы WeChat от рекламы выросли на 20% благодаря более точным рекомендациям ИИ.
6. Прогнозы развития
По прогнозам Gartner, 40% проектов, связанных с использованием AI Agent, будут закрыты к 2027 году. Однако у WeChat уже есть все необходимые инструменты (пользователи, мини-приложения и система платежей), что облегчает внедрение новых технологий.
Вывод
WeChat AI Agent и DouBao демонстрируют два разных подхода к использованию ИИ: интеграция ИИ в существующие системы или создание независимых инструментов. Путь WeChat более соответствует естественному способу использования пользователей приложения WeChat, однако для его успешного внедрения необходимо решить проблемы, связанные с затратами, правилами использования и технологиями. В будущем пользователи могут просто использовать WeChat для получения помощи от ИИ — что будет более удобно и перспективно.