虎嗅

**Русский перевод:** “Доубао движется влево, WeChat — вправо.”

原文:豆包向左,微信向右

Краткое содержание анализа

WeChat тестирует встроенного AI-агента, который может взаимодействовать с мини-приложениями в приложении WeChat, помогая пользователям выполнять повседневные задачи, такие как заказ кофе или поиск ресторанов. В отличие от подхода DouBao, который предусматривает использование отдельного AI-интерфейса, WeChat идет путем интеграции ИИ в существующую экосистему. С технической точки зрения для реализации этого используется метод GUI Agent (AI ведет себя так, как человек, интерагируя с пользовательским интерфейсом и нажимая на кнопки), что избавляет разработчиков мини-приложений от необходимости выполнения дополнительных настроек. WeChat обладает уникальными преимуществами: данными о предпочтениях пользователей (1,4 миллиарда человек), возможностями множества мини-приложений и замкнутой системой платежей. Однако существуют и сложности, связанные с высокими затратами на обработку данных, неопределенностью границ доступа к функциям и недостаточной точностью распознавания пользовательских действий. В будущем бизнес-модель WeChat может перейти от продажи рекламы к предоставлению услуг за плату, что приведет к формированию двух разных направлений развития ИИ — одного в рамках WeChat, другого — в рамках DouBao.

Подробный анализ

1. WeChat AI Agent vs DouBao: два противоположных подхода к использованию ИИ

DouBao представляет собой отдельный инструмент для взаимодействия с пользователем (например, для выполнения задач типа написания домашних заданий или обработки фотографий); WeChat AI Agent, напротив, интегрирован в уже существующую экосистему приложений WeChat. Пользователи могут просто использовать WeChat для общения и получения помощи от ИИ (например, поиска ресторана или заказа кофе без необходимости запуска дополнительных приложений).

DouBao направлен на формирование у пользователей привычки обращаться к ИИ для решения конкретных задач, в то время как WeChat AI Agent автоматически помогает пользователям в рамках их естественного использования приложения WeChat.

2. Метод GUI Agent: ИИ взаимодействует с мини-приложениями, как человек

Для работы с мини-приложениями обычным ИИ требуется специальное программное обеспечение (API), однако у WeChat миллионы таких приложений, и изменение их интерфейсов для работы с ИИ невозможно. Метод GUI Agent позволяет ИИ взаимодействовать с мини-приложениями напрямую, как человек: он “видит” пользовательский интерфейс и сам нажимает на кнопки. Процесс включает три этапа:

1. Анализ интерфейса: ИИ анализирует скриншот мини-приложения и точно определяет местоположение нужной кнопки (команда WeChat добилась лучших результатов в этой области);

2. Прогнозирование результата: Перед нажатием кнопки ИИ предвидит, куда произойдет переход;

3. Оценка ответа системы: После нажатия кнопки ИИ определяет, была ли операция успешной (например, появление сообщения “Платеж выполнен”). Однако на этом этапе существуют трудности из-за сложностей в распознавании мелких изменений на пользовательском интерфейсе.

3. Уникальные преимущества WeChat для разработки AI Agent

WeChat имеет ряд преимуществ, которые другие компании не могут использовать:

1. Данные о предпочтениях пользователей: Информация о том, что пользователи хотят (например, заказать кофе или посетить новый ресторан), позволяет ИИ точно понимать их потребности;

2. Широкий спектр возможностей: Множество мини-приложений покрывают различные сферы жизни, что облегчает использование ИИ для выполнения задач;

3. Замкнутая система платежей: Все операции (поиск ресторана, заказ товаров, оплата) выполняются внутри приложения WeChat, что упрощает отслеживание пользовательских действий и снижает риски.

4. Проблемы на пути к коммерческому успеху

Хотя демонстрации AI Agent выглядят многообещающими, для его внедрения необходимо решить следующие проблемы:

1. Высокие затраты на обработку данных: Для выполнения каждой задачи требуется значительные ресурсы; в первом квартале 2023 года Tencent потратил 37 миллиардов юаней на развитие ИИ-инфраструктуры.

2. Неопределенность правил использования: Неясно, как ИИ сможет получать доступ к пользовательским данным и выполнять платежи от имени пользователя;

3. Технические ограничения: Система не всегда точно определяет успешность выполнения операций, что может приводить к сбоям и негативному пользовательскому опыту.

5. Переход от рекламы к коммерческим услугам

Традиционные интернет-проекты зарабатывают на продаже рекламы, но AI Agent позволяет устранить этот барьер: пользователи могут получать нужные услуги напрямую, без необходимости просмотра рекламы. Например, при заказе торта ИИ может сразу выбрать подходящий вариант и выполнить заказ, что увеличивает доходы для платформы. В первом квартале 2023 года доходы WeChat от рекламы выросли на 20% благодаря более точным рекомендациям ИИ.

6. Прогнозы развития

По прогнозам Gartner, 40% проектов, связанных с использованием AI Agent, будут закрыты к 2027 году. Однако у WeChat уже есть все необходимые инструменты (пользователи, мини-приложения и система платежей), что облегчает внедрение новых технологий.

Вывод

WeChat AI Agent и DouBao демонстрируют два разных подхода к использованию ИИ: интеграция ИИ в существующие системы или создание независимых инструментов. Путь WeChat более соответствует естественному способу использования пользователей приложения WeChat, однако для его успешного внедрения необходимо решить проблемы, связанные с затратами, правилами использования и технологиями. В будущем пользователи могут просто использовать WeChat для получения помощи от ИИ — что будет более удобно и перспективно.