虎嗅

WeChat наконец откроет двери для смартфонов на основе технологий искусственного интеллекта.

原文:微信终于要给AI 手机开门了

Краткое содержание анализа

WeChat наконец-то начал сотрудничать с производителями смартфонов, такими как Huawei и Xiaomi, и ввел функцию A2A-ассистента — это позволяет интеллектуальным помощникам (например, Huawei YOYO или Xiaomi Xiaoai) напрямую управлять сообщениями в WeChat и совершать голосовые/видеозвонки, без необходимости использования традиционных методов (например, распознавания текста на экране с последующим имитацией кликов). Такой подход обеспечивает безопасность и баланс интересов всех сторон, является важным шагом в развитии искусственного интеллекта. Однако существуют опасения по поводу распределения затрат на обработку данных и возможного изменения способов коммуникации людей.

Что такое A2A и в чем его отличие от предыдущих подходов к управлению WeChat с помощью ИИ?

Ранее интеллектуальные помощники на смартфонах для работы с WeChat использовали технологии OCR (распознавание текста на экране) и имитацию пользовательских действий. Например, для работы с приложениями, не разработанными в рамках системы HarmonyOS, помощник должен был сначала распознать изображение пользователя в списке контактов и затем отправить сообщение. Этот процесс был медленным и подвержен ошибкам (например, неправильному распознаванию лица).

Функция A2A позволяет интеллектуальным помощникам общаться напрямую с встроенными системами WeChat, без необходимости визуального доступа к экрану или имитации пользовательских действий. Например, если вы скажете: «YOYO, отправь сообщение маме о том, что мы вернемся домой на ужин», помощник передаст это сообщение системе WeChat, и она сама его отправит. Такой подход более быстрый и надежный, а также предотвращает утечку информации с экрана.

Почему крупные компании выбирают модель A2A?

Основная причина использования этой технологии — возможность сбалансировать интересы всех участников:

1. Безопасность данных: отсутствие необходимости имитации пользовательских действий исключает доступ к конфиденциальной информации (например, записям переписки в WeChat); это обеспечивает уверенность как пользователям, так и компании-разработчику приложений.

2 Удержание пользователей: интеллектуальные помощники производителей смартфонов становятся более привлекательными для пользователей, а WeChat может сохранять свою аудиторию, не теряя ее из-за использования сторонних инструментов.

3 Распределение затрат: для обмена сообщениями между интеллектуальными системами требуются специальные токены (аналогично плате за использование сервисов ИИ). В рамках модели A2A затраты распределяются между компаниями-разработчиками и WeChat, избегая однобокой нагрузки.

В отличие от предыдущих подходов (например, использования технологии OCR), модель A2A считается более разумным решением, поскольку не приводит к нарушению прав пользователей и компаний.

Какие возможности открывает модель A2A в будущем?

Сейчас функция A2A позволяет отправлять только текстовые сообщения и совершать голосовые/видеозвонки, но в будущем ее возможности могут значительно расшириться:

  • Внутри самого WeChat: экосистема мини-приложений будет интегрирована с функцией A2A. Например, вы можете попросить помощника заказать напиток через мини-приложение Meituan без необходимости открывать его вручную.
  • Межприложенное взаимодействие: технология A2A может быть использована для обмена данными между различными приложениями (например, для запросов информации о прошлых путешествиях или оплаты услуг).
  • Развитие на международном уровне: такие компании, как Google (Gemini Spark) и Apple (Siri), уже поддерживают функцию A2A; крупные производители смартфонов, включая ByteDance и ZTE, также переходят на эту технологию. В будущем один интеллектуальный помощник может обслуживать пользователей во всех приложениях.

Проблемы, связанные с функцией A2A

Несмотря на преимущества, существуют две основные проблемы:

1. Распределение затрат: кто будет покрывать расходы на обработку данных? Каждый раз, когда интеллектуальные системы взаимодействуют друг с другом, требуются специальные токены. Как будут распределены эти затраты между пользователями, производителями и разработчиками приложений? Будет ли использование данной услуги бесплатным или платным?

2. Влияние на способы коммуникации людей: если все действия будут выполняться ИИ, пользователи могут начать формулировать свои запросы более стандартизированно и «машинально». В долгосрочной перспективе это может привести к потере способности к гибкому выражению мыслей.

Однако в ближайшем будущем не стоит слишком беспокоиться: функция A2A все еще находится в стадии тестирования, и для полного внедрения потребуется как минимум полгода. То, что уже доступно сейчас (например, возможность отправки сообщений голосом), является примером удобств, предоставляемых технологиями.

В целом, функция A2A представляет собой важный шаг на пути к практическому применению искусственного интеллекта. Она решает реальные проблемы и обеспечивает баланс интересов всех сторон, однако будущие экономические и этические аспекты требуют дальнейшего изучения. Для обычных пользователей возможность меньше двигаться руками и больше использовать голосовые команды уже является значительным улучшением.