虎嗅

WeChat finalmente está listo para abrir las puertas a los teléfonos inteligentes con tecnología AI.

原文：微信终于要给AI 手机开门了

2026-06-08 阅读原文

Resumen del contenido principal

WeChat finalmente ha colaborado con fabricantes de teléfonos como Huawei y Xiaomi para lanzar una función de asistente A2A (de asistente AI a asistente AI). En otras palabras, los asistentes AI de los teléfonos (como Huawei YOYO y Xiaomi Xiaoai) pueden operar directamente WeChat para enviar mensajes o realizar llamadas de audio y video, sin necesidad de usar métodos como el reconocimiento óptico de caracteres (OCR) para simular clics en la pantalla. Este modelo es seguro y equilibra los intereses de todas las partes, representando un importante paso en el desarrollo del AI inteligente. No obstante, también plantea preocupaciones relacionadas con la distribución de los costos de computación y la posible alienación de las formas humanas de comunicarse.

¿Qué es A2A? ¿En qué se diferencia de los métodos anteriores de uso del AI para WeChat?

Antes, los asistentes AI de los teléfonos necesitaban utilizar tecnologías como el OCR para leer la pantalla y luego simular clics. Por ejemplo, cuando Xiaoai intentaba usar una aplicación que no fuera de la plataforma HarmonyOS, primero debía reconocer la imagen de un amigo en la lista de chats de WeChat y luego hacer clic para enviar un mensaje, lo cual era lento y propenso a errores (como el reconocimiento incorrecto de la imagen). El sistema A2A, por otro lado, permite que los asistentes AI (como YOYO) comuniquen directamente con los sistemas internos de WeChat, sin necesidad de ver la pantalla ni simular clics. Por ejemplo, si dices “YOYO, envía un mensaje a mamá diciéndole que volveré a casa para cenar esta noche”, YOYO le informa al sistema interno de WeChat y WeChat se encarga de enviar el mensaje por ti. Este método es más rápido y fiable, y también evita la exposición de otros contenidos de la pantalla.

¿Por qué las grandes empresas han optado por A2A? Porque equilibra los intereses de todas las partes

El éxito de A2A como solución compartida entre WeChat y los fabricantes de teléfonos se debe a que resuelve problemas previos de conflicto de intereses:

1. Seguridad de datos: Al no necesitar simular clics, no se acceden a contenidos privados de la pantalla (como otros registros de chats), lo que tranquiliza tanto a WeChat como a los usuarios.

2. Retención de usuarios: Los asistentes AI de los fabricantes de teléfonos incentivan el uso de sus propios servicios, mientras que WeChat puede retener a los usuarios gracias a ellos, evitando que se desvíen a herramientas de terceros.

3. Distribución de costos: La comunicación entre inteligentes requiere tarifas (similar a los servicios de chat AI), y en el modelo A2A, estos costos pueden ser compartidos por WeChat y los fabricantes, evitando que uno solo asuma todo el gasto.

En comparación con el anterior método basado únicamente en OCR (que podía violar la privacidad de las aplicaciones y fue rechazado por las grandes empresas), A2A es claramente una mejor opción, ya que beneficia a todos.

¿Qué posibilidades tiene A2A en el futuro? Desde miniaplicaciones hasta un ecosistema completo?

Actualmente, con A2A en WeChat, solo se pueden enviar mensajes de texto y realizar llamadas de audio/vídeo, pero hay mucho potencial para su expansión:

Dentro de WeChat: El ecosistema de miniaplicaciones se integrará con A2A. Por ejemplo, puedes decir “YOYO, utiliza la aplicación de Meituan en WeChat para pedir un té con leche”. El asistente de Meituan responderá directamente sin necesidad de abrir manualmente la aplicación.
Expansión entre aplicaciones: A2A es una solución universal; mañana podrías decir “Xiaobu, utiliza Ctrip para consultar el informe de viaje del año pasado”, y al día siguiente “Xiaoai, utiliza Alipay para pagar la cuenta de electricidad”.
Adopción por parte de grandes empresas: Google Gemini Spark ya soporta A2A, y Apple anunció que Siri recibirá mejoras en su versión 2026 para incorporar este tipo de interacción. Además, las nuevas versiones de teléfonos de ByteDance y ZTE también abandonarán el método OCR en favor de A2A.

En el futuro, podría ser posible que un único asistente AI gestione todas las aplicaciones.

Desafíos futuros de A2A: costos y impacto humano

Aunque A2A es prometedor, enfrenta dos problemas importantes:

1. Quién pagará los costos de computación?: Cada interacción entre inteligentes implica gastos (tarifas de token). ¿Cómo se distribuirán estos costos entre usuarios, fabricantes y desarrolladores de aplicaciones? ¿Será el servicio gratuito o de pago? Esto es un desafío importante.

2. ¿Se convertirán las personas en “máquinas”?: Si todo lo dejamos en manos del AI, podríamos empezar a expresarnos de manera más mecánica (por ejemplo, diciendo “Envía un mensaje a mamá: volveré a casa a las 7”. A largo plazo, esto podría llevar a una pérdida de la capacidad de expresión natural y a una forma de pensar más similar a la de las máquinas.

No obstante, no hay razones para preocuparse demasiado a corto plazo, ya que la función A2A de WeChat todavía está en fase de prueba. Será necesario al menos medio año para que se integre en todas las operaciones diarias. El hecho de poder enviar mensajes con solo hablar es ya una pequeña comodidad proporcionada por la tecnología.

En resumen, A2A representa un paso crucial hacia la aplicación práctica del AI inteligente, ya que resuelve problemas reales y equilibra los intereses de todas las partes. Sin embargo, aún hay cuestiones de costos y ética que deben ser exploradas con cuidado. Para los usuarios comunes, poder comunicarse más fácilmente sin tener que hacer mucho es un buen comienzo.