虎嗅

微信终于要给AI 手机开门了

2026-06-08 阅读原文

核心内容总结

微信终于和华为、小米等手机厂商合作，推出了A2A助手功能——简单说就是手机AI助手（比如华为YOYO、小米小爱）能直接操作微信发消息、打音视频电话了，不用像以前那样靠“看屏幕点按钮”（OCR模拟点击）。这个模式既安全又能平衡各方利益，是智能体AI发展的重要一步，但也存在算力成本分摊和人类习惯异化的隐忧。

一、A2A到底是啥？和以前的AI操作微信有啥不一样？

以前手机AI助手想操作微信，得用“OCR读屏+模拟点击”——就像AI先“看”屏幕上的微信界面，再模仿人手指点按钮。比如小艺操作非鸿蒙app时，得先识别微信聊天列表里的好友头像，再点进去输入文字发送，过程慢还容易出错（比如识别错头像）。

而A2A是“智能体之间直接对话”：手机AI助手（比如YOYO）和微信内部的智能体直接通信，不用看屏幕也不用模拟点击。比如你喊“YOYO给妈妈发微信说今晚回家吃饭”，YOYO直接告诉微信智能体“给妈妈发这条消息”，微信自己就完成发送了。这种方式更快、更稳定，也不会泄露屏幕上的其他内容。

二、为啥大厂都选A2A？因为它能平衡各方利益

A2A能成为微信和手机厂商的共同选择，核心是它解决了之前的“利益冲突”：

1. 数据安全：不用模拟点击，就不会读取屏幕上的隐私内容（比如你微信里的其他聊天记录），微信和用户都放心；

2. 用户留存：手机厂商的AI助手能操作微信，用户更愿意用自家AI；微信也能通过AI助手留住用户（不会被第三方工具抢走）；

3. 成本分摊：智能体对话需要“token费”（类似AI聊天的服务费），A2A模式下手机厂商和微信可以一起承担，不用一家独掏腰包。

对比之前的豆包手机纯OCR模式（容易侵犯app隐私，被大厂围剿），A2A显然更“懂事”——谁都不吃亏。

三、A2A未来能做啥？从小程序到全生态

现在微信A2A只能发文字、打音视频，但未来扩展空间很大：

微信内部：小程序生态会接入A2A。比如你喊“YOYO用微信里的美团小程序点一杯奶茶”，美团小程序的智能体（比如“小团”）就能直接响应，不用你手动打开小程序操作；
跨app扩展：A2A是通用方案，明天可能喊“小布用携程查去年旅行报告”，后天喊“小爱用支付宝交电费”；
国际大厂跟进：谷歌Gemini Spark已经支持A2A，苹果WWDC26也会重构Siri加入智能体支持，字节和中兴的新豆包手机也放弃纯OCR，改用A2A模式。

未来可能真的实现“一个AI助手搞定所有app”的场景。

四、A2A的隐忧：钱和人的问题

A2A虽好，但也有两个绕不开的问题：

1. 算力成本谁来付？ 每个智能体对话都要花钱（token费），比如你用YOYO发微信消息，微信和华为都要承担一部分成本。未来怎么在用户、厂商、app开发商之间分摊这笔钱？是免费还是收费？这是个大考验；

2. 人会不会变“机器”？ 如果啥都让AI代理，你可能会下意识把需求说得越来越“机器化”（比如“给妈妈发消息：今晚7点回家吃饭”，而不是“跟妈妈说我今晚回去吃”）。长期下来，人可能会失去灵活表达的能力，变得像机器一样思考——这就是文章说的“人类异化”。

不过短期内不用太担心，微信A2A功能还在测试阶段，要覆盖所有日常操作至少得大半年。现在体验到的“动动嘴发微信”，已经是科技带来的小便利了。

总的来说，A2A是智能体AI走向实用的关键一步，它既解决了现实痛点，又平衡了各方利益，但未来的成本和伦理问题还需要慢慢探索。对普通用户来说，能少动手多说话，已经是个不错的开始。