虎嗅

豆包向左,微信向右

核心内容总结

微信正在测试一款内嵌的AI Agent,它能连接微信里的小程序帮用户完成订咖啡、找餐厅等日常任务,和豆包“独立AI入口”的路线不同,微信走的是“AI嵌入现有生态”的路径。技术上它用了一种叫GUI Agent的方法(让AI像人一样看界面、点按钮),绕过了小程序开发者适配的难题;同时微信拥有14亿用户的意图数据、几百万小程序的执行能力、微信支付的交易闭环等独特优势,但也面临算力成本高、权限边界难界定、操作反馈识别弱等挑战。未来它可能把微信的商业模式从“卖注意力广告”转向“帮用户完成任务赚钱”,和豆包形成两条不同的AI发展方向。

详细解读

1. 微信AI Agent vs 豆包:两条完全相反的AI路

豆包是“独立入口”——就像你特意去便利店买东西,得主动打开豆包App找AI帮忙(比如写作业、P图);微信AI Agent是“嵌入生态”——就像家里的智能助手,你在微信聊天时随口说“周末聚一下”,它就自动帮你找餐厅、订位置,不用你额外打开新App。

豆包的逻辑是“训练用户用AI”,微信的逻辑是“训练AI用微信”。豆包需要用户养成“有问题找豆包”的习惯,而微信AI Agent是在用户本来就用微信的场景里,悄悄帮你把事办了,更自然。

2. GUI Agent:让AI像人一样“玩”小程序

普通AI要操作小程序,得让开发者写专门的接口(API)配合,但微信有几百万个小程序,让所有人改接口不现实。微信的GUI Agent绕开了这个问题——它直接“看”小程序界面,像人一样找按钮、点操作。

具体分三步:

  • 看懂界面:给AI一张小程序截图,它能精准找到“下单”按钮的位置(微信团队在这方面做到了全球最好);
  • 预测结果:AI点按钮前,得知道点下去会跳转到哪里(微信用模拟数据训练AI,让它对陌生小程序也能摸索操作);
  • 判断反馈:点完按钮后,AI要知道成功没(比如按钮变灰、显示“支付成功”),但这一步目前是短板——界面细微变化(比如颜色深浅)AI还难识别。

3. 微信做AI Agent的“先天优势”:别人学不来的三件宝

微信能做这件事,是因为手里有三样别人没有的东西:

  • 意图数据:用户在群聊里说“想喝奶茶”、朋友圈点赞“新开的咖啡店”,这些都是真实需求,AI能直接捕捉;
  • 执行能力:几百万个小程序覆盖了几乎所有生活场景(订外卖、买电影票、打车),AI能直接调用;
  • 交易闭环:从找店到下单再到支付,全程在微信里完成,不用跳转到其他App,也能准确追踪是谁促成了交易(不像ChatGPT要依赖外部支付工具)。

4. 从演示到产品:微信AI Agent要过的三道坎

虽然演示听起来很美好,但要变成你能用的产品,还得解决三个问题:

  • 成本太高:AI每帮你办一件事,都要消耗大量算力(比如订咖啡要推理口味、比价、操作小程序),腾讯Q1光AI基础设施就花了370亿,长期运营成本是个大问题;
  • 权限边界难画:AI帮你搜餐厅没问题,但能不能帮你付钱?能不能替你在群里发确认消息?这些边界没定好,用户不敢让AI替自己操作;
  • 技术短板:判断操作是否成功的能力还不够(比如点了“支付”按钮,AI不知道有没有真的付成),这会导致任务失败,影响用户体验。

5. 赚钱方式要变:从“让你看广告”到“帮你办事收钱”

传统互联网赚钱靠“注意力经济”——让你刷到广告,商家付曝光费,从“看广告”到“买东西”中间会流失很多人。但AI Agent能把这个漏斗压扁:

  • 比如你说“想订生日蛋糕”,AI直接帮你选好、下单,跳过了浏览、比价的步骤,商家更愿意为这种“直接成交”付钱;
  • 微信Q1广告收入增长20%就是因为AI推荐更精准,未来Agent会让这个更直接——从“推荐广告”变成“直接帮你完成交易”,平台可以从交易中抽成或收服务费。

不过这条路也有风险,Gartner预测40%的AI Agent项目会在2027年前被叫停,但微信的优势是已经有了用户、小程序和支付的基础,不用从零开始。

总结

微信AI Agent和豆包代表了AI发展的两个方向:一个是让AI成为独立工具,一个是让AI融入现有生态。微信的路线更贴近用户的日常使用场景,但要解决成本、权限和技术问题才能真正落地。未来我们可能会看到:打开微信,随口说句话,AI就帮你把事办了——这比单独打开一个AI App更自然,也更有想象空间。