虎嗅

微信AI这招挺有意思的

2026-06-09 阅读原文

核心内容总结

微信开放小程序接入AI的「自动模式」，开发者授权源码后，微信AI可自动将小程序转化为能被AI理解和操控的「技能」；背后靠三大技术支撑（精准定位界面、预判操作结果、验证操作对错）；开发者看似自愿接入，但不接入可能失去未来AI带来的流量增量；同时微信用行业熟悉的「Skill/MCP」术语包装封闭生态接口，悄悄强化开发者对其生态的依赖。

一、「自动模式」到底是啥？—— 开发者躺平，小程序变AI的“工具人”

简单说，自动模式就是：你（开发者）把小程序的源代码交给微信，微信AI自动帮你把小程序翻译成它能听懂、会操作的“技能包”。你啥都不用干，但代价是你的小程序从“用户主动打开用的产品”，变成“微信AI替用户调用的一项功能”。

举个例子：以前用户想点一杯咖啡，得自己打开咖啡小程序，找菜单、选规格、点下单；以后用户可能直接对微信AI说“帮我点杯拿铁”，AI就会自动调用咖啡小程序完成操作——而这前提是你授权了自动模式，让微信AI能“看懂”并“操控”你的小程序。

二、微信AI怎么做到操控任意小程序？—— 三大技术当“幕后推手”

微信AI能搞定几百万个界面各异的小程序，靠的是三篇论文背后的技术组合拳：

1. AI的“火眼金睛”：POINTS-GUI-G

它就像AI的眼睛，给它一张小程序截图和指令（比如“找下单按钮”），它能精确到像素级告诉你按钮在哪。这技术在全球GUI定位测试中拿了第一，解决了“AI找不到按钮”的问题。

2. AI的“预判大脑”：UI-Oceanus

人点按钮前知道会跳转页面，但AI没有直觉。这个技术模拟了500万个小程序操作样本，让AI能预判“点这个按钮后会发生啥”——比如点下单后会不会弹出支付页。哪怕是完全陌生的小程序，AI也能“冷启动”（不用提前学习）完成任务，导航成功率提升了21.9%。

3. AI的“检查器”：DiffSpot

操作完后，AI得确认对不对（比如购物车数量有没有变）。但这个技术目前最拉胯，主流AI模型对界面细微变化的识别还很吃力。

三、开发者真的有选择吗？—— 自愿背后的“隐性代价”

微信说“是否接入自主决定，不影响现有服务”，但这句话只保护了你的“存量用户”（现在用你小程序的人还能继续用），没提“增量用户”：

等微信AI正式上线后，14亿用户习惯用AI调用服务时，没接入的小程序AI根本不知道存在。比如竞品接入了，用户说一句“订机票”AI就直接调用竞品；你没接入，用户得自己搜、自己点——相当于你被AI“绕过去了”，未来流量可能流失。

这就像：别人都上了高速公路（AI调用），你还在乡间小路（用户手动操作），虽然路还能走，但没人愿意绕远路。

四、Skill/MCP的“变味”—— 用开放术语包装封闭生态

行业里的Skill和MCP本来是开放标准：

MCP：是Anthropic搞的开源协议，能让任何AI连接任何工具（比如百度AI也能用它连淘宝）；
Skill：是AI的“技能包”，开发者写的技能能跨平台用（比如在Claude和Cursor上都能用）。

但微信把这两个词“偷换概念”了：

微信的MCP只能让微信AI连接微信里的工具；
微信的Skill是用你源码生成的，只能在微信生态里生效。

更隐蔽的是：很多中文开发者第一次接触这两个词，就是在微信文档里，慢慢会以为“Skill就是小程序被微信AI调用的接口”——微信用熟悉的词消解了开发者的警惕，悄悄把开放标准变成了自己的封闭接口，让你走进“只有微信一个出口”的房间。

五、这事儿最终影响谁？—— 开发者更依赖，用户更“懒”

对开发者：你省了适配AI的成本，但对微信生态的依赖又深了一层——从流量到技术，再到AI调用权，都捏在微信手里。

对用户：以后用小程序可能更方便（一句话搞定），但选择范围可能变窄——只有接入微信AI的小程序才会被优先推荐，你能用到的服务，都是微信AI“允许”你用到的。

总结：微信这步棋，表面是帮开发者省力，实则是在AI时代加固自己的生态围墙。开发者要不要接入？得想清楚：是要短期便利，还是长期的自主控制权？

（注：文中技术论文为虚构年份，仅为说明技术路线）