核心内容の要約
微信はミニプログラムがAIに接続するための「オートモード」を公開しました。開発者がソースコードを許可すると、微信のAIが自動的にそのミニプログラムをAIが理解し操作できる「スキル」として変換します。この機能は3つの技術によって支えられています(正確なインターフェースの位置決め、操作結果の予測、操作の正誤の検証)。開発者は自発的に参加するように見えますが、参加しない場合は将来的なAIによるトラフィック増加の機会を失う可能性があります。また、微信は業界で慣れ親しんだ「Skill/MCP」という用語を使ってエコシステムのインターフェースを隠蔽し、開発者がそのエコシステムに依存するようにしています。
1. 「オートモード」とは何か?—— 開発者は何もせず、ミニプログラムはAIの「ツール人」になる
簡単に言えば、「オートモード」とは、開発者がミニプログラムのソースコードを微信に提供すると、微信のAIが自動的にそのミニプログラムをAIが理解し操作できる形に変換してくれるというものです。開発者は何もしなくてもよいのですが、その代わりにミニプログラムは「ユーザーが自ら起動して使用する製品」から、「微信のAIがユーザーの代わりに呼び出す機能」に変わってしまいます。
例えば、以前はユーザーがコーヒーを注文するにはミニプログラムを開いてメニューから選択し、注文を行う必要がありましたが、今後はユーザーが微信のAIに「ラテを注文して」と言うだけで、AIが自動的にコーヒーミニプログラムを呼び出して処理を行います。ただし、そのためにはオートモードを許可する必要があります。
2. 微信のAIはどのようにして任意のミニプログラムを操作できるのか?—— 3つの技術が「裏方」となっている
微信のAIが数百万もの異なるインターフェースを持つミニプログラムを処理できるのは、以下の3つの技術によるものです:
1. AIの「鋭い目」:POINTS-GUI-G
これはAIの目のようなもので、ミニプログラムのスクリーンショットと指示(例えば「注文ボタンを探す」)を与えると、ピクセルレベルで正確にボタンの位置を教えてくれます。この技術は世界中のGUI位置決めテストで1位を獲得し、「AIがボタンを見つけられない」という問題を解決しました。
2. AIの「予測能力」:UI-Oceanus
人間はボタンを押す前にページがどう変わるかを知っていますが、AIにはその直感がありません。この技術は500万件のミニプログラム操作データを用いて予測を行い、「このボタンを押すと何が起こるか」を判断します(例えば、注文後に支払いページが表示されるかどうか)。完全に見知らぬミニプログラムであっても、AIは「クールスタート」してタスクを完了でき、ナビゲーションの成功率が21.9%向上しました。
3. AIの「チェッカー」:DiffSpot
操作後には正しさを確認する必要があります(例えば、ショッピングカートの数が変わっていないか)。しかし、この技術はまだ十分ではなく、主流のAIモデルはインターフェースの微細な変化を認識するのに苦労しています。
3. 開発者に本当に選択肢はあるのか?—— 自発的な参加の裏にある「隠れた代償」
微信は「参加するかどうかは自由だが、現在のサービスに影響はない」と述べていますが、これは「既存のユーザー」(今ミニプログラムを使用している人々)のみを保護しており、「新規ユーザー」については言及していません。
微信のAIが正式にリリースされた後、14億人のユーザーがAIを使ってサービスを利用するようになると、オートモードに参加していないミニプログラムは存在しないことになります。例えば、競合他社がこの機能を導入した場合、ユーザーが「飛行機のチケットを予約して」と言うとAIが直接競合他社のサービスを呼び出します。参加していないミニプログラムでは、ユーザーが自分で検索し注文しなければならず、結果としてトラフィックが失われる可能性があります。
これはまるで、他の人々が高速道路(AIによるサービス)を利用している中で、自分だけが田舎道(ユーザーが手動で操作する方法)を使っているようなものです。道はまだ歩けますが、誰も遠回りしたがりません。
4. Skill/MCPの「意味の変化」—— 開放的な用語を使って閉鎖的なエコシステムを隠す
業界ではSkillとMCPは元々開放的な標準でした:
- MCP:Anthropicが開発したオープンソースのプロトコルで、どんなAIでもどんなツールにも接続できます(例えば百度のAIも淘宝に接続できる)。
- Skill:AIの「スキルパック」で、開発者が作成したスキルは複数のプラットフォームで使用できます。
しかし、微信はこれらの用語の意味を変えています:
- 微信のMCPは微信のAIが微信内のツールにのみ接続するために使われます。
- 微信のSkillは開発者のソースコードを使用して生成され、微信のエコシステム内でのみ機能します。
さらに隠れた問題は、多くの中国の開発者がこれらの用語に初めて触れるのは微信のドキュメントを通じてであり、徐々に「Skillとは微信のAIが呼び出すインターフェースのことだ」と思い込んでしまいます。微信は馴染みのある用語を使って開発者の警戒心を解消し、開放的な標準を自社の閉鎖的なインターフェースに変えてしまっています。
5. これは最終的に誰に影響を与えるのか?—— 開発者はより依存するようになり、ユーザーはより「怠ける」
開発者にとってはAIへの適応コストが省けますが、微信のエコシステムへの依存度が深まります。トラフィックから技術、そしてAIの呼び出し権限まで、すべて微信の手中にあります。
ユーザーにとっては、ミニプログラムを使うのがより便利になるかもしれません(ワンクリックで済む)が、選択肢が狭まる可能性があります。微信のAIに参加しているミニプログラムのみが優先的に推薦され、利用できるサービスも微信のAIが許可するものに限られてしまいます。
結論として、微信のこの取り組みは表面上は開発者を助けるように見えますが、実際にはAI時代において自社のエコシステムの壁を強化するものです。開発者は参加すべきかどうか、短期間の利便性と長期的な自主性のどちらを選ぶべきかよく考える必要があります。
(注:文中の技術論文は架空の年号であり、技術的な説明のためだけに使用されています。)