Résumé des points clés
WeChat teste actuellement un agent AI intégré qui permet de se connecter aux mini-programs présents dans l’application pour effectuer des tâches quotidiennes telles que la réservation d’un café ou la recherche de restaurants. Contrairement à DouBao, qui propose une entrée AI indépendante, WeChat choisit de « intégrer l’AI dans son écosystème existant ». Sur le plan technique, l’agent utilise une méthode appelée GUI Agent (Graphical User Interface Agent), ce qui permet à l’IA d’utiliser l’interface des mini-programs comme un humain et de cliquer sur les boutons, contournant ainsi les difficultés liées à l’adaptation par les développeurs. WeChat dispose de nombreux avantages uniques, notamment une base de données contenant les intentions des 1,4 milliard d’utilisateurs, la capacité d’exécution de millions de mini-programs et un cycle complet de paiements via WeChat Pay. Cependant, il fait également face à des défis, tels que les coûts élevés en ressources informatiques, les difficultés à définir les limites des autorisations et la faible capacité de reconnaissance des réactions utilisateur. À l’avenir, le modèle économique de WeChat pourrait passer de la vente d’annonces basées sur l’attention des utilisateurs au paiement pour les services rendus par l’IA, ce qui créerait deux approches distinctes dans le domaine de l’IA.
Analyse détaillée
1. WeChat AI Agent vs DouBao : Deux approches complètement opposées
DouBao offre une entrée AI indépendante, ce qui signifie que l’utilisateur doit ouvrir l’application pour demander de l’aide (par exemple pour rédiger des devoirs ou modifier des photos). WeChat AI Agent, quant à lui, s’intègre directement dans l’écosystème WeChat : lorsque l’utilisateur parle de se réunir le week-end, l’agent trouve automatiquement un restaurant et réserve une place sans qu’il ait besoin d’ouvrir une nouvelle application.
La logique de DouBao est de « former les utilisateurs à utiliser l’IA », tandis que celle de WeChat est de « former l’IA à utiliser WeChat ». Avec WeChat AI Agent, les tâches sont effectuées en toute discrétion dans le cadre des activités quotidiennes de l’utilisateur.
2. Le GUI Agent : Permettre à l’IA d’utiliser les mini-programs comme un humain
Pour que l’IA puisse interagir avec les mini-programs, les développeurs doivent créer des interfaces spéciales (API). Cependant, avec des millions de mini-programs, il est impossible de demander à tous de modifier ces interfaces. WeChat a résolu ce problème en utilisant le GUI Agent, qui permet à l’IA de « voir » l’interface des mini-programs et d’interagir avec les boutons comme un humain. Le processus se déroule en trois étapes :
- Comprendre l’interface : L’IA analyse une capture d’écran du mini-programme pour localiser précisément le bouton de commande (WeChat est considéré comme l’une des meilleures solutions au monde dans ce domaine).
- Prédire les résultats : Avant de cliquer, l’IA doit savoir où l’action mènera (WeChat utilise des données simulées pour que l’IA puisse apprendre à interagir même avec des mini-programs inconnus).
- Répondre aux actions : Après le clic, l’IA doit vérifier si l’opération a été réussie (par exemple en observant des changements visuels sur l’interface). Cependant, cette étape reste un point faible pour l’IA, qui a du mal à reconnaître de subtiles modifications.
3. Les avantages naturels de WeChat pour le développement de l’AI Agent
WeChat dispose de trois atouts majeurs que ses concurrents n’ont pas :
- Données sur les intentions des utilisateurs : Les discussions en groupe ou les likes sur les publications reflètent des besoins réels, ce qui permet à l’IA de comprendre rapidement les demandes des utilisateurs.
- Capacité d’exécution : Des millions de mini-programs couvrent presque tous les aspects de la vie quotidienne, permettant à l’IA d’accéder directement aux services nécessaires.
- Cycle de paiements complet : Toutes les étapes (recherche de restaurant, commande, paiement) se déroulent dans WeChat, sans avoir besoin d’utiliser d’autres applications, ce qui facilite le suivi des transactions.
4. Du prototype à un produit commercialisable
Malgré ses promesses, WeChat AI Agent doit encore surmonter trois obstacles :
- Coûts élevés : L’IA consomme beaucoup de ressources pour chaque tâche (réservation de café, comparaison des prix, interaction avec les mini-programs). Tencent a déboursé 37 milliards de yuans rien que pour l’infrastructure AI au premier trimestre de l’année.
- Définition des autorisations : Il reste difficile de déterminer précisément les limites des actions que l’IA peut effectuer (par exemple, payer à la place de l’utilisateur ou envoyer des messages dans les groupes).
- Faiblesse technologique : L’IA a encore du mal à détecter avec précision si une action a été réussie, ce qui peut entraîner des échecs et nuire à l’expérience utilisateur.
5. Un modèle économique évolutif : De la publicité à la prestation de services payants
Le modèle traditionnel d’internet repose sur l’économie de l’attention (les utilisateurs sont exposés à des annonces, et les entreprises paient pour ces visibilités). WeChat AI Agent pourrait changer cela en proposant des services payants. Par exemple, si l’utilisateur demande une tarte d’anniversaire, l’IA choisit et commande directement, évitant ainsi les étapes de recherche et de comparaison, ce qui incite les entreprises à payer davantage pour ces transactions directes. Les revenus publicitaires de WeChat ont augmenté de 20 % au premier trimestre grâce aux recommandations AI. À l’avenir, l’agent pourrait permettre à la plateforme de percevoir des commissions sur chaque transaction.
Cependant, ce parcours est risqué : Gartner prévoit que 40 % des projets d’AI Agent seront abandonnés avant 2027. WeChat, grâce à sa base d’utilisateurs, à son écosystème de mini-programs et à ses services de paiement, dispose déjà d’un avantage significatif pour réussir.
Conclusion
WeChat AI Agent et DouBao illustrent deux directions possibles pour le développement de l’IA : soit en faire des outils indépendants, soit les intégrer dans les écosystèmes existants. La approche de WeChat est plus adaptée aux habitudes quotidiennes des utilisateurs, mais elle doit encore surmonter des défis techniques et commerciaux pour devenir une réalité. À l’avenir, il est envisageable que nous ouvrions WeChat et que l’IA exécute automatiquement certaines tâches simplement en parlant, ce qui serait plus naturel et prometteur que d’utiliser des applications AI distinctes.