虎嗅

**Deutscher Titel:** „DouBao nach links, WeChat nach rechts“

原文:豆包向左,微信向右

Zusammenfassung der Kerninhalte

WeChat testet derzeit einen integrierten AI-Agenten, der mit den Mini-Programmen in WeChat verbunden werden kann, um Nutzern alltägliche Aufgaben wie das Buchen von Kaffee oder die Suche nach Restaurants zu erledigen. Im Gegensatz zur „unabhängigen AI-Eingangsstelle“ von DouBao verfolgt WeChat den Ansatz, den AI in die bestehende Plattform-Ökologie zu integrieren. Technisch nutzt WeChat eine Methode namens GUI-Agent („Graphical User Interface Agent“), wodurch der AI wie ein Mensch die Benutzeroberfläche betrachten und Schaltflächen anklicken kann – dies umgeht das Problem der Anpassung durch die Mini-Programmentwickler. WeChat verfügt über Vorteile wie die Daten zu den Absichten seiner 1,4 Milliarden Nutzer, die Ausführungsfähigkeit von Millionen von Mini-Programmen sowie einen geschlossenen Zahlungsprozess über WeChat Pay. Allerdings stehen Herausforderungen wie hohe Rechenkosten, unklare Berechtigungsgrenzen und schwache Erkennung von Benutzereingaben im Weg. In Zukunft könnte Wechs Geschäftsmodell von der Verkauf von Werbeanzeigen auf die Erledigung von Aufgaben für Nutzer umgestellt werden, was zu zwei verschiedenen Entwicklungsrichtungen des AI verfolgt von DouBao führen würde.

Detaillierte Erläuterung

1. WeChat AI-Agent vs. DouBao: Zwei völlig unterschiedliche AI-Ansätze

DouBao bietet einen „unabhängigen Eingang“ – man muss das DouBao-App aktiv öffnen, um die AI zu nutzen (z. B. für Hausaufgaben oder Bildbearbeitung). Der WeChat AI-Agent hingegen ist in die Plattform-Ökologie integriert: Wenn man beispielsweise während eines Chats mit WeChat sagt „Lassen Sie uns am Wochenende zusammenkommen“, hilft der Agent automatisch bei der Suche nach Restaurants und der Buchung von Plätzen, ohne dass man ein neues App öffnen muss.

Die Logik von DouBao besteht darin, die Nutzer dazu zu bringen, die AI zu nutzen; WeChat hingegen zielt darauf ab, die AI so zu trainieren, dass sie natürlicher mit den Funktionen von WeChat interagiert. Bei DouBao müssen sich die Nutzer an das Verhalten gewöhnen, bei Problemen auf DouBao zurückzugreifen, während der WeChat AI-Agent die Aufgaben direkt in den bereits genutzten WeChat-Szenarien erledigt.

2. GUI-Agent: Der AI „spielt“ wie ein Mensch mit Mini-Programmen

Herkömmliche AI-Lösungen benötigen spezielle Schnittstellen (APIs), die von den Entwicklern erstellt werden müssen. Da WeChat über Millionen von Mini-Programmen verfügt, ist es unrealistisch, alle diese Schnittstellen anzupassen. Der GUI-Agent umgeht dieses Problem, indem er direkt auf die Benutzeroberfläche der Mini-Programme zugreift und wie ein Mensch Schaltflächen anklickt.

Der Prozess besteht aus drei Schritten:

  • Benutzeroberflächenverständnis: Der AI erhält einen Screenshot des Mini-Programms; WeChat hat dies weltweit am besten gemeistert.
  • Ergebnisvorhersage: Bevor der AI eine Schaltfläche anklickt, muss er wissen, wohin die Weiterleitung erfolgen wird (WeChat nutzt Simulationsdaten, um den AI zu trainieren).
  • Erfolgskontrolle: Nach dem Klicken auf eine Schaltfläche muss der AI erkennen, ob die Aktion erfolgreich war (z. B. durch Änderungen in der Benutzeroberfläche wie Farbveränderungen); dieser Schritt ist jedoch noch nicht perfekt.

3. Die „innate Vorteile“ von WeChat bei der Entwicklung des AI-Agenten

WeChat verfügt über drei entscheidende Vorteile, die andere Unternehmen nicht haben:

  • Daten zu den Nutzerabsichten: Kommentare in Gruppenchats oder Likes zu neuen Cafés zeigen echte Bedürfnisse der Nutzer, die der AI direkt erkennen kann.
  • Ausführungsfähigkeit: Millionen von Mini-Programmen decken nahezu alle Lebensbereiche ab; der AI kann diese direkt nutzen.
  • Geschlossener Zahlungsprozess: Vom Finden eines Restaurants über die Bestellung bis zur Zahlung erfolgt alles innerhalb von WeChat – ohne Wechsel zu anderen Apps, was eine genaue Nachverfolgung der Transaktion ermöglicht (im Gegensatz zu ChatGPT, das auf externe Zahlungsdienste angewiesen ist).

4. Von der Demonstration zum produktiven Einsatz: Drei Herausforderungen, die überwunden werden müssen

Obwohl die Demonstration vielversprechend erscheint, gibt es drei Probleme, die gelöst werden müssen, bevor der AI-Agent tatsächlich genutzt werden kann:

  • Hohe Kosten: Jede Aktion des AI erfordert viel Rechenleistung; allein für die Infrastruktur wurden im ersten Quartal 37 Milliarden Yuan ausgegeben. Die langfristigen Betriebskosten sind ein großes Hindernis.
  • Unklare Berechtigungsgrenzen: Der AI kann zwar bei der Suche nach Restaurants helfen, aber darf beispielsweise nicht direkt bezahlen oder Nachrichten in Gruppen senden – diese Grenzen müssen klar definiert werden, damit Nutzer dem AI vertrauen.
  • Technische Schwächen: Die Fähigkeit, die Erfolg einer Aktion zu erkennen, ist noch unzureichend; dies kann zu Fehlern führen und die Benutzererfahrung beeinträchtigen.

5. Der Wandel der Gewinnmodelle: Von Werbeanzeigen zur Erledigung von Aufgaben

Herkömmliche Internetunternehmen verdienen Geld über die „Aufmerksamkeitsökonomie“ – indem sie Nutzer dazu bringen, Werbung anzusehen. Der AI-Agent könnte diesen Prozess vereinfachen und direktere Verkaufswege schaffen: Wenn man beispielsweise einen Geburtstagskuchen bestellt, wählt der AI direkt das passende Produkt aus und bucht ihn – ohne dass man lange suchen oder vergleichen muss. Dadurch könnten die Werbeeinnahmen steigen.

WeChat hat im ersten Quartal 20 % mehr Werbeeinnahmen erzielt, weil die AI-Beratungen präziser waren; in Zukunft könnte der AI direkt Transaktionen abwickeln und dem Unternehmen Provisionen oder Servicegebühren einbringen.

Allerdings besteht auch Risiko: Laut Gartner könnten bis 2027 40 % der AI-Agent-Projekte eingestellt werden. WeChat verfügt jedoch über eine solide Basis in Form von Nutzern, Mini-Programmen und Zahlungssystemen – es muss nicht von vorne anfangen.

Fazit

Der WeChat AI-Agent und DouBao repräsentieren zwei unterschiedliche Entwicklungsrichtungen des AI: Einerseits wird der AI zu einem eigenständigen Tool, andererseits wird er in die bestehende Plattform-Ökologie integriert. WeChats Ansatz ist den täglichen Nutzergewohnheiten näher – doch um tatsächlich erfolgreich zu sein, müssen noch Kosten-, Berechtigungs- und Technikprobleme gelöst werden. In Zukunft könnte es möglich sein, dass man einfach etwas sagt und der AI die Aufgaben erledigt – was natürlicher und vielversprechender ist als das Öffnen eines separaten AI-Apps.