虎嗅

WeChat wird endlich die Tür für AI-betriebene Smartphones öffnen.

原文：微信终于要给AI 手机开门了

2026-06-08 阅读原文

Zusammenfassung der Kerninhalte

WeChat hat endlich mit Handyherstellern wie Huawei und Xiaomi zusammengearbeitet und die Funktion eines A2A-Assistenten eingeführt – im Grunde genommen ermöglicht dies es den mobilen AI-Assistenten (wie Huawei’s YOYO oder Xiaomi’s Xiaoi) direkt, Nachrichten über WeChat zu senden oder Audio-/Videoanrufe zu tätigen, ohne dass man wie bisher die Bildschirmtasten mit der Augen erkennen und anschließend simulieren muss (OCR-Technologie). Dieses Modell ist sowohl sicher als auch ein wichtiger Schritt in der Entwicklung von intelligenten Systemen. Allerdings gibt es Bedenken hinsichtlich der Verteilung der Rechenkosten sowie der möglichen Veränderung menschlicher Kommunikationsgewohnheiten.

Was genau bedeutet A2A – und wie unterscheidet sich dies von früheren AI-Benutzern von WeChat?

Früher mussten die mobilen AI-Assistenten die WeChat-Oberfläche mithilfe der OCR-Technologie erkennen und anschließend die Tasten simulieren, um Befehle auszuführen. Zum Beispiel musste Xiaoyi zuerst das Profilbild eines Freundes in der Chatliste erkennen, bevor er eine Nachricht senden konnte – ein langsamer und fehleranfälliger Prozess.

A2A hingegen ermöglicht es den AI-Assistenten, direkt miteinander zu kommunizieren: Der mobile AI-Assistent (z. B. YOYO) kommuniziert direkt mit den internen Systemen von WeChat, ohne dass der Benutzer den Bildschirm anschauen oder Tasten bedienen muss. Wenn man beispielsweise sagt: „YOYO, schick Mama eine Nachricht, dass ich heute Abend zum Essen nach Hause komme“, teilt YOYO diese Information direkt mit WeChat, und WeChat übernimmt anschließend die Übermittlung der Nachricht. Dieser Ansatz ist schneller und zuverlässiger und verhindert außerdem, dass andere Inhalte des Bildschirms sichtbar werden.

Warum wählen große Unternehmen A2A? Weil es die Interessen aller Beteiligten ausgleicht

Der Hauptgrund für die Verwendung von A2A ist, dass es bestehende Interessenskonflikte löst:

1. Daten Sicherheit: Da keine Tasten mehr simuliert werden müssen, werden keine privaten Daten (z. B. Chatverläufe) ausgelesen, was sowohl WeChat als auch die Nutzer beruhigt.

2. Nutzerbindung: Wenn die AI-Assistenten der Handyhersteller über WeChat verfügen, sind die Nutzer eher bereit, diese Assistenten zu nutzen – und WeChat kann dadurch seine Nutzerbasis erhalten, anstatt sie durch Drittanbieter zu verlieren.

3. Kostenverteilung: Für die Kommunikation zwischen den AI-Systemen werden „Token-Gebühren“ erhoben; diese Kosten können von WeChat und den Handyherstellern gemeinsam getragen werden, anstatt dass nur ein Unternehmen sie allein tragen muss. Im Vergleich zum früheren reinen OCR-Modus (das die Privatsphäre der Apps gefährdete) ist A2A somit für beide Seiten vorteilhafter.

Was kann A2A in Zukunft leisten? Vom Mini-Programm bis zu einer vollständigen Ökologie

Derzeit können mit A2A nur Nachrichten versendet und Audio-/Videoanrufe geführt werden, aber die Möglichkeiten sind groß:

Innenhalb von WeChat: Die Mini-Programme könnten direkt mit A2A verbunden werden. Man könnte beispielsweise sagen: „YOYO, nutze das Meituan-Mini-Programm, um einen Milchshake zu bestellen.“
Über verschiedene Apps hinweg: A2A ist ein universelles System – man könnte morgen befehlen: „Xiaobu, schau mit Ctrip nach meinem Reisebericht vom letzten Jahr“, und übermorgen: „Xiaoi, bezahle die Stromrechnung mit Alipay.“
Internationale Unternehmen folgen dem Trend: Google’s Gemini Spark unterstützt bereits A2A, Apple wird auf der WWDC 2026 Siri um intelligente Funktionen erweitern, und auch ByteDance sowie ZTE werden ihr bisheriges OCR-Modus durch A2A ersetzen.

In Zukunft könnte es tatsächlich möglich sein, mit einem einzigen AI-Assistenten alle Anwendungen zu steuern.

Bedenken hinsichtlich von A2A: Kosten und die Rolle des Menschen

Obwohl A2A viele Vorteile bietet, gibt es zwei unvermeidliche Probleme:

1. Wer trägt die Rechenkosten? Für jede Kommunikation zwischen den AI-Systemen werden Gebühren erhoben – WeChat und Huawei müssen beispielsweise einen Teil dieser Kosten tragen. Wie werden diese Kosten zukünftig unter Nutzern, Herstellern und App-Entwicklern aufgeteilt? Soll A2A kostenlos oder kostenpflichtig sein? Das ist eine große Herausforderung.

2. Wird der Mensch zu einer „Maschine“? Wenn alles von AI übernommen wird, könnte man dazu neigen, seine Anfragen immer stärker zu formalisieren (z. B. „Schick Mama eine Nachricht: Komm heute Abend um 19 Uhr zum Essen nach Hause“ anstatt „Sag Mama, dass ich heute Abend nach Hause komme“). Langfristig könnte dies dazu führen, dass Menschen ihre Fähigkeit zur flexiblen Ausdrucksweise verlieren und beginnen, wie Maschinen zu denken.

Kurzfristig gibt es jedoch keinen Grund zur Sorge: Die A2A-Funktion von WeChat befindet sich noch in der Testphase – es wird mindestens ein halbes Jahr dauern, bis alle täglichen Funktionen unterstützt werden. Schon jetzt ist die Möglichkeit, einfach mit den Lippen zu kommunizieren, um Nachrichten über WeChat zu senden, eine kleine Erleichterung durch die Technologie.

Insgesamt stellt A2A einen wichtigen Schritt auf dem Weg zur praktischen Anwendung von intelligenten Systemen dar. Es löst tatsächliche Probleme und gleicht die Interessen aller Beteiligten aus – doch die zukünftigen Kosten- und Ethikfragen müssen noch genauer untersucht werden. Für den Durchschnittsnutzer ist es bereits ein guter Anfang, weniger mit den Händen zu arbeiten und mehr mit der Stimme zu kommunizieren.