虎嗅

**Übersetzung:** „Im Ausland steigen die Preise – im Inland bleibt alles beim Alten: Das Spiel um Nutzer und Gewinne hinter dem dualen AI-Preissystem“

原文:海外涨、国内守:AI收费双轨制背后的用户与利润博弈

Zusammenfassung der Kerninhalte

Die kürzlichen kommerziellen Maßnahmen von OpenAI und DouBao spiegeln eine deutliche Unterscheidung in den Abrechnungsmodellen für große Modelle im In- und Ausland wider: Im Ausland (wie bei OpenAI) wird die Abrechnung nach Tokens (der kleinsten Einheit der AI-Bearbeitung von Informationen, ähnlich wie eine „Nachverrechnung nach Verbrauch“) auf der Unternehmensseite beschleunigt vorangetrieben, während auf der Privatseite weiterhin ein Abonnementmodell mit Einschränkungen besteht; im Inland (wie bei DouBao) wird hauptsächlich ein Abonnementmodell (monatliche Festgebühr ohne deutliche Anzahlsgrenzen) beibehalten. Hinter dieser Differenz stecken Faktoren wie Kostendruck, Nutzergewohnheiten und Marktkonkurrenz. Die Verbreitung der Token-Abrechnung führt dazu, dass sich das Bewertungssystem der Branche von der „Anzahl der Nutzer“ auf die „tatsächliche Nutzungsmenge“ verändert. Im Inland könnte sich in Zukunft ein Mischmodell aus Abonnement und Tokens entwickeln.

I. Abrechnungsmodelle im In- und Ausland: Ein Modell nach Verbrauch, eines nach Monat

  • Ausländisches Modell: Privatabonnements als Grundlage, auf der Unternehmensseite Token-Berechnung

ChatGPT bietet für Privatnutzer kostenlose, Plus-, Pro- und Business-Ebenen an: Die kostenlose Version beschränkt die Anzahl der GPT-5.5-Nachrichten pro 5 Stunden auf 10 Nachrichten; Plus/Pro auf 160 Nachrichten pro 3 Stunden; darüber hinaus wechselt man zur Mini-Version. Auf der Unternehmensseite (z. B. Codex) wird direkt nach Tokens abgerechnet – alle eingegabenen, ausgegebenen und gespeicherten Tokens werden genau berechnet, nicht mehr nach der Anzahl der Nachrichten. Anthropic geht noch weiter: Die Unternehmensversion kostet 20 US-Dollar pro Platz plus eine Gebühr für den Tokenverbrauch, es gibt keine kostenlose Quote.

  • Inländisches Modell: Hauptsächlich Abonnementmodell ohne deutliche Nutzungsmengenbeschränkungen

DouBao bietet drei Versionen an: Die Standardversion kostet 68 Yuan pro Monat, die erweiterte Version 200 Yuan pro Monat und die professionelle Version 500 Yuan pro Monat – alle Versionen haben keine Begrenzung der Anzahl der Nachrichten. Kimi verwendet ebenfalls ein Abonnementmodell; DeepSeek bietet sogar kein C-Ende-Abonnement an, sondern nur eine Entwickler-API.

  • Gemeinsamkeiten: Beide Modelle richten sich an intensive Nutzer

Bei OpenAI Codex machen neue Nicht-Entwickler-Nutzer 40 % aus (Analysten, Operatoren usw.), was darauf hindeutet, dass das Tool in den allgemeinen Bürobetrieb eindringt; intensive Nutzer können durch Abonnements Preisvorteile genießen (z. B. jemand spart mehr als 2000 US-Dollar an API-Kosten, indem er für 200 US-Dollar abonniert).

II. Der dringende Einsatz der Token-Abrechnung im Ausland: Druck durch Kosten

Die Kernlogik der Token-Abrechnung besteht darin, die Rechenkosteneffizienz genau zu berücksichtigen:

  • Abonnementmodelle haben eine Obergrenze: Wenn die monatlichen Token-Kosten eines Nutzers die Monatsgebühr deutlich übersteigen, machen große Unternehmen Verluste (z. B. bei der Bearbeitung langer Texte oder beim Aufrufen von Tools steigt der Tokenverbrauch stark an).
  • Die Unternehmensseite ist ein Goldfeld: Unternehmensnutzer verbrauchen viel und zahlen bereitwillig – die Token-Abrechnung generiert zusätzliche Einnahmen. Beispielsweise macht die Unternehmensabteilung von OpenAI 21 % der Einnahmen aus, Anthropics jährlicher regulärer Umsatz beträgt 47 Milliarden US-Dollar (im Vorjahr nur 9 Milliarden), hauptsächlich durch Unternehmensverträge.
  • Die Rechenkostensituation ist ein unsichtbarer Treiber: Der Betrieb von AI erfordert viele GPUs, was sehr teuer ist. Die Token-Abrechnung ermöglicht es, „Kosten“ und „Einnahmen“ direkt miteinander in Verbindung zu bringen und den Rechenkostendruck für große Unternehmen zu verringern.

III. Der Beibehalt des Abonnementmodells im Inland: Angst vor Nutzerverlusten, starke Konkurrenz

Inländische Anbieter zögern, auf die Token-Abrechnung umzusteigen – aus realistischen Gründen:

  • Psychologischer Druck der Nutzer: Die Nachzahlung nach Verbrauch (Tokens) führt bei normalen Nutzern dazu, dass sie denken, „jedes Mal bezahlen zu müssen“, was die Nutzungsbereitschaft verringert; das Abonnementmodell ist für sie eher wie ein Monatspaket und wird psychologisch leichter akzeptiert.
  • Die Nutzerbasis ist entscheidend: DouBao hat 345 Millionen aktive Monatnutzer und ist die größte AI-Anwendung im Inland; es riskiert nicht, seine Nutzerbasis durch aggressive Abrechnungsmethoden zu gefährden (falls Nutzer weggehen, sind sie schwer zurückzuholen).
  • Starke Konkurrenz: Viele AI-Apps im Inland sind weiterhin kostenlos; das Abonnementmodell ist bereits eine relativ „milde“ Einnahmemethode. Wenn direkt nach Tokens abgerechnet würde, könnten Nutzer zu kostenlosen Alternativen wechseln.
  • Die Ökologie wird noch aufgebaut: Hinter DouBao stehen Ökosysteme wie ByteDance’ Feishu (Unternehmenskooperation) und Koudzhi (AI-Programmierung); zunächst werden Nutzer durch Abonnements gehalten, später sollen sie zu zahlenden Nutzern des Ökosystems werden.

IV. Die „großen Veränderungen“, die die Token-Abrechnung mit sich bringt

Die Token-Abrechnung ist nicht nur eine neue Abrechnungsmethode, sondern auch ein Umstrukturierer der Branche und ihrer Wertschöpfungsketten:

  • Veränderte Bewertungsmodelle: Im traditionellen Internet wurde die Zahl der Nutzer mit dem ARPU (Average Revenue Per User) verglichen; heute werden große Modelle anhand der effektiven Token-Nutzung und des Wertes pro Token bewertet – schließlich können Tokens die Rechenkosten und den Dienstwert direkt quantifizieren.
  • Chancen für die Wertschöpfungsketten:

1. Rechenleistungsbereich: Je mehr Tokens verwendet werden, desto mehr Rechenleistung wird benötigt – intelligente Rechenzentren und Rechenleistungsmietunternehmen profitieren davon.

2. Telekommunikationsanbieter: Der Transfer von Tokens erfordert Datenübertragung; die Rechenleistungsnetze und Datenkommunikationsdienste der Telekommunikationsanbieter werden floreren.

3. Anwendungsbereich: Das Mischmodell (Abonnement + Tokens) macht die Einnahmenverteilung flexibler – z. B. C-Ende-Abonnements, B-Ende-Tokens verbessern die Unternehmens-Einnahmesstrukturen.

V. Preisunterschiede: „Funktionierende“ Tokens sind wertvoller

Die Preisentwicklung im In- und Ausland unterscheidet sich hauptsächlich nach Szenariowert:

  • Im Ausland: Je neuer das Modell, desto teurer (GPT-5.5 ist doppelt so teuer wie die vorherige Generation); Anthropic hat sogar „heimliche Preiserhöhungen“ vorgenommen (neue Wortteiler erhöhen die Anzahl der Tokens für denselben Text, was die tatsächlichen Kosten um 40 % erhöht) – weil Nutzer bereit sind, mehr für „effektivere AI“ zu zahlen.
  • Im Inland:
  • Preise für allgemeine Szenarien sinken: Die API-Preise von DeepSeek und Xiaomi wurden um mehr als 90 % gesenkt, um Nutzer anzuziehen;
  • Preise für produktive Szenarien steigen: Die Preise für intelligente Modelle wie Zhipu GLM-5 (Programmierung) und Tencent CodeBuddy (AI-Programmierhilfe) haben mehrfach zugenommen – weil diese Lösungen den Nutzern direkt Geld einbringen.

Zukunftstrends: Ein Mischmodell könnte die Norm werden

Die Tokenisierung im Ausland und das Abonnementmodell im Inland sind keine Frage des Ersatzes, sondern unterschiedliche Entscheidungen je nach Entwicklungsstufe: Im Ausland ist die Unternehmensökologie ausgereift; Unternehmen können die Nachverrechnung nach Verbrauch akzeptieren. Im Inland gibt es eine große C-Ende-Nutzerbasis; zunächst werden Nutzer durch Abonnements gehalten, später wird schrittweise auf die Token-Abrechnung auf der Unternehmensseite umgestellt. Letztendlich könnte sich ein Mischmodell aus C-Ende-Abonnement und B-Ende-Tokens entwickeln – das sowohl die Nutzungsgewohnheiten von Normalnutzern berücksichtigt als auch die genauen Kosten der Unternehmen abdeckt.

Der Wettbewerb um die Kommerzialisierung von AI dreht sich im Kern darum, wie viel Nutzer bereit sind, für AI-Dienste zu zahlen, und Tokens sind das „Maßstab“ dafür. Wer den Balance zwischen Benutzererfahrung und Kosten findet, wird in diesem Wettbewerb siegen.