虎嗅

„Im Januar wurden 500 Millionen US-Dollar verbrannt, bevor man es erkannte: Die Verwendung von Tokens als KPIs ist der teuerste Fehler bei der AI-Transformation – Amazon zog die Liste sofort zurück.“

原文：一月烧掉5亿美元才醒悟：把Token 当KPI是AI转型里最贵的坑，亚马逊连夜撤下排行榜

2026-06-02 阅读原文

Zusammenfassung der Kerninhalte:

In letzter Zeit sind viele Unternehmen bei ihrer AI-Transformation auf große Probleme gestoßen: Sie haben die „Tokenverbrauchsmenge“ als KPI für ihre Mitarbeiter herangezogen, was dazu führte, dass die Tokenkosten außer Kontrolle gerieten und viel Geld verschwendet wurde (beispielsweise verbrachte ein Unternehmen im Januar 500 Millionen US-Dollar). Die upstream-Unternehmen (z. B. Anthropic) sowie Chiphersteller (z. B. Nvidia) hingegen profitierten davon, dass die downstream-Unternehmen Geld ausgaben. Amazon war das erste Unternehmen, das dies erkannte und die Token-Rangliste entfernte; stattdessen werden nun Kriterien zur tatsächlichen Leistung herangezogen. Dies zeigt: Der Schlüssel zur Effizienzsteigerung durch AI liegt nicht darin, die Anzahl der genutzten Tokens zu erhöhen, sondern darin, AI wirklich in die Geschäftsprozesse zu integrieren und tatsächliche Probleme zu lösen.

I. Kontrolleverlust bei den Tokenkosten: Alles aufgrund einer „KPI-Orientierung“

Zunächst erklären wir kurz, was Tokens sind: Man kann sie als die „Treibstoffe“ für AI betrachten – jede Verarbeitung von Text oder das Schreiben eines Codes durch AI verbraucht bestimmte Tokens, und je mehr Tokens verwendet werden, desto höher sind die Kosten.

Warum entstehen solche unkontrollierten Kosten? Der Hauptgrund liegt darin, dass die Tokenverbrauchsmenge als KPI herangezogen wird:

Ein Unternehmensleiter gewährte allen Mitarbeitern Zugriff auf Claude, ohne eine Obergrenze zu setzen; die Mitarbeiter versuchten die Aufgaben immer wieder und verursachten Fehler, was zu Kosten von 500 Millionen US-Dollar führte.
Meta erstellte interne Ranglisten für den „Claude-Economics“-Verbrauch – der Spitzenreiter verbrauchte monatlich 28,1 Milliarden Tokens und fast 500.000 US-Dollar.
Mitarbeiter von MiHuya nutzten zahlreiche AI-Assistenten für Projekte; allein in einer Nacht wurden 2 Millionen chinesische Yuan verschwendet.
Uber stellte AI-Tools für 5.000 Ingenieure bereit und verbrauchte dabei bereits das gesamte Budget für das Jahr 2026.

Noch schlimmer ist, dass der Einsatz von AI-Assistenten an sich kostspielig ist: Sie müssen wiederholt nachdenken, Informationen suchen, Tools aufrufen und den Kontext verstehen – der Tokenverbrauch ist dabei 1.000-mal höher als bei herkömmlichen Fragen und Antworten. Man könnte meinen, sie arbeiten effizient, doch in Wirklichkeit verschwenden sie nur Geld.

II. Die upstream-Unternehmen profitieren: Ihre Kosten sind ihr Umsatz

Die Tokenkosten der downstream-Unternehmen werden für die upstream-Unternehmen zu einer Quelle des Gewinns:

Anthropic: Das Unternehmen erzielte im ersten Quartal Einnahmen von 4,8 Milliarden US-Dollar und rechnet damit, diese im zweiten Quartal auf 10,9 Milliarden zu verdoppeln – alles dank der Einnahmen aus API-Käufen und der Nutzung von Claude-Tools.
Nvidia: Mit einem Umsatz von 81,6 Milliarden US-Dollar im letzten Quartal profitierte das Unternehmen davon, dass AI-Anwendungen viele GPUs benötigen; je mehr Tokens verbraucht werden, desto größer ist die Nachfrage nach GPUs – und Nvidia profitiert daraus.

Die upstream-Unternehmen präsentieren den erhöhten Tokenverbrauch als „fortschrittliche Produktivität“, aber für die downstream-Unternehmen sind Tokens lediglich Kosten und keine Vermögenswerte – nur wenn diese in effizientere Geschäftsprozesse umgewandelt werden, sind sie wertvoll.

III. Amazons Entscheidung: Von KPIs zu tatsächlichen Zielen

Amazon erstellte ursprünglich eine „KiroRank“-Rangliste, die nach dem Tokenverbrauch der Ingenieure sortierte und vorschrieb, dass acht Mitarbeiter pro Woche AI nutzen mussten. Dadurch begannen die Mitarbeiter, unnötige Aufgaben mit AI zu erledigen, nur um in der Rangliste aufzusteigen und ein besseres Arbeitsumfeld zu schaffen.

Schließlich erkannte Amazon dies und entfernte die Rangliste; stattdessen wird nun die Menge der standardisierten AI-Einsätze gemessen – es zählt, ob die Ingenieure wirklich nützlichen Code erstellen. Hinter dieser Entscheidung steht das „Goodhart’s Law“: Wenn ein Kriterium zu einem Ziel wird, ist es nicht mehr geeignet (statt Arbeitszeit wurde nun der Tokenverbrauch zum Maßstab – im Grunde handelt es sich dabei um Formalismus).

Auch andere Unternehmen folgten diesem Beispiel: Shopify änderte seine Rangliste in einen neutralen Dashboard und fügte eine „Schutzmechanismus“ gegen übermäßigen Verbrauch hinzu; Duolingo stellte die AI-Bewertungen ein; Microsoft reduzierte die Lizenzen für externe AI-Tools.

IV. Die wahre Effizienzsteigerung durch AI: Nicht in der Anzahl der Tokens, sondern in der praktischen Anwendung

Viele Unternehmen verstehen die AI-Transformation falsch: Sie glauben, dass das Eröffnen von Konten und der erhöhte Tokenverbrauch bereits eine erfolgreiche Transformation darstellt. Tatsächlich ist dies nicht der Fall:

Uber stellte fest, dass zwar mehr Code mit AI erstellt wurde, dieser den Nutzern jedoch keine nützlicheren Funktionen bot.
Die Code-Analysefirma GitClear zeigte, dass bei mit AI unterstütztem Code die Nacharbeiten innerhalb von zwei Wochen um das Neunfache und der redundante Code um das Achteinhalftafache stieg – es handelt sich dabei lediglich um einen Austausch der Ineffizienz des Menschen durch die teurere Ineffizienz der AI.

Die wahre Effizienzsteigerung liegt darin, AI in die Geschäftsprozesse zu integrieren. Unternehmen wie OpenAI und Anthropic suchen beispielsweise nach „Forward-Deployment-Ingenieuren“, die tief in die Kundenprozesse eindringen, Berechtigungen klären und Integrationen durchführen, um AI dazu zu bringen, tatsächliche Probleme zu lösen.

Fazit:

Die Effizienzsteigerung durch AI besteht nicht darin, wer am meisten Geld ausgibt, sondern darin, wie viele Probleme mit AI gelöst werden. Lassen Sie Ihre Tokenkosten nicht zu Zahlen in den Finanzberichten anderer Unternehmen werden – das ist keine wirkliche Leistung.