虎嗅

一月烧掉5亿美元才醒悟：把Token 当KPI是AI转型里最贵的坑，亚马逊连夜撤下排行榜

2026-06-02 阅读原文

核心内容总结

最近不少企业在AI转型中踩了个大坑：把AI的“Token使用量”当成员工KPI，结果Token账单失控，烧了大把冤枉钱（比如某公司一月烧5亿美元，Meta、Uber、米哈游都有类似“事故”）。上游的模型公司（如Anthropic）、芯片公司（如英伟达）却靠下游企业的“烧钱”赚得盆满钵满。亚马逊率先醒悟，撤下Token排行榜，换成看实际产出的指标。这说明：AI提效的关键不是刷Token数量，而是让AI真正融入业务流程，解决实际问题。

一、Token账单失控：都是“KPI导向”惹的祸

先简单说下Token是什么：你可以把它理解成AI的“燃料”——每让AI处理一段文字、写一行代码，都会消耗一定Token，消耗越多，账单越高。

为什么会烧钱失控？核心原因是把Token量当KPI：

某公司老板给全员开Claude权限却没设上限，员工反复重试报错任务，一月烧5亿美元；
Meta内部搞“Claude经济学”榜单，榜一大哥每月用2810亿Token，花近50万美元；
米哈游员工为项目搭几十个AI助手（Agent）协作，一晚上烧200万人民币；
Uber给5000工程师配AI工具，结果提前烧光2026年全年预算。

更糟的是，AI助手（Agent）模式本身就费钱：它需要反复“思考→查资料→调用工具→读上下文”，Token消耗是普通问答的1000倍——你以为它在“认真干活”，其实是在“疯狂烧钱”。

二、上游公司笑开花：你的成本，是他们的营收

下游企业的Token账单，直接变成上游公司的“摇钱树”：

模型公司Anthropic：一季度收入48亿美元，二季度预计翻倍到109亿，靠的就是企业买API、用Claude Code的钱；
芯片公司英伟达：最新季度收入816亿美元，因为AI推理需要大量GPU——Token烧得越多，GPU需求越大，老黄（黄仁勋）自然“赢麻了”。

上游公司还会把“多烧Token”包装成“先进生产力”，但对下游企业来说，Token是成本，不是资产——只有能换回更高效的业务流程，这笔钱才值。

三、亚马逊撤榜：指标变目标，就成了形式主义

亚马逊原来搞了个“KiroRank”榜单，按工程师Token消耗排名，还要求八成员工每周必须用AI。结果员工开始“刷Token”：派AI干没必要的活，只为冲排名换职场安全感。

后来亚马逊终于醒悟，撤下榜单，换成“标准化部署量”——看工程师用AI有没有产出真正有用的代码，而不是单纯数Token。这背后是古德哈特定律：当一个指标变成目标，它就不再是好指标（比如以前卷工时，现在卷Token，本质都是形式主义）。

其他公司也跟进了：Shopify把排行榜改成中性仪表盘，加了“熔断机制”（防止过度消耗）；Duolingo撤回AI考核；微软收缩外部AI工具授权。

四、真正的AI提效：不在Token数量，而在业务落地

很多企业对AI转型的理解太浅：以为开账号、刷Token就是“转型成功”，其实不然：

Uber发现，用AI写的代码多了，但没给用户带来更有用的功能；
代码分析公司GitClear数据显示，AI辅助的代码，两周内返工率翻9倍，重复代码翻8倍——只是把人类的低效，换成了AI更贵的低效。

真正的提效，是让AI穿透业务流程：比如OpenAI、Anthropic都在招“前向部署工程师”，深入客户内部拆流程、理权限、做集成，让AI真正解决问题。

结论：烧Token不算本事，能说清“这笔钱让公司哪里变好了”（比如流程缩短、返工减少、交付更快）才算真本事。

最后一句话总结

AI转型不是“比谁烧钱多”，而是“比谁用AI解决的问题多”——别让你的Token账单，变成别人财报上的数字。