虎嗅

一月烧掉5亿美元才醒悟:把Token 当KPI是AI转型里最贵的坑,亚马逊连夜撤下排行榜

核心内容总结

最近不少企业在AI转型中踩了个大坑:把AI的“Token使用量”当成员工KPI,结果Token账单失控,烧了大把冤枉钱(比如某公司一月烧5亿美元,Meta、Uber、米哈游都有类似“事故”)。上游的模型公司(如Anthropic)、芯片公司(如英伟达)却靠下游企业的“烧钱”赚得盆满钵满。亚马逊率先醒悟,撤下Token排行榜,换成看实际产出的指标。这说明:AI提效的关键不是刷Token数量,而是让AI真正融入业务流程,解决实际问题。

一、Token账单失控:都是“KPI导向”惹的祸

先简单说下Token是什么:你可以把它理解成AI的“燃料”——每让AI处理一段文字、写一行代码,都会消耗一定Token,消耗越多,账单越高。

为什么会烧钱失控?核心原因是把Token量当KPI

  • 某公司老板给全员开Claude权限却没设上限,员工反复重试报错任务,一月烧5亿美元;
  • Meta内部搞“Claude经济学”榜单,榜一大哥每月用2810亿Token,花近50万美元;
  • 米哈游员工为项目搭几十个AI助手(Agent)协作,一晚上烧200万人民币;
  • Uber给5000工程师配AI工具,结果提前烧光2026年全年预算。

更糟的是,AI助手(Agent)模式本身就费钱:它需要反复“思考→查资料→调用工具→读上下文”,Token消耗是普通问答的1000倍——你以为它在“认真干活”,其实是在“疯狂烧钱”。

二、上游公司笑开花:你的成本,是他们的营收

下游企业的Token账单,直接变成上游公司的“摇钱树”:

  • 模型公司Anthropic:一季度收入48亿美元,二季度预计翻倍到109亿,靠的就是企业买API、用Claude Code的钱;
  • 芯片公司英伟达:最新季度收入816亿美元,因为AI推理需要大量GPU——Token烧得越多,GPU需求越大,老黄(黄仁勋)自然“赢麻了”。

上游公司还会把“多烧Token”包装成“先进生产力”,但对下游企业来说,Token是成本,不是资产——只有能换回更高效的业务流程,这笔钱才值。

三、亚马逊撤榜:指标变目标,就成了形式主义

亚马逊原来搞了个“KiroRank”榜单,按工程师Token消耗排名,还要求八成员工每周必须用AI。结果员工开始“刷Token”:派AI干没必要的活,只为冲排名换职场安全感。

后来亚马逊终于醒悟,撤下榜单,换成“标准化部署量”——看工程师用AI有没有产出真正有用的代码,而不是单纯数Token。这背后是古德哈特定律:当一个指标变成目标,它就不再是好指标(比如以前卷工时,现在卷Token,本质都是形式主义)。

其他公司也跟进了:Shopify把排行榜改成中性仪表盘,加了“熔断机制”(防止过度消耗);Duolingo撤回AI考核;微软收缩外部AI工具授权。

四、真正的AI提效:不在Token数量,而在业务落地

很多企业对AI转型的理解太浅:以为开账号、刷Token就是“转型成功”,其实不然:

  • Uber发现,用AI写的代码多了,但没给用户带来更有用的功能;
  • 代码分析公司GitClear数据显示,AI辅助的代码,两周内返工率翻9倍,重复代码翻8倍——只是把人类的低效,换成了AI更贵的低效。

真正的提效,是让AI穿透业务流程:比如OpenAI、Anthropic都在招“前向部署工程师”,深入客户内部拆流程、理权限、做集成,让AI真正解决问题。

结论:烧Token不算本事,能说清“这笔钱让公司哪里变好了”(比如流程缩短、返工减少、交付更快)才算真本事。

最后一句话总结

AI转型不是“比谁烧钱多”,而是“比谁用AI解决的问题多”——别让你的Token账单,变成别人财报上的数字。