第一财经

“Tokenmaxxing”终结?硅谷巨头开始审视“无效”AI账单

该文章尚未提供 العربية 解读,以下为中文版内容。

核心内容总结

前几个月,硅谷和华尔街企业疯狂鼓励员工用AI,甚至搞排行榜比谁消耗的AI token多;但员工为了刷排名,用高级AI干简单活(比如闲聊、答基础问题),导致企业AI成本暴涨却没换来对等生产力。现在企业集体踩刹车:撤排行榜、调整考核,开始“精打细算”。这可能影响大模型厂商(如Anthropic、OpenAI)的营收增长,但也有人认为AI应用还在初期,不用过度悲观。

一、从“越多越好”到“刹车”:企业态度180度大转弯

之前企业对AI的态度是“拼命推”:硅谷和华尔街共识是“AI用得越多越好”,亚马逊、迪士尼、摩根大通等设内部排行榜追踪token消耗;Visa还奖励用AI提升效率的团队(比如给积分换咖啡机)。

现在突然“踩刹车”:亚马逊下线了追踪AI使用的Kirorank排行榜;Meta撤掉了员工自制的Claudeonomics排行榜;优步COO直言“没看到token增加带来生产力提升”;谷歌CEO说很多CIO“怕预算超支”。

原因:钱花了不少,但没效果——token消耗激增带来财务压力,却没转化为实际效率提升。

二、Tokenmaxxing:职场版“刷流量”,AI成了“面子工程”

“Tokenmaxxing”是个新职场现象:员工为了在排行榜上拿高分,疯狂消耗AI token——用最强大的高级AI模型(比如Claude 3 Opus)回答最简单的问题(比如“今天天气怎么样”),甚至闲聊,就为了显得自己“走在AI前沿”。

例子:亚马逊员工用AI Agent做非必要任务提升排名;Meta有人30天消耗2810亿-3285亿token,按公开价算近200万美元(这些钱基本白花);优步前四个月就用完了全年的Claude Code预算。

本质是“为了用AI而用AI”,把AI变成了刷KPI的工具。

三、真金白银打水漂:企业的成本焦虑爆发

企业的AI账单已经高到“肉疼”:

  • 优步:前四个月用完全年Claude Code预算;
  • Meta:单个员工30天AI支出近200万美元;
  • AI初创公司Modal创始人直言:“50%的内部token支出完全没用,但不知道哪50%”;
  • 另一家初创公司EntelligenceAI数据:用高级AI编码工具的公司,只有18%的token支出转化为能给用户用的产品(剩下82%都浪费在调试、重写AI生成的内容上)。

这些数字让企业高管意识到:不能再“撒钱”了,得控制成本。

四、大模型厂商:增长要放缓?IPO遇挑战?

企业开始“精打细算”,直接影响大模型厂商的收入:

  • 比如Anthropic刚完成H轮融资,估值高达9650亿美元,正冲刺IPO,但客户支出谨慎可能让它的营收增长放缓;OpenAI也面临同样问题。
  • 不过也有不同声音:财富管理公司Prime Capital的投资官说“AI应用还在起步阶段,即使大公司也在摸索”,认为不用过度担心回调。

大模型厂商的应对:Anthropic说正在帮客户“看到收益,而不是只感受到成本”,比如用模型两周完成过去七个月的任务。

五、AI应用的“虚火”:效率转化低,模型需改进

AI不是“万能药”,目前还有很多问题:

  • 虽然AI能加快任务速度,但调试、审查AI生成内容的成本很高(比如AI写的代码需要大量修改才能用);
  • EntelligenceAI的数据显示,只有18%的token支出转化为实际产品,说明模型还不够成熟,无法直接产出可用结果。

这意味着AI要真正带来价值,还得继续优化——不仅要“快”,还要“准”,减少后续的修正成本。

总结:企业从“盲目推AI”到“理性用AI”,是技术落地的必经阶段。对员工来说,AI不再是“刷分工具”;对企业来说,要算清楚投入产出比;对大模型厂商来说,得证明自己的价值,而不是只靠“消耗token”赚钱。AI的未来,要“质量”不要“数量”。