虎嗅

Cerebras的故事:一颗餐盘大小的芯片

该文章尚未提供 日本語 解读,以下为中文版内容。

核心内容总结

Cerebras花十年造出“餐盘大小”的晶圆级芯片(不切割整片硅晶圆直接用),解决了GPU数据搬运慢的痛点,但受限于存储容量和对外带宽的物理约束;早期因AI行业聚焦模型训练而无人问津,2025年后推理速度需求爆发(Agent工具需要实时反馈),被OpenAI深度绑定(合同、贷款、股权三条线绑定),2026年上市市值达600亿;其命运核心赌局是:模型蒸馏(把大模型“蒸小”)的速度能否跑赢摩尔定律在存储上的停滞,让小模型适配芯片的物理限制。

1. 餐盘大芯片的“反常识”创新:从根源解决GPU的“搬砖难题”

GPU的问题像“工地搬砖”:一台服务器里几千颗小芯片,数据要在芯片间反复搬运(比如从内存到计算核心),每搬一次就费电、耽误时间——就算计算核心再快,数据送不过来也白搭。

Cerebras的办法很疯狂:不切晶圆。普通芯片是把晶圆切成几十块“小饼干”,它直接把整张晶圆当“一块大饼干”用。这样数据在芯片内部流动时,永远不用离开硅片(不用走外部线路),搬运问题从物理上消失了。

但这带来三个大难题:

  • 良率:芯片越大越容易有制造缺陷(比如硅片上有个小杂质)。他们用“冗余核心”解决:刻97万个核心只启用90万个,绕过缺陷区域,保证几乎100%能用。
  • 散热:25千瓦功耗集中在餐盘大的硅片上,风冷根本不够。他们设计了定制液冷系统——冷却液要精确到21℃,数据中心得配6000吨级冷水机组(相当于一个小型工厂的制冷量)。
  • 供电:要把2万瓦电力精准送到一片硅上,用84个定制电源模块逐级降压,还发明了能同时拧40颗螺丝不碎晶圆的工具。

这颗芯片从想法到跑通,烧了2亿美元,花了三年“隐身”研发。

2. 从无人问津到香饽饽:推理速度突然“值钱了”

2019-2024年,AI行业都在比“谁的模型更大”(比如GPT-3到GPT-4),英伟达GPU擅长训练大模型,占了80%市场。此时Cerebras的芯片只擅长“推理”(用训练好的模型生成回答),但用户对ChatGPT等工具的延迟(等2秒)不敏感,所以没人买——唯一大客户是阿布扎比的G42,占了九成收入,还因美国审查导致2025年撤回IPO。

变化在2025下半年:Agent工具流行。比如Claude Code这类AI助手要反复调用模型、实时生成代码,对延迟敏感度是普通聊天的10倍。Anthropic推出“fast模式”:贵6倍,但速度快2.5倍,结果开发者宁愿用更笨的旧模型(Opus4.6)也不换更聪明但慢的新模型(Opus4.7)——速度第一次比“聪明”更值钱。

英伟达和OpenAI同时意识到:GPU搞不定推理,需要新芯片。英伟达买了Groq,OpenAI则签了Cerebras100亿的推理合同——餐盘大芯片突然成了香饽饽。

3. 物理定律下的“孤岛困境”:芯片的天生短板

这颗芯片不是完美的,它有两个绕不开的物理限制:

  • 存储天花板:芯片一半面积用来做高速存储(SRAM),共44GB——这在芯片界是巨量(普通芯片只有几百兆),但和GPU的外挂内存(比如英伟达Rubin GPU有288GB)比,差了6.5倍。大模型动辄几千亿参数,44GB根本装不下。如果硬要装大模型,就得把模型切成多片分到多个晶圆上,但晶圆对外带宽只有150GB/s(是GPU的1/6),每加一片就多一个瓶颈,速度优势立刻缩水。
  • 对外带宽的几何陷阱:晶圆是圆形的,只有边缘区域能接外部接口。如果在每块印刷区域都加接口,中间区域的接口根本连不出去,既浪费硅面积,又破坏内部数据通路——这是晶圆级架构的天生缺陷,不是技术能解决的。

更糟的是:SRAM的面积不再随芯片制程进步缩小(比如5nm到3nm,存储密度零增长),Cerebras下一代芯片的存储还是44GB。这颗芯片像一座孤岛:内部跑得飞快,但外面进不来、出不去,还装不下大东西。

4. 和OpenAI的“深度绑定”:是靠山还是枷锁?

Cerebras的翻盘全靠OpenAI,但这种绑定是双刃剑:

  • 好处:OpenAI给了100亿+的合同(2026-2028年部署2吉瓦算力),10亿担保贷款(用算力偿还免息),还拿到了几乎白送的股份(认股权证行权价0.00001美元,摊薄后占12%)。这些让Cerebras直接从濒临IPO失败变成市值600亿。
  • 风险:OpenAI是Cerebras的唯一大客户、贷款方、潜在大股东——三条线绑死,没有任何对冲。一旦OpenAI终止合同,Cerebras不仅失去收入,还要立刻偿还10亿贷款。此外,交付压力巨大:2028年前要交付的服务器总量,比公司成立以来所有出货量多一个量级,而且液冷数据中心建设难度高(每千瓦冷却液流量是英伟达的3倍)。

这不是普通的“客户集中”,而是“一体绑定”——OpenAI用另一种方式“控制”了当年没收购成的公司。

5. 600亿市值的赌注:蒸馏能否跑赢摩尔定律?

Cerebras的市值不是靠芯片本身,而是靠行业对“模型蒸馏”的押注:

  • 摩尔定律停了:SRAM的存储密度不再增长,44GB是天花板。
  • 蒸馏还在进步:模型蒸馏是把大模型“蒸小”(用大模型的输出训练小模型),让小模型保持接近大模型的性能。比如OpenAI用Cerebras芯片跑的Codex-Spark,是GPT-5.3的1/10大小(1200亿参数),刚好装进44GB,速度能到每秒1000个Token。

赌局的核心:如果蒸馏速度够快,未来小模型能追上今天大模型的智能水平,那么Cerebras的44GB孤岛就是推理时代的黄金基础设施(小模型+快速度=高价值);如果蒸馏慢,44GB装不下主流模型,芯片就会被淘汰。

这个答案可能一年之内就会揭晓——毕竟AI行业的变化比想象中快。

最后一句话总结

Cerebras的故事是技术创新、行业需求变化和商业绑定的交织:它用十年解决了一个技术难题,但能否活下去,要看模型蒸馏能不能突破物理定律的枷锁。这不仅是Cerebras的命运,也是AI芯片行业未来方向的一次关键对赌。