虎嗅

Cerebras的故事：一颗餐盘大小的芯片

2026-06-11 阅读原文

该文章尚未提供日本語解读，以下为中文版内容。

核心内容总结

Cerebras花十年造出“餐盘大小”的晶圆级芯片（不切割整片硅晶圆直接用），解决了GPU数据搬运慢的痛点，但受限于存储容量和对外带宽的物理约束；早期因AI行业聚焦模型训练而无人问津，2025年后推理速度需求爆发（Agent工具需要实时反馈），被OpenAI深度绑定（合同、贷款、股权三条线绑定），2026年上市市值达600亿；其命运核心赌局是：模型蒸馏（把大模型“蒸小”）的速度能否跑赢摩尔定律在存储上的停滞，让小模型适配芯片的物理限制。

1. 餐盘大芯片的“反常识”创新：从根源解决GPU的“搬砖难题”

GPU的问题像“工地搬砖”：一台服务器里几千颗小芯片，数据要在芯片间反复搬运（比如从内存到计算核心），每搬一次就费电、耽误时间——就算计算核心再快，数据送不过来也白搭。

Cerebras的办法很疯狂：不切晶圆。普通芯片是把晶圆切成几十块“小饼干”，它直接把整张晶圆当“一块大饼干”用。这样数据在芯片内部流动时，永远不用离开硅片（不用走外部线路），搬运问题从物理上消失了。

但这带来三个大难题：

良率：芯片越大越容易有制造缺陷（比如硅片上有个小杂质）。他们用“冗余核心”解决：刻97万个核心只启用90万个，绕过缺陷区域，保证几乎100%能用。
散热：25千瓦功耗集中在餐盘大的硅片上，风冷根本不够。他们设计了定制液冷系统——冷却液要精确到21℃，数据中心得配6000吨级冷水机组（相当于一个小型工厂的制冷量）。
供电：要把2万瓦电力精准送到一片硅上，用84个定制电源模块逐级降压，还发明了能同时拧40颗螺丝不碎晶圆的工具。

这颗芯片从想法到跑通，烧了2亿美元，花了三年“隐身”研发。

2. 从无人问津到香饽饽：推理速度突然“值钱了”

2019-2024年，AI行业都在比“谁的模型更大”（比如GPT-3到GPT-4），英伟达GPU擅长训练大模型，占了80%市场。此时Cerebras的芯片只擅长“推理”（用训练好的模型生成回答），但用户对ChatGPT等工具的延迟（等2秒）不敏感，所以没人买——唯一大客户是阿布扎比的G42，占了九成收入，还因美国审查导致2025年撤回IPO。

变化在2025下半年：Agent工具流行。比如Claude Code这类AI助手要反复调用模型、实时生成代码，对延迟敏感度是普通聊天的10倍。Anthropic推出“fast模式”：贵6倍，但速度快2.5倍，结果开发者宁愿用更笨的旧模型（Opus4.6）也不换更聪明但慢的新模型（Opus4.7）——速度第一次比“聪明”更值钱。

英伟达和OpenAI同时意识到：GPU搞不定推理，需要新芯片。英伟达买了Groq，OpenAI则签了Cerebras100亿的推理合同——餐盘大芯片突然成了香饽饽。

3. 物理定律下的“孤岛困境”：芯片的天生短板

这颗芯片不是完美的，它有两个绕不开的物理限制：

存储天花板：芯片一半面积用来做高速存储（SRAM），共44GB——这在芯片界是巨量（普通芯片只有几百兆），但和GPU的外挂内存（比如英伟达Rubin GPU有288GB）比，差了6.5倍。大模型动辄几千亿参数，44GB根本装不下。如果硬要装大模型，就得把模型切成多片分到多个晶圆上，但晶圆对外带宽只有150GB/s（是GPU的1/6），每加一片就多一个瓶颈，速度优势立刻缩水。
对外带宽的几何陷阱：晶圆是圆形的，只有边缘区域能接外部接口。如果在每块印刷区域都加接口，中间区域的接口根本连不出去，既浪费硅面积，又破坏内部数据通路——这是晶圆级架构的天生缺陷，不是技术能解决的。

更糟的是：SRAM的面积不再随芯片制程进步缩小（比如5nm到3nm，存储密度零增长），Cerebras下一代芯片的存储还是44GB。这颗芯片像一座孤岛：内部跑得飞快，但外面进不来、出不去，还装不下大东西。

4. 和OpenAI的“深度绑定”：是靠山还是枷锁？

Cerebras的翻盘全靠OpenAI，但这种绑定是双刃剑：

好处：OpenAI给了100亿+的合同（2026-2028年部署2吉瓦算力），10亿担保贷款（用算力偿还免息），还拿到了几乎白送的股份（认股权证行权价0.00001美元，摊薄后占12%）。这些让Cerebras直接从濒临IPO失败变成市值600亿。
风险：OpenAI是Cerebras的唯一大客户、贷款方、潜在大股东——三条线绑死，没有任何对冲。一旦OpenAI终止合同，Cerebras不仅失去收入，还要立刻偿还10亿贷款。此外，交付压力巨大：2028年前要交付的服务器总量，比公司成立以来所有出货量多一个量级，而且液冷数据中心建设难度高（每千瓦冷却液流量是英伟达的3倍）。

这不是普通的“客户集中”，而是“一体绑定”——OpenAI用另一种方式“控制”了当年没收购成的公司。

5. 600亿市值的赌注：蒸馏能否跑赢摩尔定律？

Cerebras的市值不是靠芯片本身，而是靠行业对“模型蒸馏”的押注：

摩尔定律停了：SRAM的存储密度不再增长，44GB是天花板。
蒸馏还在进步：模型蒸馏是把大模型“蒸小”（用大模型的输出训练小模型），让小模型保持接近大模型的性能。比如OpenAI用Cerebras芯片跑的Codex-Spark，是GPT-5.3的1/10大小（1200亿参数），刚好装进44GB，速度能到每秒1000个Token。

赌局的核心：如果蒸馏速度够快，未来小模型能追上今天大模型的智能水平，那么Cerebras的44GB孤岛就是推理时代的黄金基础设施（小模型+快速度=高价值）；如果蒸馏慢，44GB装不下主流模型，芯片就会被淘汰。

这个答案可能一年之内就会揭晓——毕竟AI行业的变化比想象中快。

最后一句话总结

Cerebras的故事是技术创新、行业需求变化和商业绑定的交织：它用十年解决了一个技术难题，但能否活下去，要看模型蒸馏能不能突破物理定律的枷锁。这不仅是Cerebras的命运，也是AI芯片行业未来方向的一次关键对赌。