虎嗅

为什么说“永远缺存储”:AI 时代的存储叙事与投资逻辑

该文章尚未提供 العربية 解读,以下为中文版内容。

核心内容总结

这篇文章围绕AI时代的存储需求展开,指出存储是AI从演示走向实用的关键瓶颈——它不是单一硬盘或内存,而是分层的系统;需求因模型规模、对话上下文、用户并发等多因素呈倍数增长,压缩技术反而可能因场景扩展增加总需求;这轮存储周期不同于传统PC/手机周期,成为AI基础设施,高端产品更稀缺;投资需区分不同标的,跟踪关键指标,存储是“周期成长股”(被AI拉长景气周期,但仍受供给和算法影响)。

详细拆解解读

1. AI为啥最后都绕到存储?——它是AI的“记忆+工作台+仓库”

以前讨论AI基建先看GPU、电力,但往深了拆,AI的所有能力都得落在存储上:数据要存下来、搬过去、读出来、再写回去。AI存储不是简单的硬盘或内存条,而是分四层“金字塔”:

  • 最热层(HBM):GPU旁边的超高速内存,像做题时手边的草稿纸,负责模型运算、临时记对话内容(比如你问AI“昨天说的电影”,它得记住之前的对话,这叫KV cache),速度要极快才能跟上GPU;
  • 热层(DDR5等):CPU用的内存,像工作备忘录,负责调度任务、处理长对话(比如128K字的上下文);
  • 温层(企业级SSD):常用文件柜,存长期对话记录、AI检索用的向量数据库、训练数据;
  • 冷层(HDD/对象存储):大仓库,存训练语料、日志、图片视频等多模态数据。

简单说:算力是发动机,存储就是油箱+输油管+仓库+工作台,没它GPU再贵也只能空转。

2. AI存储需求为啥“越用越多”?——多个因素乘起来就爆炸了

AI存储需求不是“用户多一点,硬盘多一点”的线性增长,而是多个变量相乘:

  • 模型变大(从700亿参数到几百亿/多模型协同);
  • 对话上下文变长(从8K字到100万字);
  • 用户变多(从开发者到企业员工、客服、AI助手);
  • Agent多步骤(一次请求要调用搜索、数据库、工具链);
  • 检索数据变多(AI查向量库、文档库、历史日志)。

举个例子:一个700亿参数的模型,128K字的一条对话就要40GB缓存,1000条并发就是40TB——这还只是临时缓存,没算模型本身和其他数据。

有人说压缩技术能减少需求?短期是,但长期像“燃油车省油反而开更远”(杰文斯悖论):压缩4倍,产品经理就把上下文拉长4倍;推理成本降了,企业会让AI做更多事;过去不经济的长文档分析现在能用了,总需求反而涨了。

3. 这轮存储周期和以前不一样?——从消费电子到AI基础设施

传统存储是典型周期股:价格涨→扩产→过剩→降价→减产→循环。但AI改变了三点:

  • 需求变了:从PC/手机换机(弹性小)变成AI数据中心基建(云厂商提前多年锁产能,像建电网一样);
  • HBM不是普通内存:难在先进封装、良率、和GPU绑定,客户要提前认证签长协,高端HBM占了产能,普通内存也会紧;
  • NAND被激活:AI推理需要企业级SSD存向量库、RAG数据,多模态数据湖需要HDD,需求不再过剩。

所以这轮是HBM、服务器DRAM、SSD、HDD一起涨,不是单一产品。

4. 投资存储该怎么选?——不同标的吃不同的钱

存储链不能混着看,分几类:

  • 全球原厂(SK海力士、美光、三星):核心HBM供给方,SK海力士先发优势强,美光是美股直接标的,三星良率追上会影响格局;
  • NAND/SSD/HDD:温层冷层需求,AI Agent和RAG会带动企业级SSD和大容量HDD;
  • A股标的
  • 技术收租(澜起科技):做DDR5接口芯片,周期影响小;
  • 模组品牌(江波龙、佰维存储):受益涨价但有库存风险;
  • 分销(香农芯创):上行期弹性大,退潮快;
  • 国产替代(长鑫、长江存储):高端HBM有差距,中低端能吃外溢。

关键要跟踪:云厂商AI预算、HBM长协、三星良率、算法效率突破等指标。

5. 存储是周期还是成长?——周期成长股,机会在切换时

不能简单归为周期或成长:

  • 多头理由:HBM供给瓶颈难解决(晶圆、封装、认证要时间),AI推理扩散到更多存储层,长协锁产能减少波动;
  • 空头理由:历史上“这次不一样”常被打脸,算法效率提升可能降需求,云厂商CAPEX有限,供给会增加;

结论是“周期成长股”——AI拉长了景气周期,但仍受供给和算法影响。最好的机会是市场还当它周期股,但基本面已显成长特征时;最危险是大家都当成长股,而供给、库存已转向时。

最后一句话总结

存储不是AI的边角料,是AI成为生产力的关键瓶颈;投资要赚的不是“涨价”,而是理解这轮周期被AI拉长了多久,市场当前给了几年的定价。