虎嗅

为什么说“永远缺存储”：AI 时代的存储叙事与投资逻辑

2026-06-10 阅读原文

该文章尚未提供 العربية 解读，以下为中文版内容。

核心内容总结

这篇文章围绕AI时代的存储需求展开，指出存储是AI从演示走向实用的关键瓶颈——它不是单一硬盘或内存，而是分层的系统；需求因模型规模、对话上下文、用户并发等多因素呈倍数增长，压缩技术反而可能因场景扩展增加总需求；这轮存储周期不同于传统PC/手机周期，成为AI基础设施，高端产品更稀缺；投资需区分不同标的，跟踪关键指标，存储是“周期成长股”（被AI拉长景气周期，但仍受供给和算法影响）。

详细拆解解读

1. AI为啥最后都绕到存储？——它是AI的“记忆+工作台+仓库”

以前讨论AI基建先看GPU、电力，但往深了拆，AI的所有能力都得落在存储上：数据要存下来、搬过去、读出来、再写回去。AI存储不是简单的硬盘或内存条，而是分四层“金字塔”：

最热层（HBM）：GPU旁边的超高速内存，像做题时手边的草稿纸，负责模型运算、临时记对话内容（比如你问AI“昨天说的电影”，它得记住之前的对话，这叫KV cache），速度要极快才能跟上GPU；
热层（DDR5等）：CPU用的内存，像工作备忘录，负责调度任务、处理长对话（比如128K字的上下文）；
温层（企业级SSD）：常用文件柜，存长期对话记录、AI检索用的向量数据库、训练数据；
冷层（HDD/对象存储）：大仓库，存训练语料、日志、图片视频等多模态数据。

简单说：算力是发动机，存储就是油箱+输油管+仓库+工作台，没它GPU再贵也只能空转。

2. AI存储需求为啥“越用越多”？——多个因素乘起来就爆炸了

AI存储需求不是“用户多一点，硬盘多一点”的线性增长，而是多个变量相乘：

模型变大（从700亿参数到几百亿/多模型协同）；
对话上下文变长（从8K字到100万字）；
用户变多（从开发者到企业员工、客服、AI助手）；
Agent多步骤（一次请求要调用搜索、数据库、工具链）；
检索数据变多（AI查向量库、文档库、历史日志）。

举个例子：一个700亿参数的模型，128K字的一条对话就要40GB缓存，1000条并发就是40TB——这还只是临时缓存，没算模型本身和其他数据。

有人说压缩技术能减少需求？短期是，但长期像“燃油车省油反而开更远”（杰文斯悖论）：压缩4倍，产品经理就把上下文拉长4倍；推理成本降了，企业会让AI做更多事；过去不经济的长文档分析现在能用了，总需求反而涨了。

3. 这轮存储周期和以前不一样？——从消费电子到AI基础设施

传统存储是典型周期股：价格涨→扩产→过剩→降价→减产→循环。但AI改变了三点：

需求变了：从PC/手机换机（弹性小）变成AI数据中心基建（云厂商提前多年锁产能，像建电网一样）；
HBM不是普通内存：难在先进封装、良率、和GPU绑定，客户要提前认证签长协，高端HBM占了产能，普通内存也会紧；
NAND被激活：AI推理需要企业级SSD存向量库、RAG数据，多模态数据湖需要HDD，需求不再过剩。

所以这轮是HBM、服务器DRAM、SSD、HDD一起涨，不是单一产品。

4. 投资存储该怎么选？——不同标的吃不同的钱

存储链不能混着看，分几类：

全球原厂（SK海力士、美光、三星）：核心HBM供给方，SK海力士先发优势强，美光是美股直接标的，三星良率追上会影响格局；
NAND/SSD/HDD：温层冷层需求，AI Agent和RAG会带动企业级SSD和大容量HDD；
A股标的：
技术收租（澜起科技）：做DDR5接口芯片，周期影响小；
模组品牌（江波龙、佰维存储）：受益涨价但有库存风险；
分销（香农芯创）：上行期弹性大，退潮快；
国产替代（长鑫、长江存储）：高端HBM有差距，中低端能吃外溢。

关键要跟踪：云厂商AI预算、HBM长协、三星良率、算法效率突破等指标。

5. 存储是周期还是成长？——周期成长股，机会在切换时

不能简单归为周期或成长：

多头理由：HBM供给瓶颈难解决（晶圆、封装、认证要时间），AI推理扩散到更多存储层，长协锁产能减少波动；
空头理由：历史上“这次不一样”常被打脸，算法效率提升可能降需求，云厂商CAPEX有限，供给会增加；

结论是“周期成长股”——AI拉长了景气周期，但仍受供给和算法影响。最好的机会是市场还当它周期股，但基本面已显成长特征时；最危险是大家都当成长股，而供给、库存已转向时。

最后一句话总结

存储不是AI的边角料，是AI成为生产力的关键瓶颈；投资要赚的不是“涨价”，而是理解这轮周期被AI拉长了多久，市场当前给了几年的定价。