虎嗅

融了500亿，梁文锋开始大搞基建了

2026-06-09 阅读原文

核心内容总结

DeepSeek近期估值飙至3500亿元，首次引入腾讯、阿里等外部资本，正把融资的钱狠狠砸向两大方向：自建超大规模算力基建（盖机房、搞运维）和上层应用产品化（做代码智能体工具）。从招聘IDC设计工程师、草原机房运维，到组建对标Claude Code的代码团队，这些动作暴露了它不想只做AI模型公司，而是要从底层算力到应用生态全链条布局的野心。

一、融资估值3500亿：钱从哪来，要花去哪？

DeepSeek之前靠幻方量化的自有资金活着，几乎没外部投资。但最近首次向资本敞开大门，估值直接冲到3500亿元（约480亿美元），潜在投资方包括腾讯、阿里这些巨头。这笔钱到账后，怎么花？招聘岗位给出了答案：一半砸算力基建，一半砸产品化。

算力基建：招IDC设计工程师、草原机房运维，要自己盖超大规模机房；
产品化：招代码智能体团队，做对标Claude Code的工具，抢开发者市场。

简单说，就是“先把地基打牢（算力），再把房子盖好（应用）”。

二、自建超大规模机房：为啥模型公司要抢云厂商的活？

这次招聘最意外的是“IDC设计规划工程师”——这个岗位是机房建设的核心负责人，从选址到画图到落地全管。这说明DeepSeek不再满足于租别人的机房，要自己动手盖楼，而且规模直奔GW级（1GW=1000MW，相当于能支撑上万个GPU同时跑，是超大型智算中心的级别）。

为啥要自己建？

租的不够用：训练万亿参数的大模型需要巨量算力，租机房不仅贵，还可能被卡脖子（比如GPU资源紧张时优先给云厂商自己用）；
成本更低：自建机房可以选像乌兰察布这样的地方——草原气候冷，服务器散热不用花太多电，PUE（能耗效率，越低越省钱）能做到1.2左右（比一线城市机房低20%以上）；
控制力强：自己的机房想怎么用就怎么用，不用看别人脸色，能保障大模型训练和未来推理服务的稳定性。

现在乌兰察布的机房已经在招运维和交付人员，说明机房快建好了，马上要投入使用。

三、上层应用：组建“代码特工队”，对标Claude Code抢市场

如果说基建是“往下扎”，那代码智能体就是“往上探”。DeepSeek新招了“Agent Harness产品经理”和研发工程师，还让资深研究员陈德里公开招人“从零做Code Harness”，直接对标Anthropic的Claude Code（一款超火的AI编程工具）。

这步棋的目的很明确：

模型趋同下找差异化：现在大模型的基础能力越来越像，谁能把模型变成好用的工具，谁就能黏住用户；
抢开发者生态：Code Harness是给程序员用的AI工具，能帮写代码、查bug，就像GitHub Copilot一样。抓住开发者，就能让他们用DeepSeek的模型做更多应用，形成生态；
商业化变现：工具类产品更容易收费，比如按使用次数或订阅制，比单纯卖模型API更稳定。

四、左手基建右手应用：梁文锋的全链条野心

DeepSeek的掌舵人梁文锋一直很低调，但这次招聘把他的野心摊开了：不做“单一环节玩家”，要做从算力到应用的全链条巨头。

左手算力基建：解决“卡脖子”问题，保障自己有足够的“燃料”（算力）训练大模型；
右手应用产品：把模型能力转化为用户能直接用的工具，实现商业化变现；
长远目标：构建一个“算力+模型+应用”的闭环生态，就像OpenAI（模型）+微软Azure（算力）+Copilot（应用）的组合，但DeepSeek要自己全包。

这种“重资产+产品化”的路线虽然烧钱，但一旦做成，就能在AI赛道上建立起别人难以超越的壁垒——毕竟不是谁都能拿出几百亿盖机房，也不是谁都能把模型变成好用的工具。

总结：DeepSeek的“硬核下注”

DeepSeek用3500亿估值的底气，正在做一件冒险但必要的事：把命运掌握在自己手里。一边自建算力底座，避免被算力卡脖子；一边发力应用层，抢商业化蛋糕。这步棋走对了，它可能成为国内AI赛道的“全栈玩家”；走不好，也会烧光钱，但显然梁文锋赌的是未来——AI的竞争，最终还是算力和生态的竞争。