虎嗅

融了500亿,梁文锋开始大搞基建了

核心内容总结

DeepSeek近期估值飙至3500亿元,首次引入腾讯、阿里等外部资本,正把融资的钱狠狠砸向两大方向:自建超大规模算力基建(盖机房、搞运维)和上层应用产品化(做代码智能体工具)。从招聘IDC设计工程师、草原机房运维,到组建对标Claude Code的代码团队,这些动作暴露了它不想只做AI模型公司,而是要从底层算力到应用生态全链条布局的野心。

一、融资估值3500亿:钱从哪来,要花去哪?

DeepSeek之前靠幻方量化的自有资金活着,几乎没外部投资。但最近首次向资本敞开大门,估值直接冲到3500亿元(约480亿美元),潜在投资方包括腾讯、阿里这些巨头。这笔钱到账后,怎么花?招聘岗位给出了答案:一半砸算力基建,一半砸产品化

  • 算力基建:招IDC设计工程师、草原机房运维,要自己盖超大规模机房;
  • 产品化:招代码智能体团队,做对标Claude Code的工具,抢开发者市场。

简单说,就是“先把地基打牢(算力),再把房子盖好(应用)”。

二、自建超大规模机房:为啥模型公司要抢云厂商的活?

这次招聘最意外的是“IDC设计规划工程师”——这个岗位是机房建设的核心负责人,从选址到画图到落地全管。这说明DeepSeek不再满足于租别人的机房,要自己动手盖楼,而且规模直奔GW级(1GW=1000MW,相当于能支撑上万个GPU同时跑,是超大型智算中心的级别)。

为啥要自己建?

  • 租的不够用:训练万亿参数的大模型需要巨量算力,租机房不仅贵,还可能被卡脖子(比如GPU资源紧张时优先给云厂商自己用);
  • 成本更低:自建机房可以选像乌兰察布这样的地方——草原气候冷,服务器散热不用花太多电,PUE(能耗效率,越低越省钱)能做到1.2左右(比一线城市机房低20%以上);
  • 控制力强:自己的机房想怎么用就怎么用,不用看别人脸色,能保障大模型训练和未来推理服务的稳定性。

现在乌兰察布的机房已经在招运维和交付人员,说明机房快建好了,马上要投入使用。

三、上层应用:组建“代码特工队”,对标Claude Code抢市场

如果说基建是“往下扎”,那代码智能体就是“往上探”。DeepSeek新招了“Agent Harness产品经理”和研发工程师,还让资深研究员陈德里公开招人“从零做Code Harness”,直接对标Anthropic的Claude Code(一款超火的AI编程工具)。

这步棋的目的很明确:

  • 模型趋同下找差异化:现在大模型的基础能力越来越像,谁能把模型变成好用的工具,谁就能黏住用户;
  • 抢开发者生态:Code Harness是给程序员用的AI工具,能帮写代码、查bug,就像GitHub Copilot一样。抓住开发者,就能让他们用DeepSeek的模型做更多应用,形成生态;
  • 商业化变现:工具类产品更容易收费,比如按使用次数或订阅制,比单纯卖模型API更稳定。

四、左手基建右手应用:梁文锋的全链条野心

DeepSeek的掌舵人梁文锋一直很低调,但这次招聘把他的野心摊开了:不做“单一环节玩家”,要做从算力到应用的全链条巨头

  • 左手算力基建:解决“卡脖子”问题,保障自己有足够的“燃料”(算力)训练大模型;
  • 右手应用产品:把模型能力转化为用户能直接用的工具,实现商业化变现;
  • 长远目标:构建一个“算力+模型+应用”的闭环生态,就像OpenAI(模型)+微软Azure(算力)+Copilot(应用)的组合,但DeepSeek要自己全包。

这种“重资产+产品化”的路线虽然烧钱,但一旦做成,就能在AI赛道上建立起别人难以超越的壁垒——毕竟不是谁都能拿出几百亿盖机房,也不是谁都能把模型变成好用的工具。

总结:DeepSeek的“硬核下注”

DeepSeek用3500亿估值的底气,正在做一件冒险但必要的事:把命运掌握在自己手里。一边自建算力底座,避免被算力卡脖子;一边发力应用层,抢商业化蛋糕。这步棋走对了,它可能成为国内AI赛道的“全栈玩家”;走不好,也会烧光钱,但显然梁文锋赌的是未来——AI的竞争,最终还是算力和生态的竞争。