虎嗅

梁文锋向左,杨植麟向右

核心内容总结

2026年,大模型圈的Kimi(月之暗面)和DeepSeek从“各走各路”变得越来越像——都开始融资、技术路线重叠、管理风格都是低调的技术派;但融资后又将走向分岔:Kimi把钱投到产品和用户端,拼命证明模型能赚钱;DeepSeek则把钱砸向算力基础设施,确保自己的技术领先地位不被超越。

详细拆解

1. 曾经“南辕北辙”,现在越来越像“双胞胎”

两年前,这两家公司完全是两个画风:

  • Kimi:明星创业公司,融资频繁,天天想着把模型变成能用的产品(比如长文本处理、搜索、Agent助手),扩张速度快;
  • DeepSeek:像个“技术宅”,老板梁文锋很少露面融资,大家只记得它的模型能力(比如V2、R1这些版本),更像研究机构。

但2026年变了:

  • 都开始融资:Kimi半年融了好几轮,估值涨了5倍;以前“不差钱”的DeepSeek也终于启动融资;
  • 技术路线重叠:Kimi开始重视底层模型能力,DeepSeek也学Kimi做长文本、Coding、Agent这些产品方向;甚至连招聘都撞车——都在招“后勤系统”(Harness岗位,管模型训练、运行、资源调度的基础设施);
  • 管理风格一样:创始人杨植麟(Kimi)和梁文锋(DeepSeek)都是技术出身,不爱抛头露面,更愿意聊算法和模型,都被贴上“技术理想主义”标签。

简单说:以前一个搞“产品落地”,一个搞“技术研发”,现在都往中间靠了。

2. DeepSeek为啥突然“找钱”?不是没钱,是要解决“大麻烦”

DeepSeek背后有幻方量化(有钱的投资机构),以前从不愁钱,为啥现在融资?核心是两个问题:

  • 抢人才:大模型行业现在最卷的是“挖人”——OpenAI、Meta和国内头部公司都在抢顶级研究员和工程师。融资能给核心团队发更多股票期权,留住人;
  • 搞“基建”:模型越来越大,需要的GPU算力越来越多(比如训练下一代模型可能要上万个GPU)。以前只关心“模型能不能做出来”,现在得关心“模型怎么跑得稳、成本低”:
  • 招“数据中心高级交付经理”:管GPU集群的建设、维护,比如怎么让一万个GPU同时工作不卡壳;
  • 扩张Harness团队:这个团队管模型训练和推理的“后勤”,比如调度资源(哪个任务用多少GPU)、提升算力利用率(别让GPU空转)。

这些基建直接决定了DeepSeek能不能继续做更牛的模型——就像盖大楼,地基不稳,楼再高也会塌。

3. Kimi融资后:眼里只有“赚钱”二字

Kimi今年融资三次,估值涨5倍,核心目标很明确:证明模型能变现

  • 商业化有了突破口:年初的OpenClaw产品带来了收入增长,让Kimi第一次看到“模型能赚钱”的希望;
  • 模型为产品服务:不管是Agent助手、Coding工具还是拓展海外市场,都是为了把模型能力变成真金白银;
  • 市场关心啥? 大家问的都是:收入能不能持续涨?Agent能不能让用户愿意付费?海外市场能不能复制国内成功?

简单说:Kimi现在要向投资人证明——我的模型不是“花瓶”,能赚钱!

4. 同样是融资,钱花的地方“天差地别”

虽然都融了钱,但两家的“花钱方向”完全相反:

  • Kimi的钱→用户和产品:比如做更好的Agent功能吸引付费用户,拓展海外市场拉新,或者优化产品体验让更多人愿意掏钱;
  • DeepSeek的钱→算力和基建:买更多GPU,建更大的数据中心,优化Harness系统让模型训练更快、运行更稳。

为啥差这么多?因为核心焦虑不同:

  • Kimi焦虑:“我能不能持续赚钱?”(毕竟融资多了要给投资人交代);
  • DeepSeek焦虑:“我能不能保持技术领先?”(它的核心竞争力就是模型能力,一旦落后就没价值了)。

5. 未来分岔:一个“卖产品”,一个“做技术”

这两家公司的未来方向会越来越不一样:

  • Kimi:会变成“产品公司”——像卖软件一样卖模型服务,比如给企业提供Agent助手,给个人用户卖Coding工具,靠用户付费活下去;
  • DeepSeek:会变成“技术基础设施公司”——自己做最牛的模型,或者把模型能力卖给其他公司(比如给互联网公司提供底层模型支持),靠技术领先吃饭。

总结:Kimi要当“赚钱的商人”,DeepSeek要当“技术的学霸”——这就是它们融资后的最终分岔路。