第一财经

蚂蚁灵波一周“四连发”,“卷”向具身智能基座开源

该文章尚未提供 日本語 解读,以下为中文版内容。

核心内容总结

蚂蚁集团旗下灵波科技一周内连续开源4个具身智能大模型(LingBot-Depth、LingBot-VLA、LingBot-World、LingBot-VA),覆盖机器人“感知、思考、训练、行动”全环节。这波操作不仅是技术输出,更是通过开源策略抢滩具身智能(能像人一样感知、行动的智能机器人)的行业话语权——既降低开发者落地门槛,也扩大自身在基础技术领域的影响力,推动具身智能从实验室走向规模化应用,加速通用人工智能(AGI)到来。

详细拆解解读

#### 1. 四个开源模型各有绝活,覆盖机器人“看、想、练、做”全流程

这四个模型不是重复的“凑数款”,而是分工明确,解决机器人落地的不同痛点:

  • LingBot-Depth(让机器人“看清楚”):和奥比中光合作,解决机器人“视觉盲区”——比如透明杯子、反光金属这类难识别的东西,现在能精准抓取。相当于给机器人装了一副“高清防眩光眼镜”。
  • LingBot-VLA(机器人的“通用大脑”):这是蚂蚁第一个具身智能“基座模型”,能实现“一脑多机”——比如同一个模型,既能控制扫地机器人,也能操控工业机械臂,不用为每个机器人单独训练模型。解决了行业“泛化性差”的问题(以前模型只能用在特定机器人上,成本高)。
  • LingBot-World(机器人的“虚拟训练场”):给机器人建了一个高保真的虚拟世界,像游戏一样可交互,机器人能在里面反复训练(比如练习开门、搬东西),不用真的弄坏实物。蚂蚁说它能对标谷歌的Genie 3,相当于给机器人提供了一个“低成本健身房”。
  • LingBot-VA(让机器人“边想边做”):把视频生成和机器人控制结合,机器人能先推演“下一步会发生啥”,再输出动作——比如拿杯子时,会先想“杯子会不会滑”,再调整抓握力度。相当于给机器人加了“预判能力”。

#### 2. 一周四连发背后:蚂蚁想用开源“圈地”具身智能赛道

为啥蚂蚁要在一周内密集开源四个模型?核心是用开源建立行业影响力

  • 对标阿里云的策略:阿里云在通用大模型领域靠开源(比如通义千问)积累了大量开发者,蚂蚁现在把这套玩法复制到具身智能赛道。
  • 从“做产品”到“做基座”的野心:灵波科技一开始说要做“领先机器人产品”,现在转向做基础技术(模型、工具链)——相当于从“卖手机”变成“卖安卓系统”,让更多开发者用自己的技术,从而掌握行业标准。
  • 开源的“护城河”:开源不是免费送,而是让更多人依赖你的技术。比如开发者用了蚂蚁的模型,后续优化、商业化可能都会和蚂蚁绑定,慢慢形成蚂蚁主导的生态。

#### 3. 不止开源模型,还送“全套工具箱”:帮开发者省钱省时间

蚂蚁这次开源不只是放模型权重(相当于模型的“大脑参数”),还同步开放了全套代码库

  • 包含数据处理、高效微调、自动化评估等工具:比如开发者想训练一个针对餐厅机器人的模型,不用从头写代码,直接用蚂蚁的工具链就能快速调整,训练周期和成本能降下来。
  • 降低落地门槛:以前开发者要花大量算力和时间搞训练,现在有了现成工具,小团队也能玩得起具身智能。相当于蚂蚁给开发者“搭好了脚手架”,让他们更快把技术变成产品。

#### 4. 具身智能落地难在哪?蚂蚁这波操作能破啥局?

具身智能现在最大的问题是“从实验室到产业”的鸿沟:

  • 痛点1:泛化性差:以前一个模型只能用在特定机器人上,成本高。LingBot-VLA解决了这个问题,“一脑多机”让规模化落地成为可能。
  • 痛点2:训练成本高:机器人在真实世界训练容易坏东西,成本高。LingBot-World的虚拟训练场能大幅降低训练成本。
  • 痛点3:技术门槛高:小团队没能力搞复杂模型。蚂蚁的开源工具链把门槛拉低,让更多玩家进入赛道,加速技术迭代。
  • 蚂蚁的目标:CEO朱兴说“具身智能要大规模应用,依赖高效基座模型”,这次开源就是想推动行业从“单点技术突破”到“规模化落地”,最终加速AGI(通用人工智能)到来。

#### 5. 行业竞争升级:从“技术卡位”到“全栈生态”比拼

这波操作也预示着具身智能赛道的竞争方向变了:

  • 以前拼技术:谁的模型准确率高、反应快。
  • 现在拼生态:谁能提供从模型、工具链到训练环境的全栈服务,谁能吸引更多开发者和企业加入自己的生态。蚂蚁的开源策略就是在布局生态——你用我的模型,我给你工具,我们一起把蛋糕做大。
  • 大厂入局加速进程:蚂蚁、谷歌、阿里等大厂都在布局具身智能,他们的技术和资源能快速推动行业从实验室走向实际应用(比如工业、家政、医疗等场景)。但同时,竞争也会更激烈,不仅要比技术,还要比生态协同能力。

总结

蚂蚁这波“一周四连发”的开源操作,本质是在具身智能赛道“抢跑”——通过开放核心技术和工具链,吸引开发者、建立生态,最终成为赛道的“规则制定者”。对行业来说,这能加速具身智能的规模化落地;对蚂蚁来说,这是从“产品玩家”到“生态玩家”的关键一步,野心不小。而具身智能的未来,也会从“技术单挑”变成“全栈生态团战”。