虎嗅

Midjourney即将发布首款AI硬件产品

该文章尚未提供 العربية 解读,以下为中文版内容。

核心内容总结

AI图像生成巨头Midjourney(靠订阅年入5亿、无VC投资、团队不到100人)筹备近两年后,终于要发布硬件产品了。背后是创始人的硬件基因、生成式AI向端侧迁移的趋势,以及对3D内容消费入口的掌控欲。产品大概率是名为“Orb”的空间计算设备,目标让用户沉浸到自己生成的3D世界,但也面临硬件赛道的供应链、品控等多重挑战。

一、好好的软件公司,为啥非要碰硬件?

Midjourney放着“躺着赚钱”的订阅生意不做,转做硬件,不是脑子发热——背后有三个硬逻辑:

1. AI趋势逼的:现在生成式AI正从“云端大服务器算”转向“本地设备直接跑”(比如AI手机、AI电脑),2026年是端侧AI爆发的关键年,不跟上就会掉队。

2. 静态图像到顶了:Midjourney已经能生成超逼真的图片,但再往上走就是3D世界(比如多人实时共创虚拟场景)。可用户用啥设备“走进”这些3D世界?现有VR头显生态太乱,自己做硬件才能让用户真正用上他们的3D内容。

3. 不想被别人卡脖子:2023年他们用谷歌TPU训练模型,后来后悔了——要是早用英伟达GPU,进度可能更快。这次做硬件,就是想掌握自己的“工具链”,不依赖别人。

二、做硬件,Midjourney有“家底”吗?

别看Midjourney是软件公司,团队的硬件基因其实很足:

  • 创始人本身就是硬件老兵:David Holz 2010年联合创办过手势追踪公司Leap Motion(后来被收购),懂硬件技术和产品逻辑。
  • 挖来的核心人物是“大神”:2024年初挖了前苹果Vision Pro硬件工程经理Ahmad Abbas,他不仅参与过Vision Pro研发,还在马斯克的Neuralink做过硬件设计,甚至早年也在Leap Motion待过——等于把“苹果+脑机接口+手势追踪”的经验都带过来了。
  • 早就布局3D方向:Holz说过Midjourney的模型是“慢游戏引擎”,未来要做到每秒60帧生成3D世界,硬件研发一直围绕3D数据捕捉,不是临时起意。

三、传说中的“Orb”,到底是个啥?

关于Orb的细节,Midjourney没说透,但从现有信息能猜个大概:

  • 形态:名字叫Orb(球),所以大概率是球形或圆形设计,不是VR头显(官方明确说“不是吊坠式”),更像一个沉浸式空间显示装置。
  • 功能:核心是“AI原生空间计算”——让用户能“走进”自己用提示词生成的3D世界,或者用自然手势和AI一起创作3D内容(比如挥挥手就能调整虚拟场景的光影)。
  • 定位:先服务自己的核心用户——专业设计师、艺术家、极客发烧友,不会一开始就做大众消费品。而且Holz说他们同时在做3-4个硬件项目,说明不止Orb这一款。

四、硬件这条路,Midjourney能走通吗?

做硬件比做软件难多了,Midjourney要过几道坎:

  • 挑战:硬件需要供应链管理、品控、渠道销售、售后服务——这些都是Midjourney以前没碰过的。比如找工厂生产,要是质量出问题,砸的是品牌;卖出去后用户有问题,得有人修,这些对“轻团队”来说都是考验。
  • 机会:AI硬件的成功关键是“AI能力和硬件形态的结合”。Midjourney有两大优势:一是自己的3D内容生态(用户本来就用它生成内容),二是社区和美学品位(用户认它的设计感)。如果Orb能让用户更方便地用Midjourney的内容,就有机会成。

总的来说,Midjourney做硬件,是想从“文字变图片”的第一步,走到“图片变空间”的第二步——能不能成,就看它能不能把软件的优势嫁接到硬件上了。

五、这步棋,会影响AI硬件行业吗?

Midjourney的入场,可能会改变AI硬件的玩法:

  • 定义AI原生内容的消费方式:就像iPhone定义了触控交互,Midjourney或许想让Orb成为“看AI 3D内容的标准设备”。
  • 给其他AI公司打样:如果Midjourney成功了,其他AI软件公司(比如生成视频、音频的)可能也会跟着做硬件,把自己的内容和设备绑定。
  • 倒逼大厂竞争:谷歌、Meta都在做AI终端,Midjourney带着自己的内容和社区入场,会让这个赛道更卷,但对用户来说,可能会有更酷的产品出现。

总之,Midjourney做硬件不是小打小闹,是想在AI的下一个阶段(空间计算)占个坑——至于能不能成,我们等它的Orb出来看看就知道了。