第一财经

有模型厂商CPU需求提高5倍!计算设备迎来非人类用户:智能体

该文章尚未提供 Español 解读,以下为中文版内容。

核心内容总结

智能体(可理解为能自动帮人做事的AI助手)正在成为硬件行业的“新用户”,这引发了硬件市场的大变化:CPU需求突然爆发,数据中心里CPU重新回到核心位置;芯片厂商们开始抢着研发针对智能体的专用硬件(比如英伟达秋季要出的PC芯片);边缘设备(手机、手表等)也在解决内存不足、续航平衡等问题;未来PC可能分成“便携型”和“智能体专用型”两种,AI服务将跨设备协同。

1. CPU为啥突然“香”了?需求井喷背后的秘密

以前大家觉得AI只需要GPU(图形处理器),但智能体的出现让CPU(中央处理器)成了香饽饽。原因很简单:

  • 智能体的“管家”工作靠CPU:智能体要处理很多杂事,比如记住你之前说的话(管理上下文)、调度多个小任务(像自动回消息、整理文件),这些都需要CPU来指挥。
  • 需求涨得吓人:国内某大模型公司说,去年到现在CPU需求涨了5倍;Arm的CEO甚至说,CPU需求增长比预想快,倍数可能是4、6或8倍,供应商都供不上货。
  • 小任务更依赖CPU:很多自动化任务不需要强大的GPU,反而需要CPU能同时跑很多小脚本(比如批量处理邮件),这种“高并发”能力是CPU的强项。

2. 数据中心的C位变了!CPU重新站回舞台中央

以前数据中心里GPU是绝对主角(比如英伟达股价因为ChatGPT暴涨),但现在CPU厂商的股价也开始疯涨:AMD、英特尔、Arm今年股价都翻了倍。

  • 比例要变天:业内开始讨论,数据中心里CPU和GPU的比例可能从以前的1:8(1个CPU配8个GPU)往1:1靠近。因为智能体的多数任务都是CPU在执行,GPU只负责部分复杂计算。
  • 资本市场用脚投票:GPU厂商的股价涨在ChatGPT刚出来时,而CPU厂商的股价是今年才猛涨,说明市场已经看到智能体带来的CPU需求爆发。

3. 智能体需要什么样的CPU?核数多、能效高是关键

智能体用的CPU和我们平时电脑的不一样,有两个核心要求:

  • 核数要多:比如Arm和英伟达合作的新芯片有20个核(CPU里的小计算单元),因为要同时跑很多智能体。英特尔的芯片甚至能在一个核心上跑3-4个简单智能体(比如帮你订咖啡的小助手)。
  • 能效比要高:就是“每度电能干多少活”。智能体要一直运行,省电很重要。比如新芯片用“统一内存”技术,让CPU和GPU共用一个大内存池,不用来回传数据,既快又省电。

4. 边缘设备的麻烦:内存不够、续航难平衡

手机、手表这些小设备要跑智能体,有两个大难题:

  • 内存不够用:智能体要记住多轮对话(比如你和它聊了半小时,它得记住所有内容),但手机内存有限,容易“记不住”(叫上下文溢出)。厂商用压缩技术解决:比如英特尔的QAT技术能把AI的临时记忆压缩一半,省内存。
  • 续航和响应难平衡:智能体要24小时待命,但手机不能总充电。传统架构不行,得重新设计系统,比如用高通的工具链,让设备既能省电又能随时被唤醒。

5. 智能体专用硬件来了!PC也要为AI服务

现在已经出现专门给智能体用的硬件:

  • 英伟达的新PC芯片:秋季要上市的RTX Spark芯片,搭载20个Arm核,能7×24小时跑智能体,模型本地运行(隐私不泄露),不用额外付算力费。联想、华硕都会出这类电脑。
  • PC分成两种:未来PC可能分两类——一类是便携型(像大号手机,主打轻薄);另一类是智能体专用型(留家里一直开着,跑AI任务)。
  • 跨设备协同:以后AI不再绑定某个设备,比如你用手表问AI问题,它可能调用家里的PC算力,再把结果传回手表,服务更灵活。

总之,智能体的出现正在彻底改变硬件行业的玩法,CPU重新崛起,专用硬件成新赛道,普通人未来用AI的方式也会大不一样。