第一财经

GLM-5引爆行情!智谱大涨28%,春节前国产大模型集体冲刺

该文章尚未提供 Русский 解读,以下为中文版内容。

核心内容总结

智谱开源上线GLM-5大模型后,资本市场反应热烈(股价涨28.68%);该模型强化编程与智能体能力,达到开源领域最优水平;近期多家AI厂商扎堆更新模型(如阿里、MiniMax等),行业整体向"更实用、低成本、强智能体"的方向进化。

详细拆解解读

#### 1. 智谱GLM-5:开源模型里的"全能选手"

GLM-5的火不是偶然,它在两个核心能力上做到了开源圈顶尖:

  • 编程能力逼近"行业标杆":能搞定复杂系统工程(比如写整个APP的框架),用起来和国外高端模型Claude Opus 4.5差不多,但它是免费开源的。
  • 智能体能力开源第一:能像人一样完成长程任务(比如从需求分析到写代码再到测试的全流程)。

技术上的升级也很实在:

  • 学的"知识"更多了:预训练数据从23T涨到28.5T(相当于把图书馆藏书量增加了24%);
  • 更会"学习进步":用了异步智能体算法,能从长期互动中越来越聪明(比如你教它一次怎么整理报告,下次它会做得更好);
  • 更便宜好用:集成DeepSeek的稀疏注意力技术——不用逐字看长文本,只抓重点,部署成本降了但效果没变(比如以前跑模型要10台服务器,现在可能只要5台)。

#### 2. GLM-5能帮你干啥?像雇了个"智能实习生"

这个模型不是"花架子",有很多落地场景:

  • OpenClaw里的"免费帮手":把GLM-5接入开源智能体系统OpenClaw后,它能当你的实习生:每天定时搜行业资讯整理成文档、自动发社交媒体推文、帮你写代码片段,甚至处理简单的办公任务,还不用发工资。
  • 企业办公"一键搞定":智谱出的AutoGLM版本支持飞书机器人一键配置——企业员工在飞书里就能直接调用这个智能体,比如生成会议纪要、处理报销单,不用再找IT部门折腾技术设置。
  • 全流程开发工具:能端到端做应用开发(从需求到上线)、写完整的代码项目,甚至直接输出Word/Excel文档,节省工程师和办公人员的时间。

#### 3. AI圈的"春节档":多家厂商扎堆更新抢用户

最近AI模型厂商像赶电影春节档一样,集中发布新版本:

  • 阶跃星辰出了Step3.5 Flash(强调速度快);
  • 阿里更新Qwen3-Coder-Next(编程能力升级);
  • MiniMax推了M2.5(优化推理效率)。

为啥扎堆?因为春节后是企业开工、开发者活跃的高峰期,大家都想靠新版本抢市场份额——就像餐馆在饭点推出新菜吸引顾客一样,AI厂商也想抓住这个节点让更多用户用自己的模型。

#### 4. 大模型行业新趋势:从"会干活"到"干复杂活还便宜"

新闻里提到2026年学界业界的共识:大模型从基础能力(写短代码、文案)进化到复杂任务(做工程、全流程项目)。现在行业还有几个明显趋势:

  • 成本大降:用MoE架构、FP8精度等技术后,模型单次调用成本从"元级"降到"分厘级"——以前用一次要几块钱,现在只要几分甚至几厘,小公司也用得起。
  • 长文本更能打:比如DeepSeek最新版本支持100万Token的上下文(相当于能一次性读百万字的小说或合同),不用分段处理,理解更连贯。
  • 多模态+强推理:阿里Qwen3-Max-Thinking、Kimi K2.5都强调能同时处理文字/图片/语音,还更会"思考"(比如解决数学题、逻辑题)。

#### 5. DeepSeek:隐形"技术大佬",性价比和长文本双突破

DeepSeek在这次新闻里存在感很强:

  • 它的稀疏注意力技术被GLM-5集成,帮GLM-5降成本;
  • 自己最新版本支持100万Token上下文(去年8月才128K,翻了8倍)——意味着能一次性处理更长的文档,比如整本书或大型合同,不用拆分。
  • 2025年春节靠R1模型出圈,重新定义了国产开源模型的性价比(好用还便宜),现在行业都盯着它的新技术进展。

这说明DeepSeek在"让大模型更实用、更便宜"这件事上,是行业的重要推动者。

```