第一财经

国产大模型密集发布,“春节AI竞赛”提前开幕

该文章尚未提供 한국어 解读,以下为中文版内容。

核心内容总结

春节前国产大模型厂商密集更新模型(如DeepSeek OCR2、Kimi K2.5、阿里千问推理模型等),这些动作标志着行业从“参数竞赛”转向“工程化成熟”:模型更注重实用优化而非炫技,产品从实验室Demo走向规模化服务,生态从单点突破转向协同。同时,多模态(能处理文字/图片/视频)和推理能力(像人一样思考解决问题)成为主攻方向,性价比取代“跑分”成企业选择核心,未来通用大模型巨头强者恒强,中小玩家机会在细分行业,而灵活推理、稳定多模态输出仍是待突破的痛点。

一、节前扎堆更新:大模型行业要“成年”了?

以前大模型厂商爱比谁的参数多(就像手机比像素),现在突然转向“务实”——节前密集更新不是为了抢热搜,而是行业进入“工程化成熟期”的信号。行业人士说,这意味着三个变化:

1. 从“炫技”到“优化”:不再拼参数大小,而是把模型做得更高效(比如DeepSeek OCR2用创新方法让模型理解图片逻辑,而非机械扫描);

2. 从“演示”到“服务”:以前模型只在实验室里好用,现在要能真正服务成千上万用户(比如Kimi K2.5支持规模化的Agent任务、批量PDF处理);

3. 从“单打独斗”到“协同”:不再只靠某一项技术突破,而是生态里的各个环节(比如模型、数据、应用)一起配合。

简单说,大模型终于从“实验室玩具”变成“能赚钱的工具”了。

二、多模态+推理:大模型正在学“看懂”和“思考”

现在行业里有个共识:未来大模型得像人一样——既能“看”(图片/视频)又能“想”(解决问题)。这次更新的模型都瞄准了这两个方向:

  • 多模态:让模型“看懂”世界:Kimi K2.5能同时处理文字、图片、视频,比如你发张表格图片,它能直接分析内容;DeepSeek OCR2更厉害,不是从左到右扫图片,而是像人一样先看重要部分(比如海报的标题、价格),再理解整体逻辑,处理复杂布局的图片比传统模型好得多。
  • 推理:让模型“会思考”:阿里千问的旗舰推理模型、Kimi K2.5的“思考模式”,都是让模型能一步步分析问题(比如解数学题时,不是直接给答案,而是像人一样列步骤)。企业用户说,这对金融、法律等需要逻辑的场景特别重要。

为啥这俩方向火?因为只懂文字的模型太“笨”了——比如你发张合同图片,它得先转成文字才能处理,多模态直接就能看懂;没有推理能力的模型,遇到复杂问题就会“胡说八道”(比如算错账)。

三、性价比为王:企业选模型不看“跑分”看“好用又便宜”

以前企业选模型可能看“谁的排名高”,现在更认“性价比”——好用还不贵才是王道。

  • Token成本进入“厘时代”:2025年国产模型大幅降价,调用一次API的成本低到几分钱甚至几厘钱,企业用起来不心疼。比如暖哇科技以前用ChatGPT 4.5,后来换成DeepSeek,因为价格只有十分之一,效果也不差;
  • 各厂商有自己的“性价比定位”:DeepSeek主打“低成本”,用最少的算力输出服务,成了企业眼里的“性价比之王”;阿里千问则是“性能+开源”,既追求推理、编程能力强,又开放源码让企业自己调优,适合做定制化模型;
  • 中小玩家只能“钻细分”:通用大模型巨头越来越强(强者恒强),中小厂商没法跟巨头拼通用能力,只能去做制造、金融、医疗等细分行业的定制模型——比如给工厂做能看懂设备图纸的模型,给医院做能分析病历的模型。

四、大模型还缺啥“超能力”?这些痛点解决了就能赢

虽然行业进步快,但大模型还有不少“短板”,企业用户盼着它们突破:

1. 灵活推理:现在模型的“思考开关”要么全开要么全关——比如你问个简单问题(“今天天气”),它也会像解数学题一样“深度思考”,浪费算力;要是能像人一样,简单问题快速答,复杂问题才思考,就更实用了;

2. 稳定多模态输出:现在生成图片、语音像“抽盲盒”——得反复调提示词才能得到想要的结果,比如做设计的人要生成一张海报,可能得试十几次,没法满足专业场景;

3. 少“说假话”+能解释:大模型偶尔会“胡说八道”(比如编造不存在的数据),还没法解释为什么给出这个答案,这在金融、医疗等行业是大问题。

谁能先解决这些痛点,谁就能在应用市场领先一步。

五、未来格局:巨头抢通用,中小玩家钻细分

行业人士判断,未来大模型行业会分成两大阵营:

  • 巨头垄断通用市场:阿里、字节、腾讯这些大厂,会把通用大模型做得越来越强,覆盖大部分日常需求(比如聊天、写文案、简单编程);
  • 中小玩家拼细分行业:比如做制造业的模型(能处理工厂图纸、监控设备)、教育行业的模型(能批改作业、定制课件),这些细分领域巨头没精力深耕,中小厂商有机会靠“懂行业”胜出。

总的来说,大模型不再是“高大上”的技术概念,而是要真正落地到各行各业——谁能把模型做得更实用、更便宜、更懂行业,谁就能笑到最后。