大模型为什么难以嵌入到企业主流程?——Exactly,AI需要深度融入企业的业务主流程,才能为企业最关键的价值创造环节降本增效,但为什么ChatGPT和Deepseek这类大模型说了这么久,还只是反复在办公,营销客服,知识问答这几个有限场景里出现,而在核心业务流程,制造,设计研发,供应链,财税模型等领域,罕有建树呢?
这一方面跟大模型的“幻觉”问题多少有关,但这不是最关键的,大模型可以通过“智能体”的工具调用这种方式有效降低甚至避免幻觉;个人觉得,大模型无法融入企业主流程最主要的原因,是企业最核心的业务规则/流程和数据形态,几乎都不是大模型擅长的通用文字和代码,不是文本形式; 而几乎都是专有的系统代码—— 比如SAP,金蝶,定制Java,Python程序 —— 以及专有数据格式,比如Oracle数据库里的数据,知识图谱里的图数据库数据,数据仓库里的数据—— 这些都不是用通用自然语言记录,而几乎都是定制缩写符号,这些非常个性化的,每个企业都不一样的数据,不会出现在通用大模型的“通才”预训练数据中。
比如“客户”这个数据实体,在数据表中,不会有哪家开发商会直接用“客户”或者“Customer”来代表的,而都是用特定的缩写代码来做表记录(各家也不一样,有的缩写为CT,有的是CST,有的是CU,等等),而用一个数据字典来映射“客户”和这个缩写代码之间的关系。如果这样,那为什么不让大模型去读数据字典呢?这不就让大模型学会了专业数据了吗?
理论上,是可以的,而实际上,因为要考虑大模型应用的响应效率,总不能每次让大模型处理一个主业务活动,就先读一大堆数据数据字典吧;那能不能在已有开源大模型基础上,用专有数据字典去训练/精调出一个企业专有大模型呢?理论上,还是可以的,但精调这种方式,技术要求,数据要求,算力要求都挺高,投入肯定大,产出却没法保证,很多开源大模型用私有数据再训练,甚至出现越训练越“傻”的情况。
开源模型的训练数据是不公开的,谁知道开源模型的预训练数据,跟再训练用的私有数据之间,有什么不一致?以上这些,就是为什么人人都知道大模型要真正嵌入企业主流程才能发挥大价值,实际做起来却是困难重重的原因,所以真看目前企业核心业务用的AI,还是定制的机器学习和深度学习最多。想让大模型真成为“企业大脑”,如何让大模型从一个“通才”,有效变成一个足够理解企业个性化业务规则的“专才”,我觉得,是最关键要解决的问题。—— 仅代表尹智个人观点 Ken's personal view only