智慧校园_手机
智慧照明_手机
大语言模型有了"大脑"主体还会需要其他种种
发布时间:2023-05-08 15:20:13 TAGS:

作者:中联科创特约嘉宾尹智

大语言模型有了"大脑"主体,还会需要"小脑","海马体","视觉中枢","听觉中枢",等等 —— AI大模型的检索,生成,理解等等能力有了令人惊叹的提升,而大模型本身只是一个对已有(参与训练的)世界知识,和由此发展出的逻辑能力的融合和压缩体(以模型参数形式保存),通俗点说,就是AI大模型只有"智商"和"常识",这显然还不是一个完整的脑子。一个完全的大脑不仅能进行各类智力推演,还能处理视觉,听觉,运动,等等信号,还得有长期记忆 —— 存在于一个叫海马体的东西里,用以记住新东西。而纯粹的语言大模型,既不能看,也不能听,更是只能想起学过的东西,就像ChatGPT一开始的记忆,只停留在2021年,之后的信息,以及ChatGPT没看过的东西(别觉得GPT啥都学过了,GPT能学的至多就是不到总量5%-10%的公开数据),就没法知道了,有时就只能胡编了(这就是为什么一开始有人发现ChatGPT一本正经地胡说)。


那有没有办法在不重新调整这个天才大脑的"神经元",也就是其参数的情况下,开发一下其潜力呢?当然得有,这就是"插件"Plugin方式,简单说,就是自身不够,就外接能力,就像电脑存储空间不够了,外接一个内存或者硬盘;相机解析不够清楚,外挂一个大镜头。GPT不是不能处理图片吗,没问题,用Plugin插上一个视觉模型,这不就能"看"了吗?不是不能直接处理声音信息吗,没问题,接一个声音转文字的模型,这不就能听了吗?不是算数能力不行吗,那就外接一个计算引擎wolfram  alpha,只要能描述清逻辑概念关系的问题,就都能算了(个人觉得这才应该是实现大模型推演的主要方式);更重要的是,不是很多新知识没法塞进大模型参数里吗?原来的代码程序发现内存里没有的数据怎么找?查询外部数据库呗。大模型也一样,那上千亿个参数看上去很大,再大也存不了近乎无限的新数据,那就按原来的思路,通过插件接上一个数据库好了,只不过这不是传统的SQL/NoSQL数据库,而是向量数据库,这个我前面有文章专门说过,简言之就是一类更适合大模型神经网络查询检索的数据库,这就解决了大模型记不了新东西的问题。沿着这个思路下去,如果大模型要控制其"肢体",也就是机器人身体,怎么办?外接个"小脑"呗,不难预见,未来的大模型挂上一个运动传感器和控制器——很可能这也是一个人工神经网络模型。个人觉得,大模型接下去会(瘦身)演化出呈现不同形态的专有模型,各司其职,这些模型和外挂整合起来,接上语言大模型,就会成为一个完整的"大脑"。—— 仅代表尹智个人观点 Ken's personal view only

阅读( 810)