作者:中联科创特约嘉宾尹智
AI基建大赛迫在眉睫 ——
现在大家开始说到点上了。 AI三大要素 算法 算力 数据 ,我国的算法工程师并不弱,我们的大模型也有上千亿参数的;我们的数据量并不少,200个T的训练语料量看上去是惊人的大,我拿前几年数据估算了一下,某度一年光搜索量已经达到快0.2T,算上知识问答,文库,以及其他在网上就可以公开爬出来的问答型数据,加上我国庞大而相对低成本的标注人力 —— 事实上AI训练师已经列入人社部的职业目录里,这可能成为一个新的就业方向 —— 我们在数据方面,差距没有那么大,而且可以靠自己补。
只是算力,昨天我还聊到,会是一个十分关键的问题,如果我们不能快速发展自己能(部分)替代国外通用/AI运算GPU的能力和产品,我们的大模型就不太具备追平人家的条件。AI大模型的特点,就是训练过程就需要天量算力,而且目前"全量参数共同训练"的大模型,就是个大力出奇迹的模式,这个阶段的很多突破就是靠大规模不计成本地计算出来,而不是严格逻辑理论推出来的,算力会变成驱动这些突破的核心基础设施。 —— 仅代表尹智个人观点 Ken's personal view only