作者:中联科创特约嘉宾尹智
少用"蛮力",多用"巧力",才意味着技术在进步了—— 最近看到不少 从大数据驱动AI转向 高质量小数据为中心AI的文章。个人比较赞同吴恩达大神的理由,我们对人工神经网络结构的认知和技术的成熟,是我们不再那么需要用大量数据,大量算力来反复验证和摸索神经网络结构的重要原因,因为有了基础架构,预训练网络等等,我们实际上可以相对以前,用更少的数据,比较精准地抽取数据中的特征。
以前训练数据是"大而窄",比如一个物体图片,特征值没那么多,而量特别大,是一个行数特别多,列数不那么多的数据表,而"小而宽"的数据是一个行数不太多,列数特别多的数据集,更有针对性。从水利建设到发动机到生物制药,大多数技术如果不再以堆"量"来搜索规律,而是可以基于(实践或理论)证实的规则来找到"质",这通常意味着技术的成熟。
另一个方面,"高质量小数据"通常很难自动标注,这又会加大人工标注的贡献,说明AI发展越来越务实,越来越以解决问题,而不是科技炫技为目标,这个下一篇来讨论。 —— 仅代表尹智个人观点 Ken's personal view only