未来天眼 – 视觉智能和增强现实-中联科创

作者：中联科创特约嘉宾尹智

不久前有一位西医院的院长跟笔者探讨，希望用人工智能的技术，去识别人的穴道经脉，笔者听完，觉得耳目一新。这位院长，可能对人工智能的技术细节并不十分了解，而他的想法，分明是体现了人工智能两个重要的应用方向：

第一个，就是通过深度学习的人工神经视觉智能网络模型去发掘提炼和模型化"默知识"。我们把那些从大量经验中获得，却很难用语言和确切规则来描述，只可意会，不可言传的知识，称为"默知识"。比如，我们都有类似自己知道怎么打球，怎么唱歌，怎么识别古玩的经验，但让我们说出来教给其他人，却非常困难。笔者以往有篇文章特别讲过，获得默知识的方式就是学习大量数据，提取出数据中的特征值，和明知识不同的是，这些特征值很难描述，在深度学习的人工神经网络模型中，这些特征体现为海量的数字神经元连接权值和修正值（可以简单理解为一个庞大的数据结构），这是一类AI擅长，人类却何难理解的信息表示。穴道经脉的识别，就是典型的默知识.
第二个，就是增强现实。AI光认出穴脉来，还只是它知道，如何人也可以看到呢，这就需要在实际的人体上显示出穴道经脉，这就是一个典型的在物理实体事物上叠加的数字效果的应用，也就是增强现实技术要解决的问题。
很多古老传说里，人是可以开天眼的。开了天眼，人就可以看到肉眼看不到的东西，而增强现实设备，比如AR眼镜，其实就是把附加在物理世界中的数字事物展示出来，相当于给了用户一双"天眼"。然而，要做到用AR应用一照人体，就能显示出穴道经脉，还能让这些传说中存在的奇经八脉能跟着视角的不同，始终显示在肢体的适当位置，并不容易。人类能够通过几个视角，甚至只要一个视角的视觉感知，就在脑子里建立起周边环境的立体表示，这是因为人脑通过了千百年的实践和进化，有各种景深，纵深的经验，人类可以脑补出环境的空间状态，同样AI也赋予了电脑“脑补”的能力。
而实际上，AI的“脑补”能力还远不止于此，近期学术界发布的的不少视觉智能论文中，AI不仅可以根据几张不同角度的二维图片，生成事物的三维构造模型，而且可以“脑补”出已有影像里缺失的部分。一个实验中，实验者把一张几只小鸟并排站立的图片遮住了一部分，AI可以根据上半部分的图像，“想象”出了下半部分，虽然和原图有所差异，但和上半部分图像浑然天成，完全看不出是一张编撰出的照片。AI的“脑补”能力为什么这么强呢？笔者觉得，这和AI的数字化基因有关。一位英国著名的当代科学家说过，数学是到目前为止对世界最精确的描述，远比文字，图片等等要精确。人脑对影像的处理，还只是一种偏定性，而非定量的描述，而AI在理解和表述事物的时候，从一开始就是数字/数学化的。用数字化/定量描述来补充、形成图像（定性）描述，这相当于降维打击。所以我们可以看到，创造性AI可以毫不费力地生成无数并不真实存在的人脸图像，写出以前没有的音乐，生成物理世界不存在的影像，在数字化创造方面，AI相对人脑，是具备先天优势的。
—— 仅代表尹智个人观点 KEN's personal view only