首先作为一个数字化从业者,本人绝无意贬低数据的意义,而是力求理性论证,用不同角度看待数字化。
有本知名的商业传记叫蓝血十杰,说的是美国商业史上是个以数据为管理信条的天才,他们奉行以事实和数字为基础的理性管理,把数字分析部门变成了组织中最有潜力的机构,把数字信仰变成了一种宗教。早期他们都在商界政界取得了巨大的成功,有一位号称“人类电脑”的麦克纳马拉甚至成为了美国国防部长,直接指挥了越战。他指挥战争基于的数字指标项精细得令人发指,根据他对数据的研究,他甚至公开预测越南主要军事行动可以在1965年底结束。然而,尽管越战中美军的各项数据碾压越军,甚至可以说美军赢了每一场战斗,而最终美国却输了这场战争。为什么数据没有预测出越战的走势?这个问题待会会讨论。
另一个案例,我以前文章里讨论过,数字化首先是一种思维,这在人类历史上可以追溯到数字和文字的起源,人类自那时起用虚拟的思维和表述系统来描述操作客观世界。利用数学,数字方式管理事务的人和事例屡屡出现,18世纪普鲁士国王领有大片森林,但他只关注一个指标:这片森林,每年给我带来多少收入。因为KPI确定了,他的林业官员所有的管理思维和动作,就都只围绕这一指标展开,结果发现生长速度快,材质坚硬,价格高的挪威云杉看上去最符合经济效益最大化的目标,但当森林都换上挪威云杉后,很多问题暴露了出来,单一树种次生林导致的树种退化、土壤贫瘠,病虫害失控、动物/野生作物消失,等等,最后这种“科学林业管理”反而导致了森林收入下降。
上面说的唯数据论的做法,很有点拉普拉斯的宇宙系统论的味道,这一类科学家奉牛顿的经典力学为宇宙的终极理论,认为只要有数据,宇宙的任一点任一粒子的过去未来都可以通过数据和公式计算出来,当然后来的量子力学很清晰的指出,这种思维只适合于宏观 低速的物理世界,在高速微观的世界,因为测不准原理,没有哪个粒子的轨迹可以完全被预测,因为只要预测就需要对现有运动数据做观测,而只要一观测,粒子的行为就会发生改变(这在哲学层面很有点象中国的风水大师算命,命势可以预测,但不可说,一旦天机泄露,运势又会因此改变)。
说了这么多,那数据管理到底可不可取,或者说什么情况下可以完全或者主要依赖数据(也就是人工智能)来管理?如果我们总结历史上唯数据论者的问题,可以看到,这需要几个前提,另一面,这几个前提不满足也导致了历史上反复发生的问题:
第一, 管理数据模型的数据维度要全。这个问题我在前面说大数据的文章里详细聊过,大数据也应该是“全”数据,只在某一个或某几个维度的数量大,不仅不是大数据,而且会误导对现实情况的理解,前面说的普鲁士国王管理森林的例子,就是因为他只看到了一个维度的数据,木材产出率,尽管这些数据可以准确及时,但并不决定他的目标。也就是数理统计里,为什么有一个分析叫主成分分析,将所有(注意,是所有)可能相关的数据集汇到一起,看对目标起重大影响的,到底是哪几个(综合)指标。但常常人们还是只看自己关注的那几个数据,或者在模型里只放自己认为重要的那些数据。
就算把所有数据维度都考虑到了,这里带出的一个子问题就是,反应实际情况的要素,都已经数据化了吗?是不是所有要素,都能够数据化(标准化)?数据化的前提是标准化,也就是客观的,与现实情况相符的,普遍接受的度量。重量、体积、数量、金额、距离、时间,甚至质量、完好度、性能等等,都是可以全球统一标准的,而类似士气、民意、认可度、心理预期这些因素,却十分难标准化,因为有太多和人相关的主观成分,而恰恰是这些难以量化的因素,对战争起了确定性作用。题外话,个人认为这是人类思想发展永恒的一个矛盾,人之所以为人就是因为人有自己主观的思维和判断,如果所有主观的思想都可以被量化,这意味着存在一个客观的标准(基线),主观意识被基线化了,那这还能被称为主观吗?人类越自由,越民主,理论上就应该更尊重个人独立独特性,也就是主观性,而越让个人主观意识发展,主观成分高的要素就越难以一致化(标准化,量化)。
第二个方面,数据的及时性和数据语义。篇幅问题,下一篇再详述,
这涉及到未来解决这类问题的大杀器,物联网,这在我看来是消除数据延时和全局优化的关键技术。下一篇文章里,我们来看看物联网到底如何革命式的改造了基于数据管理的方式。 ------------ 仅代表尹智个人观点 Ken's personal view only.