随着数字化的不断发展,各行各业都开始了自己的数字化进程,各种数字化系统与建模项目接踵而来。而在这个数字化浪潮中,数据这个概念开始逐渐走向舞台中央,越来越受到管理层的重视。数据是数字化时代的基石,但由于各种历史遗留、管理标准、操作规范性等原因,大部分公司的数据质量都一言难尽,尤其是基础的经营数据与主数据,有些甚至可以说是千疮百孔。如果仅仅只是进行长期战略决策的参考,那么其误差还可以接受,但如果想要对更加精细的中期规划甚至短期执行提供基于数据分析的智能化决策指导,那么其准确性与颗粒度通常都是不合格的。于是,数据治理项目就应运而生了。
数据治理是一种提升数据质量的方法论,通过对数据的问题分析、标准定义、流程梳理、辅助工具、组织职责、数据流向的分析与梳理,对数据进行全方位的管理,从而实现数据质量的提升。如今数据治理已经成为了各大公司在改善数据质量时的首选手段,那么我们就需要问个问题了,仅靠数据治理,真的就能将数据质量给有效提升吗?
数据治理为什么没法根治数据问题?
诚然,在刚做完数据治理的时候,公司的数据质量基本都是会有一个较大提升的。但是,通常在经过了几个月的时间之后,数据质量往往又不行了。这就像是一个诅咒的阴云,笼罩在企业的数据质量问题上。要搞清这个问题,我们需要回顾一下数据质量问题的逻辑是什么。
除开各种疏忽与意外,数据质量的问题广义上可以归结为以下四类:
数据准确性程度低——通常是由于数据录入的人没有按照要求录入数据导致的,例如订单、库存数据的失真等。
数据标准化程度低——常见于产品代码与产品名称类的主数据,业务人员习惯于一套自用的口语化代码体系,但无法被计算机识别。
数据结构化程度低——常见于一些业务中的各种过程参数的记录,例如产能、物流时间等,相关业务人员可能有经验性的总结或纸质记录,但缺少结构化的数据。
绩效指标博弈——由于不科学的指标设置,导致业务部门为了达成指标而调整或扭曲了真实的业务数据。
我相信,除了绩效指标博弈导致的数据失真(这又是另一个大的话题,我们以后有机会展开),对于数据的准确性、标准化与结构化这三点,只要是正常人,都会认同他们是会直接影响数据质量的重要因素,但实际工作中为什么通常做的都很不到位呢?答案就是没必要。“我把一个月的订单集中一天下了,让供应商慢慢送,又不影响业务,还省事,多好”,“我们这套名称虽然简单,但有经验的人一看就懂,不碍事的”,“产能都在工厂人员的脑子里,他们清楚就行了”。大家发现,数据规范性就算差一点,也完全不影响当前的业务,而且还省事儿,那为什么还要去花时间和精力维护数据质量呢?这其实就是数据质量差的源头,因为数据质量好不好基本不影响实际的业务,也不能因此就责怪这些业务人员,因为这就是人性。我们见过的一家公司,前后发起了三次整治数据质量的“数据运动”,从上到下的对数据进行清理,搞的轰轰烈烈,但每一次的效果都持续不了多久。这就是因为,如果不真正的将数据质量与业务执行给结合起来,就无法形成一个完整的数据管理闭环,数据质量是难以得到实质性提升的。
数据质量是用出来的,而不是治理出来的
那么,如何才能将数据真正的用起来呢?一个简单直接的办法就是建立一个强大的计划管理体系。计划的能力越强,他们对数据的依赖程度就越高。一个合格的计划体系不仅要对过去的运营状况进行分析与整理,同时也需要对未来的风险与资源进行模拟与规划,在这个过程中会用到大量的数据分析、数学模型、算法公式,只有数据质量足够高才能支撑起计划部门做出正确的历史分析与未来规划。例如需要进行产能规划计算,但大部分企业是没有准确的、规范化的产能数据的,有的话可能也都是在工厂层级、产品大类层级之类的粗颗粒度数据,更精细的数据基本没有,所以通常也只能用于年度产能规划,没有办法进行月度滚动的中短期产能规划。也因此,计划部门在使用这些数据的同时也会反向成就数据的质量。对于数据的运用与分析势必就能发现数据中的问题,从而倒逼业务部门更加规范化的记录与积累数据,为企业未来的数字化道路奠定基础。
但该过程也需要管理层给与足够的理解与耐心,因为上述过程不仅需要足够的时间,更需要领导层的推动与支持,否则执行部门拒绝配合,数据规范化的改善依旧是一嘴空谈。同时缺乏准确数据的计划部门也难以发挥其真正的价值。我们已见过很多企业的计划部门,在成立之后,由于自身能力尚未完整建立,数据存在大量问题,领导支持力度不足,没过多久就在执行部门的大量声讨下被裁撤,出师未捷身先死了。
数据治理是起点,而不是终点
所以说,数据治理不该是目的,而是手段,是提升数据质量的手段。而提升数据质量同样不是目的,也是手段,是为了能将这些数据用起来,帮助我们更好的对未来进行决策的手段。不论是建立产销模型,还是引入计划系统,只有当这些数据有了一个真正的使用者,会影响到实际业务的时候,这个数据的闭环才算真正的完成,数据问题才能得到重视,这远比漫无目的的进行数据治理要有效的多。通常来说的一个比较好的方式是在开始一个计划改善类项目的同时,建立一个基于数据、算法、模型的计划辅助决策体系,给这些数据找一个“用户”,然后同步开展一个数据治理项目,这样可以缩短新的计划业务与数据的磨合期,又可以将数据治理的成果进行巩固,让数据更好的服务于我们的业务,真正的实现通过数据来指导业务的目的,这其实也是数字化转型的核心。