数极客首页

企业经营数据的质量及其八个指标

摘要:随着大数据技术逐步

在企业端应用,越来越多的企业在应用
数据技术提升管理效率和决策的科学性。企业对数据剖析

人才的需求也越来越旺盛,对管理者的数据剖析

才干

也提出了新的央求

数据的质量直接影响着数据的价值,并且还影响着数据剖析

的结果以及我们依此做出的决策的质量。质量不高的数据会影响企业的运营
管理决策;假定

数据是错误的,那么还不如没有数据,由于
没有数据时,我们会基于阅历

和常识做出不见得是错误的决策,而错误的数据会引导我们做出错误的决策。因而

数据质量是管理
企业运营
管理数据的关键所在。

数据的质量能够

经过
八个指标中止

权衡
,每一个指标都从一个侧面反映了数据的品相。这八个指标分别是:精确

性、及时性、即时性、真实性、精确

性、完好
性、全面性和关联性。

我们在比较

两个数据集的品相经常

采用如下图所示的这种图形表示。例如常规来讲,内部数据集的精确

性、真实性、完好
性高,而全面性、及时性、即时性、精确

性和关联性方面取决于企业内部对数据的注重
水平

以及采集数据的技术伎俩

而外部数据集(如微博数据、互联网媒体数据等)的全面性、及时性和即时性都能够

经过
技术伎俩

如网络爬虫等得到进步
,但在精确

性、真实性、精确

性上难以保证,也难以控制,而关联性取决于数据采集和挖掘

的相关技术。

数据的精确

数据的精确

性(Accuracy)是指数据的采集值或者观测值与真实值之间的接近水平

,也叫误差值,误差值越大,数据的精确

度越低。数据的精确

性由数据的采集办法

决议
的。

数据的精确

数据的精确

性(Precision)是指对同一对象在重复

丈量
时所得到的不同观测数据之间的接近水平

。精确

性,也叫精准性,它与数据采集的精度有关系。精度越高,央求

数据采集的粒度越细,误差的容忍水平

也越低。

例如在丈量
人的身高时,能够

精确

到厘米,多次

丈量
结果之间的误差只会在厘米级别;在丈量
北京到上海的距离

时,能够

精确

到千米,多次

丈量
结果之间的误差会在千米级别;用游标卡尺丈量
一个零件的厚度时,能够

精确

到 1/50 毫米,多次

丈量
结果之间的误差也只会在 1/50 毫米级别。因而

,能够

说采用的丈量
办法

和伎俩

直接影响着数据的精确

性。

数据的真实性

数据的真实性,也叫数据的正确性(Rightness)。数据的正确性取决于数据采集过程的可控水平

。数据采集过程可控水平

高,可追溯状况

好,数据的真实性就容易得到保证,而可控水平

低或者无法追溯,则数据的真实性就难以得到保证。

为了进步
数据的真实性,采用无人中止

过程干预
的智能终端直接采集数据,能够

更好地保证所采集的数据的真实性,减少人为干预,减少数据造假,从而让数据愈加
精确

地反映客观事物。

数据的及时性

数据的及时性(In-time)是指能否在需求
的时分
获到数据。例如企业在月初会对上个月的运营
和管理数据中止

统计和汇总,此时的数据及时性是指这些数据能否及时处置
完成,财务能否在月度关账后及时核算。数据的及时性是数据剖析

和挖掘

及时性的保证
。假定

企业的财务核算流程复杂,核算速度迟缓

,上个月的数据在本月月中才干
统计汇总完成,那么等需求
调整财务战略
的时分
,曾经
到月底了,一个月曾经
快过完了。特别是当企业做大了之后,业务掩盖
多个市场、多个国度
,假定

数据不能及时汇总,则会影响到高层决策的及时性。数据的及时性与企业的数据处置
速度及效率有直接的关系,为了进步
数据的及时性,越来越多的企业采用管理信息系统,并在管理信息系统中附加各种自动数据处置
功用
,在数据上传到系统中之后自动完成绝大部分

报表,从而进步
了数据处置
的效率。运用
计算机自动处置
中间层数据是进步
企业数据处置
效率的有效伎俩

企业除要保证数据采集的及时性和数据处置
的效率外,还需求
从制度和流程上保证数据传输的及时性。数据报表制造
完成后,要及时或者在央求

的时间范围内发送到指定的部门,或者上传到指定的存储空间中。

数据的即时性

数据的即时性包括数据采集的时间节点和数据传输的时间节点,在数据源头采集数据后立刻

存储并立刻

加工呈现,就是即时数据,而经过一段时间之后再传输到信息系统中,则数据的即时性就稍差。例如一个消费
设备的仪表即时地反映了设备的温度、电压、电流、气压等数据,这些数据生成数据流,随时监控设备的运转
状况

,这个数据能够

看作即时数据。而

当将设备的即时运转
数据存储下来,用来剖析

设备的运转
状况

与设备寿命的关系时,这些数据就成了历史数据。

数据的完好

数据的完好
性是指数据采集的水平

,即应采集的数据和理论

采集到的数据之间的比例。例如在采集员工信息数据时,央求

员工填写姓名、出华诞
期、性别、民族、籍贯、身高、血型、婚姻状况

、最高学历、最高学历专业、最高学历毕业院校、最高学历毕业时间共 12 项信息,而某个员工仅仅填写了部分

信息,例如只填写了其中的 6 项,则该员工所填写数据的完好
性只需

一半。

一家企业中的数据的完好
性表现
着这家企业对数据的注重
水平

。央求

采集的数据在理论

中并未完好
采集,这就是不完好
的数据,这常常
是企业对数据采集质量央求

不到位招致
的。

另外,关于
动态数据,能够

从时间轴去权衡
数据的完好
性。比如

,企业央求

每小时采集一次数据,每天应该构成
24 个数据点,记载
为 24 条数据,但是假定

只记载
了 20 条数据,那么这个数据也是不完好
的。

数据的全面性

数据的全面性和完好
性不同,完好
性权衡
的是应采集的数据和理论

采集到的数据之间的比例。而数据全面性指的是数据采集点的遗漏状况

。例如,我们要采集员工行为数据,而理论

中只采集了员工上班打卡和下班打卡的数据,上班时间员工的行为数据并未采集,或者没有找到合适

的办法

来采集,那么这个数据集就是不全面的。

再例如,我们记载
一个客户的买卖
数据,假定

只采集了订单中的产品、订单中产品的价钱
和数据量
,而没有采集客户的收货地址、采购时间,则这个数据采集就是不全面的。

腾讯 QQ 和微信的用户数据记载
了客户的交流沟通数据;阿里巴巴和京东的用户数据记载
了用户的买卖
数据;百度地图记载
了用户的出行数据;大众

点评和美团记载
了客户的餐饮文娱
数据。对全面描画

一个人的生活来说,这些公司的数据都是不全面的,而假定

把他们的数据整合起来,则会构成
愈加
全面的数据。所以说,数据的全面性是一个相对的概念。过度追求数据的全面性是不理想
的。

数据的关联性

数据的关联性是指各个数据集之间的关联关系。例如员工的工资数据和绩效考核数据是经过
员工关联在一同
来的,而且绩效数据直接关系到工资数据。采购订单数据与消费
订单数据之间经过
物料的追溯机制中止

关联,而消费
订单又是由员工完成的,即经过
员工作业数据与员工信息数据关联起来的。

本书讨论
的企业运营
数据,每个数据集都是相互

关联的,有的是直接关联的,如员工工资数据和员工绩效数据;有的是间接关联的,如物料采购订单数据与员工工资数据。这些数据是由公司的资源,包括人、财、物和信息等关联起来的。假定

有任何的数据集不能关联到其他的数据集,就会存在数据割裂或者数据孤岛。数据割裂和数据孤岛是企业运营
数据关联性缺乏
招致
的。而数据的关联性直接影响到企业运营
数据集的价值。

——本文摘自《企业运营
数据剖析

: 思绪
、办法

、应用与工具》,作者:赵兴峰 著

企业运营数据的质量及其八个指标

内容提要

本书为从事企业运营
数据剖析

工作的人员以及企业中的高层管理者提供数据剖析

的思绪
和办法

。本书的内容来自笔者长期从业阅历

的总结,一切
的内容都是从企业的理论

应用动身
,涵盖了多个行业,其中包括消费
制造业、批发
效劳
业、电商行业等,读者能够

将其中的思绪
和办法

轻松地应用到理论
工作中。

本书主要内容包括企业中的大数据引见
数据剖析

的目的、数据剖析

的思绪
、对比

与对标、分类、聚类、逻辑关系、预测、结构

、各职能部门的细致

数据剖析

、常用的数据剖析

工具引见

本书适合

企业的管理者与数据剖析

人员,以及对大数据感兴味
的读者。另外,本书还能够

作为企业内部的数据剖析

培训教材。

作者简介

赵兴峰

  • 北京大学、新加坡国立大学MBA双硕士,西安交通大学工学学士,北京信宜明悦咨询有限公司开创

    人。

  • 具有20年跨国公司运营
    数据剖析

    实战阅历

    ,曾就职于宝洁、惠氏、摩立特、LG电子等国际知名企业,从事市场研讨
    、商业智能、战略研讨
    等。

  • 目前专注于大数据时期
    下政府和企业的数据管理
    、数据统筹、数据剖析

    和数据挖掘

    应用推行
    ,努力
    于推进
    企业和政府应用
    数据完成
    战略转型与升级

    ,构建聪明

    企业、聪明

    政府、聪明

    城市和聪明

    生态。

注:本文由 电子工业出版社?投稿 数据剖析

网 发表,并经数据剖析

网编辑。版权归作者一切
,转载此文请与作者联络

发表评论

评论已关闭。

相关文章