数极客首页

你的数据化经营为何屡战屡败,118位CTO给出的7个管理经验

你的数据化运营为何望风披靡,118位CTO给出的7个管理阅历

  • 大数据文摘作品
  • 编译:傅一洋、笪洁琼、魏子敏

提升数据剖析

才干

正成为企业数字化转型的十万火急

胜利

的企业数字化案例显然有自己

的共同点:

注重
数据质量、注重
数据上下文、以及树立
有效的数据管理体制。

而失败的企业则各有各的问题。

我们调研了118家公司的首席信息官(CIO)、首席技术官(CTO)、数据总管以及IT部门的员工及顾问

,找到了这7种企业数据理论
中最可能呈现
的问题。

只做数据集中,并没有对数据中止

整合

“数据整合是当今数据剖析

面临的最大应战
。”SAS公司的业务处置

计划

顾问

,数据管理
专业组织(DGPO)的首席发言人Anne Buff说道。

理论

上,许多公司只是简单地将数据堆积在一同
,并未对不同来源的数据中止

整合。就拿身份认定来说,比如

一套系统下“路人A”的信息与另一套系统下“路人A”(致使

可能是重名)的信息之间,没有中止

关联,这样的话,就无法对“路人A”的身份中止

完好
性描画

“数据整兼并
不等于将数据集中到一同
,”Buff说,“关于
某个研讨
对象,要将不同来源的数据相互

关联,以便获取更精确

的信息定位。一旦你这样做,当这一切相关数据都汇集

在一同
时,它将抵达

一个更完好
的结果,即比尔史密斯是谁。你必需
将它们关联起来。”

Buff还说道:各种数据集成技术使之成为可能,同时,正确的选用、完成
并执行数据整合的技术,减少不用
要的人工操作和重复

劳动这点很重要。

数据科学家会经过
数据来寻觅
并剖析

竞争优势,可能的突破

点等等,因而

,数据整合也变得越发重要。

“假定

不将以往一切
的数据整合,就无法发现其中的方式

。”Buff说道。

忽视

了不同业务对数据的需求差别

你的数据化运营为何望风披靡,118位CTO给出的7个管理阅历

“整合的集成数据技术关于
一个胜利

的剖析

程序是至关重要的,必需求

认识
到不同业务部门对数据的需求是不同的,”Buff说道,“数据的方式
不能千篇一概
。相反,还需求
思索
数据供给

,IT部门需求
将业务类型与数据方式
相匹配。”

并不是一切
的业务都需求
整合过后的数据。以金融机构的众多需求为例,风控部门需求
未经处置
的原始数据,以从中发现异常。比如

经过
搜索
多组数据中某个人地址信息的,肯定
其能否
申请了多笔贷款等。

“这些业务更倾向于研讨
多组相似

数据间的差别

,因而

这些差别

是要有所保管

的。”Buff解释道。

另一方面,诸如市场部等部门希望完成
精确

的用户信息定位,因而

只需求
其中正确的那组数据。

数据工程师可能比数据科学家更重要

你的数据化运营为何望风披靡,118位CTO给出的7个管理阅历

数据科学家这个职业在过去几年中正疾速
抢占硅谷、纽约、中关村、西二旗的各大互联网公司。一大批传统企业也开端
设置这个职位,并且大批招募。

毕竟,每个公司都希望经过
势头正盛的新兴技术使业务剖析

具有一定的预测性和剖析

阐明

,这需求
专业团队和人员的支持。

但通常,这些公司挂出的招募岗位只需

数据科学家这一种。

这是远远不够的。

数据科学家需求
数据工程师来搜集
数据集,但是,数据工程师这一职位,在许多公司没有遭到
应有的注重

“目前,大公司对数据工程师的需求增速是对数据科学家需求的两倍。” 贝恩公司旧金山办事处合伙人,高级剖析

和数字化理论
担任
人Lori Sherer这样说。

美联邦劳工统计局预测,目前数据工程师的平均

年薪曾经
抵达

135,800美圆
,且未来

十年里,对数据工程师的需求将继续坚持
快速增长态势,2026年前将新增44200个相关的就业岗位。

有专家称,同很多IT岗位一样,数据工程师的人才供不应求,部分

企业会经过
招聘或者从IT部门普通员工当选

拔培训,来补偿
这一人才缺口。

缺乏对数据时效性和生命周期的管理

你的数据化运营为何望风披靡,118位CTO给出的7个管理阅历

近十年来,随着数据存储本钱
不时
降低, IT部门能够

将大量数据存储起来,并保管
很长的时间。关于
不时
增长的数据量和数据剖析

需求来说,这是个好音讯

“公司都希望具有
大量数据。”Soaring Eagle咨询公司的开创

人、《挖掘

新黄金:管理你的商业数据(Mining New Gold: Managing Your Business Data)》的合著作者Penny Garbus说道。

但Garbus同时以为
,许多企业都将数据留存的过久了。

“这不只
仅是存储本钱
的问题,超越
十年的数据基本

没有时效性了。”她说,“数据要被赋予生命周期。”

Garbus以为
,数据留存期限要依据

不同部门、不同组织来肯定
。例如,批发
行业需求
的是即时和相关的数据,而市场部门需求
多年来的历史数据以探寻趋向

这需求
IT部门依据

不同部门的需求,制定一套明白
的数据时效规范

,从而确保数据的有效性。

Garbus还补充道,关于
那些“老旧”数据,只需
保证有就能够

了,不要将其放在中心
数据库中。

只关注数据量而忽视

数据相关性

“我们总喜欢用最容易取得

的数据中止

建模与剖析

,而不是最相关的。” Booz Allen Hamilton(IT咨询公司)的高级副总裁Steve Escaravage说。

他以为
,这是目前公司或组织普遍存在的一个误区。或许,在寻觅
更多的数据集之前,应该先想想数据能否
相关,而不是讯问
我们能否
有正确的数据。

比如

,许多公司会从大量数据中寻觅
异常。固然

充沛

性很重要,但优秀的公司同样统筹
数据的针对性。他们会关注来自于特定个体和机构的数据,并从中发现异常。比如

医疗结构

在剖析

病例时,会思索
到医生的轮班周期等。

Escaravage以为
,公司或组织能够

列一个数据意愿清单,由业务部门填写意愿,由CIO、CTO或首席数据高管完成
数据搜集

疏忽

数据来源

“当今数据剖析

存在一个显著的问题,是数据成见
。倾向
性的数据会构成

剖析

结果倾向

,从而影响到正确的业务决策与结果。其中的成见
来源于整个剖析

过程触及
的许多个部门,包括IT部门处置
数据方式,都会有一些成见
。”Escaravage说道。

“很多时分
,IT部门在对数据来源的追踪上,做的并不完善。假定

无法认识
到这一点,就会影响到数据模型的的性能,而且,缺乏数据来源的可见性使得对成见
的控制更为艰难

。”

Escaravage觉得,IT有义务搞分明

数据的来源在哪里,以及来源的相关状况

。在投资数据管理的同时,也要制定一套源数据管理处置

计划

缺乏面向用户的数据上下文

Escaravage以为
,不只
应该有一个强大的源数据管理程序,它能够

追踪数据的来源,以及它是怎样
在系统中运转
的,它应该为用户提供一些历史信息,并为一些经过
剖析

产生的结果提供背景信息。

“有时我们会以为
,具有
绝佳的数据和模型曾经
足够圆满
,但是近几年,由于剖析

办法

越来越复杂,对数据和剖析

结果的解释变得越来越少。不像前几年,在将剖析

结果应用于业务时,会依据

业务规则对数据中止

剖析

论述

。”他说。

Escaravage解释道,更新的深度学习模型为剖析

结果提供了一些注解,也为决策提供了一些可行的倡议

,但无法提供对最佳决策有辅佐

致使

至关重要的上下文,例如某件事情发作
的可能性与肯定
性等信息。因而

,需求
能提供更好的用户界面以辅佐

用户中止

决策。

“其中的技术问题在于,要明白
用户与数据模型的交互水平

怎样
。UI/UX界面决议
了系统对用户的透明度,而透明度取决于用户对剖析

结果的研讨

深度,这些都是首席信息官(CIO)在树立
剖析

系统前,应当思索
分明

的。”

相关报道:

https://www-cio-com.cdn.ampproject.org/c/s/www.cio.com/article/3269012/analytics/why-data-analytics-initiatives-still-fail.amp.html

发表评论

评论已关闭。

相关文章