数极客首页

行业专家告诉你:大数据分析要走出这6大误区

行业专家通知你:大数据剖析要走出这6大误区

你的组织能否
在思索
剖析

数据的最佳方式?以下是在你采用数据剖析

之前,需求
留意
的有关大数据的6个误区。

云计算的应用,更快的数据处置
速度,以及从物联网输入大量的数据,这些意味着,企业往常

正在搜集
前所未见的数据量。往常

大数据比以往任何时分
都大。但是怎样
组织、处置
和了解

数据依然

是许多组织面临的一个主要应战

你的公司能否
依然

在努力了解

大数据是什么,以及怎样
管理吗?这里有6个关于大数据的误区,行业专家将辅佐

你把真相从虚拟
大数据范畴
中分别

出来。

1.大数据意味着“很多”数据

目前,大数据曾经
成为一个盛行
词。但人们通常对它真正的含义还是不分明

。有些人将大数据简单地以为
是大量的数据。但是,这并不完好

正确,它比这稍微

复杂一些。大数据是指一个数据集,无论是结构

(如数据表)或非结构

化(如元数据从电子邮件)分别

的数据,如社会媒体剖析

或物联网数据,构成
一个更大的故事。大数据故事阐明

组织很难用传统的剖析

技术来捕获发作
的趋向

丰田研讨
院的数据研讨
总监吉姆?阿德勒表达了一个很好的观念
:“数据也有质量。这就像水一样:玻璃容器中的水是十分

易于管理。但是,假定

混杂在洪水中,这将是压倒性的灾害

。”他说,“在数据剖析

系统中,工作在一台机器的的数据将被冲走时,其数据范围
将增长100或1000倍。所以,当然,原型虽小,但其架构却很大。”

2.数据需求
清洁

“最大的误区就是你必需求

有洁净

的数据中止

剖析

。”BeyondCore公司首席执行官阿里吉特?森古普塔说,“没有人有洁净

的数据,必需
将数据中止

清算
,否则剖析

是行不通的。这是一个猖獗
的想法。你要做的就是中止

一个足够好的剖析

。你要剖析

一切
的数据,固然

这些数据是龌龊
的,这只阐明

你有数据质量问题。我能够

通知
你一些方式

,固然

数据存在质量问题,但完好

能够

中止

正常剖析

。往常

,你能够

集中中止

数据质量工作,只是进步
数据能够

得到稍微

好一点的洞察力。”

InOutsource商业智能和剖析

总监梅根?布茨梅因对此表示赞同,“很多时分
,企业就会将这些工作能拖就拖,由于
他们以为
数据是不洁净

的,这是没有必要的。部署的剖析

应用程序将能够

找到数据的单薄

环节,”她说。“一旦这些问题曾经
肯定
,清算
计划

能够

投入到位。然后,剖析

应用程序能够

应用
一种机制,加大清算
力度,并监测停顿
状况

。”

布茨梅因说。“一旦你把这些数据整合在一同
,你将在一个应用程序中赋予它生命的视觉,你能够

看到这些汇集

在一同
的数据的关联,你会很快看到你的资料

缺乏
。”她说,“你能够

看到数据的问题在于要提供一个清算
数据的基准。”

3.等候
,让你的数据圆满

你不应该等候
清算
你的数据,这里还有一个缘由
,森古普塔说,“在你完好

肃清
数据之后,这可能需求
三个月的时间,但是
三个月后,这些数据曾经
陈旧过时了。”因而

,这些信息将不再适用。

森古普塔表示,第一州际银行的乔希?巴特曼在会议提出了一个重要观念
。乔希展示

了他是怎样
运转
剖析

,发现问题,剖析

变化,重新运转
剖析

的。他说,“你看,我的剖析

时间只需

大约四到五分钟。所以,假定

我能够

运转
剖析

,发现问题,处置

问题,再重新中止

剖析

,并在四、五分钟后查看报告,改动
怎样
处置
剖析

的办法

。”

森古普塔用编码来比喻那些旧方式。“我的一切都是正确的,然后我中止

编码。但往常

,每个人中止

编码都不太灵活

。”他说。“你写好程序之后,你必需求

测试它,并查看怎样
能使它更好,那么等它变得更好之后。世界发作
了变化,人们依然

采用的是旧的做事办法

。”

4.数据湖

数据湖是持有大量的原始结构

化和结构

化数据的涣散

的存储库,经常在大数据的背景下提到。

独一
的问题是,固然

他们是怎样
经常被援用
,但它们却不存在,阿德勒说,“一个组织的数据不被倒入一个数据湖中。这是精心谋划

的一个部门的数据库。鼓舞
集中运用
专业学问
。他们还提供了良好的数据管理
和合规性所需的问责性和透明度。”

5.剖析

数据是昂贵的

假定

假定在数据剖析

工具触及
一些费用的话,你可能会惧怕
取得

数据。而能够

通知
你的有好音讯

是,往常
有许多免费的数据工具,任何人都能够

开端
运用
这些工具来剖析

大数据

同时,森古普塔表示,当今云计算的低本钱
意味着“你真的能够

做那些以前历来
不可能完成
的的事情。”

6.机器算法将取代人类剖析

森古普塔以为
在剖析

大数据办法

有一个有趣的二分法。“有人说,处置

这个问题需求
成千上万的数据科学家来剖析

处置

,随后,又有人说,采用机器学习就能够

做到这一切。这将是完好

自动的。”

但是,桑古塔并不以为
这些都是合适

的处置

计划

。“没有足够的数据科学家,本钱
将快速上升。”他说,“此外,企业用户有多年的域名登录阅历

,并有着对他们业务的直觉。当你请来一个数据科学家,并以为
他会搞定这些工作,并通知
你该怎样
做。这理论

上发明

了一个确切的错误,数据科学家们常常
无法无法足够了解

企业的业务。”

“圆满
”的数据科学家,是那些精确

了解

细致

业务怎样
运作,以及其数据是怎样
工作的,这是一个误区。森古普塔说,“这样的人基本

不存在。”

在理想
中,森古普塔说,“大多数数据科学项目理论

上没有得到实施

,由于
它是如此艰难

,需求
几个月得到完成,而当它完成的时分
,你所关怀

的问题是曾经
陈旧过时了。”

但是,也有过于依赖机器学习问题。“机器学习只是给出一个答案,但并没有解释。它通知
人们该怎样
做,而不是为什么要那样做,”他说。“人们不喜欢他人

通知
他该怎样
做,特别
是神奇的机器。”他说,其关键是不只是答案,而是其解释和倡议

一方面,他说,数据科学家将变得越来越专业化,而这是真正艰难

的问题。“想一想各机构和企业开端
树立

了数据处置
部门和一些处置
部门。世界500强企业也有数据处置
部门“或数字加工部门。但他们基本

上变成了Excel,Word和PowerPoint。”固然

如此,人们依然

是数据和数字处置
方面的专家。

“假定

我去摩根士丹利,置信
我,那些数据处置
和数字处置
方面的专家依然

存在。他们只是有着不同的称号
和不同的工作,但在真正的状况

下,这些人依然

存在,但80%-90%的专家曾经
转移到Excel,Word和PowerPoint方面,这是全球在大数据方面应该展开

的主要缘由
。”

作者:小胖编辑

来源:机房360

转自:数盟

链接:http://dataunion.org/25755.html

发表评论

评论已关闭。

相关文章