数极客首页

一张图搞懂:数据科学、机器学习、数据分析和商业分析

一张图搞懂:数据科学、机器学习、数据剖析和商业剖析

编译 | 周小璐
编辑 | Vincent
微信公众号 | AI 前线(ID:ai-front)

经过
本文,你能够

数据科学及其几大分支,包括商业剖析

数据剖析

商业智能、先进剖析

、机器学习和 AI 有初步的认识。

数据科学,这个时下盛行
的热词,许多人曾尝试用胜利

案例去定义它。

谈起这个问题,我们就得从数据科学相关的其它范畴
说起——商业剖析

数据剖析

商业智能、先进剖析

、机器学习以及最终
的 AI。

我们认识
到数据科学的“绝对定义”需求
知道

许多“数据科学”的背景才干
了解

,这是一个死循环……这里的假定
统计学家或程序员对数据科学的了解

比历史学家或言语
学家容易得多,由于
前者曾经
以某种方式
接触过数据科学。

基于这个假定
,或许数据科学的“相对定义”更有意义,这也是本文的目的所在。

下面这个欧拉图描画

了上文中提到的一切
范畴
的关系,每种颜色代表了不同的范畴
(混合的颜色代表交叉

学科),横坐标代表了时间轴,每块区域代表了运用
案例。

一张图搞懂:数据科学、机器学习、数据剖析和商业剖析

信息量很大,我们从头开端

商 业

为避免

将这个问题过于简单化,我们假定
“商业”这个词不需求
定义,一些商业行为的例子如下:

  • 商业案例研讨
  • 定性剖析
  • 初始数据报告
  • 可视化报告
  • 仪表盘创建
  • 销售预测

一张图搞懂:数据科学、机器学习、数据剖析和商业剖析

以上这些都在蓝色的区域中

数 据

这里才是欧拉图真正的开端
,假定

我们将数据参与

到这幅图中,我们会得到 2 个大的范畴
以及它们的交叉

学科,总共 3 个部分

有了初始的术语选择,我们就能够

将最终
四个商业和数据的交叉

术语放进来了,也就是目前图中的紫色区域。由于“初始数据报告”,“创建

仪表盘”和“销售预测”都是数据驱动的商业行为。

与之相对的是“商业案例研讨
”和“定性剖析

”,这两个术语固然
也在商业范畴之内,但是基于过去的学问
、阅历

和行为,也很重要,但你很快就能知道

这不是真正的数据科学。

一张图搞懂:数据科学、机器学习、数据剖析和商业剖析

剖析

VS. 剖析

剖析

指的是将你的问题分隔为易处置
的小块,每一块都能够

单独研讨
,并监测各块之间的关系。

另一方面,剖析

学就是逻辑和计算的推理应用于剖析

中取得

的组成部分

。并且在这个过程中,人们会寻觅
方式

,还会研讨
未来

这种方式

的用处

一张图搞懂:数据科学、机器学习、数据剖析和商业剖析

所以,相比业务和数据,我们更应该好好运用
商业剖析

数据剖析

时 间

在进一步讨论之前,我们来引入时间轴,这对后面的部分

很重要。

我们会运用
三个状态——过去,往常

和未来

图中有一条竖线代表着关于
任何剖析

学问题中往常

的时辰
,竖线左边代表向过去的剖析

学,竖线右边代表着预测剖析

剖析

中最终
的两个部分

就能够

参与

到图中来了。

一张图搞懂:数据科学、机器学习、数据剖析和商业剖析

“销售预测”在右边,从名字就能够

看出是一个向前看的剖析

过程。很显然
,“定性剖析

”是应用
你的直觉和阅历

规划下一步行动,所以是另一个向前看的术语。

数据科学

关于
大多数读者来说,下面将进入本文的高潮部分

。数据科学是一个不能没有数据的范畴
,所以它会完好

处在图中数据剖析

的区域内。

那么它和商业剖析

的关系是怎样的呢?

结果就是同属于数据剖析

和商业剖析

的部分

必然是数据科学。

一张图搞懂:数据科学、机器学习、数据剖析和商业剖析

但是请留意
,有的数据科学过程并不直接是商业剖析

,但却是数据剖析

。比如

“钻井作业优化”需求
数据科学工具和技术,属于数据科学家的日常工作。但是在石油行业中,我们不能将其和商业剖析

关联起来。

为了更好的了解

这一点,能够

引入“相关定义”的概念。“数字信号处置
”属于数据剖析

的行为,但不是数据科学,也不是商业剖析

。数据,程序和数学都在数据科学中发挥着作用,但扮演着不同的角色。

和上面坚持
分歧
,我们运用
时间轴来终了

这一部分

——数据科学同时存在于过去和未来

的部分

这也带来了另一个问题:有没有一个范畴
是只面向过去的?

商业智能

商业智能是剖析

和报告过去的数据的过程。

一张图搞懂:数据科学、机器学习、数据剖析和商业剖析

它是面向过去的吗?不一定,但是商业智能中不包含预测剖析

。回归、分类和其它一切
的典型的预测办法

都是数据科学的一部分

,但不属于商业智能。这也决议
了那条竖线的位置。

并且,商业智能是数据科学的真子集,所以当人们在处置
描画

性统计,过去事情
的报告或可视化问题时,他的行为既属于商业智能,也属于数据科学。

机器学习和 AI

这里的定义会有一点含糊

,由于
解释这两个概念会让本文失去重点,而且关于机器学习的概念有很多资料

,特别是在 KDnuggets 上。

人工智能(AI)是机器模仿

自然(人类)智能所表现出来的任何的智能方式
,比如

计划

、学习、处置

问题等。

机器学习(ML)是机器在没有被明白
编程去这样做时,预测结果的才干

ML 是 AI 的一种方式,但是两者经常被混杂
,由于
依据

目前为止人类研讨
的研讨
成果,ML 是独一
能抵达

AI 的可行途径

在图中,这两个术语在以下位置。

一张图搞懂:数据科学、机器学习、数据剖析和商业剖析

机器学习完好

属于数据剖析

,由于
其没有数据就不能被执行。它和数据科学也有交叉

,由于
它是数据科学家最好用的工具之一。最终
,它也有商业智能的属性,触及
预测性剖析

的部分

除外。

ML 在数据科学中的例子是“客户留存”,“防狡诈
”和“创建

实时仪表盘”(也是 BI 的一部分

)。代表性的例子包括“语音辨认

”和“图像辨认

”,既属于又不属于数据科学,所以我们将其放在了边境
位置。

总结起来就是:ML 完好

属于 AI,但 AI 有一部分

范畴
致使

和商业、数据剖析

完好

没有关系,比如

“符号推理”。

先进剖析

在我们的剖析

中最终
一块范畴
是先进剖析

,相比数据科学,这更像是一个市场术语。它经常被用来描画

“不是那么容易被处置
”的剖析

。客观
上来说,关于
一个新手来说,本图中一切
的信息都是先进性的。固然
不是最好的术语,但很适合

用来汇总本文中一切
提到的“合适

的”术语。

去除了 AI,加上先进剖析

,就是下图。

一张图搞懂:数据科学、机器学习、数据剖析和商业剖析

援用
文中的术语,我们关于先进剖析

的剖析

就完成了。

英文原文:https://www.kdnuggets.com/2018/05/data-science-machine-learning-business-analytics.html

发表评论

评论已关闭。

相关文章