数极客首页

为什么我提交的数据分析报告总是被领导K?

我们
先来想象
一个场景,一个会议室里坐满了人,正在做报告的年轻人西装笔直
,头发书的一丝不苟,PPT上列满了数据和图表,他正在论证一个什么东西。年轻人讲了很多,可是在台下听报告的一个衣着

随意的大佬,有点不耐烦了:“你不用说那么多,我就问你几个问题。”

大佬问了几个问题,年轻人马上被难住,于是大佬否决了年轻人的整个计划

我们对这个场景并不陌生

,这可能是一次数据剖析

会,一次跟主管的建模计划

汇报,或是你去见一个客户汇报成果,在一线做事的人用了很多肉体

专注于各种细节,这在数据剖析

师和建模师身上表现尤为显然
,可是大佬想问问题却常常
是写意的-他们三言二语就能发现问题的关键,并以此做出决策,然后事实证明大佬们说得对。

这就引出了一个问题,有些人数据剖析

做过大量功课,熬了一周致使

一月,控制
了丰厚
的数据和资料

,为什么他们的决策水平

,反而不如大佬们短短时间内的快速判别
呢?难道说,对一个问题思索

得多,反而没益处

吗?

这个问题,其实数学家早就想明白了,能够

用建模中的“欠拟合“和”过度拟合”这两个概念来形象的比喻。

欠拟合其实很好了解

,就是指学习的不够,只把样本数据的部分

特征习得了,或者样本变量自身

就不够,然后得出以偏概全的结论,盲人摸象这个成语最形象的表达了欠拟合,大佬经常一针见血,是由于
有阅历

的人在其专业范畴
方式

辨认

、见微知著的才干

远超凡
人,这也是很多决策范畴
机器搞不过人的一个缘由

过拟合就是指把学习中止

的太彻底,把样本数据的一切
特征简直

都习得了,于是机器学到了过多的部分

特征,过多的由于噪声带来的假特征,构成

模型的“泛化性”和辨认

正确率简直

抵达

谷点,于是你用你的机器辨认

新的样本的时分
会发现就没几个是能正确辨认

的,过于精确

写实常常
丧失
事物的实质

特征。

打个形象的比如

,给一群天鹅让机器来学习天鹅的特征,经过锻炼
后,知道

了天鹅是有翅膀的,天鹅的嘴巴是长长的弯曲的,天鹅的脖子是长长的有点曲度,天鹅的整个体型像一个“2”且略大于鸭子.这时分
你的机器曾经
基本

能区别天鹅和其他动物了,然后,很不巧你的天鹅全是白色的,于是机器经过学习后,会以为
天鹅的羽毛都是白的,以后看到羽毛是黑的天鹅就会以为
那不是天鹅,前面的规律是全局特征,一切
的天鹅都有的特征,是对的。

但是
,天鹅的羽毛是白的只是部分

样本的特征,机器在学习全局特征的同时,又学习了部分

特征,这才招致
了不能辨认

黑天鹅的状况

经常听数据剖析

师唠唠叨叨一大堆,堕入
细节而不可自拔,是时分
祭出这张图片了,指导
要的可不是那个你自己

想象出来的猫!

为什么我提交的数据剖析报告总是被指导K?

因而

,假定

你的数据剖析

触及
决策判别
和预测未来

,那么就可能有这两个基本

问题,那么,怎样
避免

这两种尴尬

的状态呢?

针对欠拟合,笔者以为
需求
有效应用
群体聪明

的力气
,其实笔者在最早的一篇微信文章《六脉神剑?大数据时期
下运营
剖析

师的应战
》提到过这个办法

大多数据剖析

师(无论是运营
剖析

师,数据剖析

师或者数据建模师等等)都是孤独

的,在面对一个新的剖析

课题时,总会面临着对新形势的莫名慌张
,加班加点是常有的事,而且觉得
剖析

的事情很难分享和协作

但由于每个人的才干

和视野有限,因而

剖析

欠拟合现象很普遍,也很正常,不是没思索
这点就是那点,但一篇报告要过大佬的关,常常
需求
做到滴水不漏。

那个时分
,三个“臭皮匠”常常
是有效的,很多专业公司来企业做咨询计划

,后援团队会十分

强大,这可不只
仅是气势问题,Google公司在它的How Google works提了一个观念
,大家所以集聚

到公司来上班,是由于
协作
能让创意更好的迸发,创意精英聚在一同
,能够

产生庞大

的化学反响
,这是团队所以存在的基本

,这个理念关于
剖析

师团队同样适用,关于
剖析

师来说,即便

是1+1>1.5,也是能够

接受

的。

创新的组织,比如

大数据组织,应该为剖析

师发明

新的协作
环境,每个剖析

师都应该以开放的心态接纳他人

,衔接
,是新时期
的需求
,关于
剖析

这个东西,需求
的是更广的视野,更深的思索

,更多的角度,再强的个人总会有没有想到的角度,假定

企业的剖析

总是受限于个人视野,何来持续竞争力?

笔者以前有多次

与团队成员连夜写剖析

报告的阅历
,有一次跟有才(同事绰号)暂时
接到一个过度优惠的剖析

报告任务,当天下午布置,第二天上午部门就要提交,怎样
办?

咱俩就充沛

发挥协作的力气
,充沛

讨论,直到每个结论双方都找不到显然
的暇纰为止,第二天上午一次过关,笔者将这个归结为团队的力气
在这个开放、分享、透明的年代,数据剖析

师一定要怀有谦卑的心态,敞开胸怀

迎接他人

,个人英雄主义很难有市场。

针对过拟合,数据剖析

师除了提升自己

的业务才干

和换位思索

的才干

外,理想
中能够

采取多人交叉

剖析

考证
的办法

来避免

个人局限性,当然这个代价是有点大的,这里给出三个执行性倡议

第一,限定剖析

时间,写报告时间越长,边沿
效益越低,30天写出的东西常常
跟一周相差无几,反而是在有时间限制的状况

下,你才会逼着自己

去思索
最重要的要素
,或者痛快
先找大佬或他人

磋商

下。

第二,限定内容长度,体会

电梯说话
的精髓

,你的结论假定

一页讲不分明

,你就应该思索
有没有抓住问题的中心
,很多时分
大佬没那么多时间,常常
是直接先看结论再看论据的,结论不吸收
人再多的数字都没意义。

第三,找个白板讨论,这是他人

的一个倡议

,要运用
粗的马克笔,笔画越粗,对你的思想
越有利,越能逼着你去思索
大局,有个词叫作蜡笔效应。

笔者用欠拟合和过拟合来表达数据剖析

中的困境

,可能并不是很适合

,但道理就是那些道理,希望于你有些启示。

作者:傅一平  微信号:fuyipingmnb  欢送

交流!

发表评论

评论已关闭。

相关文章