数极客首页

数据和人,谁在说谎?是你在说谎

摘要:「数据会说谎」的真实例子有哪些?

一个热门问题下面,昨天看到了一个答案:「数据会说谎」的真实例子有哪些? – 鱼非鱼的回答。作者用误导性的言论、数据,在数据的选择和分析,以及结论的得出上面撒谎了。我昨天睡前写了一个答案「数据会说谎」的真实例子有哪些? – 许行的回答来质疑他的文章,今天起床以后发现他文章的问题更多。首先我们来看他的答案开头,

数据和人,谁在说谎?是你在说谎

“很多人觉得飞机更安全(飞机是最安全的交通工具吗? – 飞机),都是看了维基百科上这个国际数据(我也曾是其中一员)”

一开头一举就奠定了本文的基调:你们包括我都被骗了,国际数据是骗人的,我们要来针对国情进行分析。然后引用了数据并且列出数据来源。似乎好专业呀,又有Wikipedia、网站和期刊。然而,他完全就是在胡说八道。第一,这个表格中的数据,是来源于Modern Railways(一本大众期刊)第623期上面根据英国环境、运输和区域管理部的数据,范围是英国本土的各种交通方式(所以表格里面数据显示,大巴多安全呐)。而他所列举的第二个数据来源论文的摘要写道:

The authors used traffic exposure data to calculate exposure-based fatal and nonfatal traffic injury rates in the United States. ……Nonfatal injury rates were highest for motorcyclists and bicyclists. Exposure-based traffic injury rates varied by mode of travel, sex, and age group. Motorcyclists, pedestrians, and bicyclists faced increased injury risks. Males, adolescents, and the elderly were also at increased risk. Effective interventions are available and should be implemented to protect these vulnerable road users.

这篇论文是用年龄段、交通方式、性别进行分组研究的,而且,最主要研究的是开车、摩托、自行车这些个人出现的方式!不知道@鱼非鱼同学是不是从自己平时的论文资料库里面随便引用了一篇呢?

所以他的数据分析展开就很荒之大谬了,以上都是发达国家的数据,他却说这些不合适:

数据和人,谁在说谎?是你在说谎
数据和人,谁在说谎?是你在说谎

但是呢,昨天我写了答案对他的文章进行质疑了「数据会说谎」的真实例子有哪些? – 许行的回答,我的答案提到:

(他的)这个时间点选择上很巧妙。避开了上世纪末一些扎堆的铁路运输事故,但是集中了影响我国21世纪航空运输格局的几次空难,而且数据似乎有问题,比如某次空难的死亡人数是128人而不是155人,引用了Wikipedia的来源却自行修改数据,“引用”是用来装x的么?反正,如果我们选择最近十年2005年-2014年的数据来看的话,结果如下:
数据和人,谁在说谎?是你在说谎

来源:知乎 ?作者:许行
原文链接:http://zhuanlan.zhihu.com/flyer/20170910

本文采用「CC BY-SA 4.0 CN」协议转载学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请联系「我们」处理。

发表评论

评论已关闭。

相关文章