数极客首页

关于“数据可视化思考者”的8条军规

1、有数无形少直观,有形无数难入微

1973年,统计学家F.J. Anscombe提出了四组巧妙
的数据。它们x值的平均

数都是9.0,y值的平均

数都是7.5;x值的方差都是10.0,y值的方差都是3.75;它们的相关度都是0.816,线性回归线都是y=3+0.5x。但是,经过可视化之后,人们发现这四组数据有着大相径庭
第一组数据是最“正常”的;第二组数据所反映的是一个精确

的二次函数关系,只是在错误地应用了线性模型后,各项统计数字与第一组数据恰恰
都相同;第三组数据描画

的是一个精确

的线性关系,只是这里面有一个异常值,它招致
了上述各个统计数字,特别
是相关度值的倾向

;第四组数据则是一个更极端的例子,其异常值招致
了平均

数、方差、相关度、线性回归线等一切
统计数字全部发作
倾向

“有数无形少直观,有形无数难入微”。这个日后被称为“安斯科比四重奏”的例子通知
我们,在剖析

中,   数据可视化与统计指标缺一不可,相辅相成。

2、“七三准绳

数据可视化”这一表达,很容易让人觉得这是一个把70%的时间与肉体

花在“可视化”上的过程。但理论

上,假定

你真的用了大部分

时间来保证
图表炫酷,那么最终
的成果只需

30%的可能性是好的。真正的“数据可视化”,我们会把70%的时间花在减少错误、构建数据、确保概念正确等工作上。

数据可视化思索

者,以数据可视化为工具,对工作、对企业、对市场、对世界中止

思索

。数据观,辅佐

您踏出成为数据可视化思索

者的第一步。

发表评论

评论已关闭。

相关文章