数极客首页

【译文】数据科学的统计学入门

对于未处在定量领域中的有志数据科学家们,学习统计学可是条令人胆寒的不归路。不论你是个计算机工程专业的大学生,寻找事业新出路的开发人员还是个MBA研究生,似乎在数据科学中最让大家觉得害怕的部分总是统计学。至少对从商学院毕业的我来说,它确实是。

统计学是门严肃的学科,很多人穷尽一生来学习研究它。作为一个上进的数据科学家,要如何在统计学的学习中百尺竿头更近一筹呢?需要学习了解一些什么呢?什么是学习统计学最好的方法呢?接下来让我一一揭晓。

由简化繁

理解掌握简单的数据学原理能够为你带来巨大的价值。在很多数据科学项目中,你根本不需要高等的统计学知识来获取重要的结论。正因如此,刻苦学习基本功才是正道,在你的工作中应用基础知识,举一反三,由简化繁。

统计学中两个最重要的分支分别是:描述统计学和推断统计学。如果能理解吃透这两项,你将会受益终身。

描述性统计学

描述性统计学定量描述一系列的信息。它们总结测量数据。与推测性统计学相反,它们并不对更大的统计总体的结果进行推测。它们仅仅是在描述这些所收集的数据集。

你过去肯定与那些数据学打过交道,一些描述性统计学中常用的测量值确定了其集中趋势(平均值,中位数,众数)以及其他的,例如数据集中的变量(标准差…)。

推测性统计学

推测性统计学让我们能够通过样本数据集来推测统计总体的性质。它们利用样本在所收集的数据上得出结果。

在实用数据科学中,当需要进行转化率的对比,或是进行类似a/b测试的试验时,推测性统计学会被大量的使用。

网络课程

对我来说,网络课程在学习技术方面效验如神:

  • 描述性统计学简介 – Udacity
  • 推测性统计学 – Udacity

这些课程是交互式的,课程包括随堂练习和课程视频。我发现网络课程是初涉该领域时的一个很好的学习方式。你能够从中学到足够的知识,让你学习统计学时更加自如。

书籍

总的来说,我会推荐Naked Statistics: Stripping the Dread from the Data这本书,作者是Charles Wheelan。这本书涵盖了描述性和推测性统计学,并且对每个领域做出了很准确的概述。它通过一些有趣的实例让统计学更加生动。

从心建造

请牢记,学习那些统计学原理的最好的方法就是由理论结合实际。一旦你开始能够将理论运用到自己的分析中来,我建议你能够拿起一本统计学手册,例如All of Statistics,来深化你的所学的知识。

来源:数盟社区

本文采用「CC BY-SA 4.0 CN」协议转载学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请联系「我们」处理。

发表评论

评论已关闭。

相关文章