数极客首页

如何选择一本优质的数据科学书籍

怎样
选书

选择一本合适

的数据科学书至关重要,一本不适合

的书会糜费
你的时间以及肉体

有时分
,书的大纲可能正合你意。但是随着你深化
阅读时,可能会发现作者只触及了表面

,并不够深化
。这种状况

之前也发在我的身上,我写这篇文章就是为了让你避免

这种状况

当我们选择数据科学相关书籍时,能够

考录一下几点:

· 看作者的个人简介:能够

辅佐

了解

作者的背景,他的研讨
和主要兴味
,同时也展示

了本书的一些细节。但也要给新的作者机遇

,不要把这一点作为关键。

· 认真
阅读序文
大部分

图书在网上都能免费阅读其序文
部分

。请认真
阅读该部分

。大多数状况

下,在此部分

作者不只
会引见
写书背景,也会论述

各章节的细节。

· 选择有独立章节的书:这是我的个人喜好

,比较

一本技术型的书不是小说。固然
从书中由易到难、逐步

学习很重要,但选择一本或多或少带有独立章节的书能让你结构

性的把握此书。

· 去书店逛逛:固然
往常
能够

在网上找到一切
的东西,但是在书店能够

给你更直观的感受。有时分
,当阅读
一本书的关键章节时,我可能会改动
主见

,去选择另一本书。

· 阅读在线评论:第一
不要置信
一切
评论,毕竟评论是客观
的,但在线评论能够

了解

人们对此书的普遍见地
。我们常说:不要以一本书的封面来判别
其好坏。亚马逊的评论值得参考,人们会对作者做出有见地的评论和批判

感兴味
的书籍

数据科学有很多好书,在本文末尾,我列出了39本我所读过的数据剖析

书籍。假定

列表中没有涵盖你以为
优质的书,请给我留言。

细致
的回想

一次回想

一堆书是一个艰巨的任务。将一切
这些书放在一同
的缘由
是,我以为
概念和理论上有一些堆叠
的部分

,其中最具应战
是大部分

时间它们都是以不同的词汇呈现和论述

的。以下是我列出的,在阅读数据科学书之前值得一看的理想书籍清单。记住,你永远不会从一本书中取得

足够的学问
,由于
科学范畴
是十分

复杂的,一本书是远远不够的。

在下文中,我依据

每个规范

选择了这些书籍中的前5名。

书籍长度(页数)

一本书的长度的确

取决于所讨论
的内容。固然
这不是对质量的权衡
规范

,但我们能够

假定
你阅读的内容越多,所取得

的学问
就越多。以下是我依据

书籍中讨论
的内容多少排名前5名的书籍。

怎样选择一本优质的数据科学书籍

The Elements of Statistical Learning

Trevor Hastie and Robert Tibshirani

Python in a Nutshell: A Desktop Quick Reference?

Alex Martelli, Anna Ravenscroft, Steve Holden

Data Structures and Algorithms in Python

Michael T. Goodrich and Roberto Tamassia

Doing Data Science

Cathy O’Neil and Rachel Schu

Python Machine Learning

Sebastian Raschka

写作作风

对科学范畴
中止

论述

很有应战
性,不能让每个人都称心

,这取决于目的
受众。有些作者有这方面的天赋,能够

以简单明了的方式传达复杂的概念。同样,经过
巧妙的结构

和良好的学习方式解释概念,有助于学习。以下是写作作风
方面前5名的书籍。

怎样选择一本优质的数据科学书籍

The Elements of Statistical Learning

Trevor Hastie and Robert Tibshirani

Python Machine Learning

Sebastian Raschka

The Art of Data Science

Roger D. Peng, Elizabeth Matsui

Machine Learning: The Art and Science of Algorithms that Make Sense of Data

Peter Flach

Real World Machine Learning

Henrik Brink and Joseph Richards

结构

教授数据科学并非易事,但也没有那么难,我们只需了解

应怎样
构建内容,从而确保信息被保管

。关于这点有两个主要的办法

。我们能够

构建独立的模块,当中的内容能够

不具备相关性,但还是属于数据科学剖析

流程的内容。单独论述

这些概念不需依照

次第

另一方面,人们能够

经过
以难度递增的次第
来构建内容,就像大多数教学书籍中一样。例如关于回归,书中以最基本

方式
的回归开端
,并加以越来越多的变化和最复杂方式
的回归。以下是结构

性排名前五的书籍。

怎样选择一本优质的数据科学书籍

The Elements of Statistical Learning

Trevor Hastie and Robert Tibshirani

Python Machine Learning

Sebastian Raschka

Modern Python CookBook

Steven F. Lo

Docker in Practice

Ian Miell and Aidan Hobson Sayers

Ensemble Methods: Foundations and Algorithms

Zhi-Hua Zhou

内容

怎样就算太过了?从哪儿开端
记叙?应该触及
什么内容,跳过什么内容?这些都是写数据科学相关书籍是会遇到的问题。一些作者会选择涵盖一个十分

细致

的范畴
,当查看这些作者的学术资料

时,我们看到他们的研讨
与著作之间的联络
。大多数时分
,这些作者写的不是普通
的数据科学书籍,而是他们的研讨
的一部分

。他们的目的
受众也比较

狭窄。另一方面,一些作者针对数据科学教学,关注的是基本

的和全局的部分

,而不是细节。这类书籍常常触及
运用
R言语
或Python的回归,分类,以及运用
模块中止

数据剖析

等等。

经过
封面判别
一本书?大多数人都说不要这么做。但我不认同这点。我们会用封面来判别
一本书的好坏吗?我们需求
、且必需
这么做。当然,这里说的不是这本书的外部封面,而是在序文
中能够

看到的,书第一部的引见
性段落。在这部分

,作者大部分

都细致
引见
了本书各个章节的细节。有时,作者会偏离他们最初对书籍的想象
。这是正常的,这个范畴
正在快速发现,观念
也是如此。但是一本好书总能够

遵照
其最初的想象

解释的深度

作者在解释时会深化
到哪个水平

?我以为
这与我在这篇文章中提到的很多观念
有关。这与内容,结构

和长度之间存在关联性。解释的深度能够

辨别

好的作者,作者传达的信息中包含的内容,关系到你能够

吸收学问
,特别是那种会在大脑中留存很长时间的学问
。因而

,作者的技艺
在这占很重要的角色。由于
他们必需
控制
内容背后的错误

,这使得他们在解释问题时能够

深化
,同时避免

读者脱离本书的大框架。

代码解释

代码很重要,但不是必需的。假定

这本书的主要目的是为了解

释特定的办法

,算法和办法

在后台怎样
工作,那么最好的办法

是从头开端
重新完成
一个算法。固然

很多人会说:“为什么要这么省事

,我们有对应的模块啊”,那么我只能倡议

他们换一本书,由于
他们选错书了。重新完成
的过程,能够

让你感遭到
为了优化库的可扩展性所投入的肉体

。依据

上下文,一些书只是为了教会你怎样
运用
特定的库和包,这种书大多时分
被称为cookbook,这类书作者会依赖笔记(分享在GitHub或其他版本控制平台用于对他们的书中止

补充)。经过
作者,你会发现足够的代码能够

经过
解释一些联络
,从而辅佐

你控制
特定的主题。

怎样选择一本优质的数据科学书籍

The Elements of Statistical Learning

Trevor Hastie and Robert Tibshirani

Python Machine Learning

Sebastian Raschka

Modern Python?CookBook

Steven F. Lo

Docker in Practice

Ian Miell and Aidan Hobson Sayers

Ensemble Methods: Foundations and Algorithms

Zhi-Hua Zhou

结语

这是一个十分

客观
的分类,假定

你有不同的见地
,欢送

给我留言。

附:39本数据科学相关举荐

书籍

Doing Data Science? s s s

Cathy O’Neil and Rachel Schu

Docker in Action

Jeff Nickoloff

The Art Of R Programming?

Norman Matloff

Introducing Data Science s s ?

Davy Cielen and Arno Meysman

Learning Predictive Analytics with Python

Ashish Kumar

Data Structures and Algorithms in Python

Michael T. Goodrich and Roberto Tamassia

Amazon Web Services in Action

Andreas Wiig and Michael Wiig

Spark for Python Developers

Amit Nandi

Machine Learning : A probaBIlistic perspective

Kevin P. Murphy

Real World Machine Learning

Henrik Brink and Joseph Richards

iPython Interactive Computing and Visualization Cookbook

Cyrille Rossant

Mastering Machine Learning with scikit-learn

Gavin Hackeling

Python Data Science Cookbook

Gopi?Subramanian

Building Machine Learning Systems with Python

Willi Richert and Luis Pedro Coelho

Hadoop The Definitive Guide

Tom White

Statistical Learning with Sparsity

Trevor Hastie and Robert Tibshirani

The Elements of Statistical Learning

Trevor Hastie and Robert Tibshirani

Fluent Python

Luciano Ramalho

Thoughtful Machine Learning

Mahew Kirk

Machine Learning with R Cookbook

Yu-Wei, Chiu (David Chiu)

Docker in Practice

Ian Miell and Aidan Hobson Sayers

Data Science and BIg Data Analytics

EMC Education Services

Mastering Object-Oriented Python

Steven F. Lo

Machine Learning with Spark

Nick Pentreath

Machine Learning for Hackers

Drew Conway and John Myles White

Data Science for Business

Foster Provost and Tom Fawce

Developing Analytic Talent

Vincent Granville

Think Python : How to Think Like a Computer Scientist

Allen B. Downey

Python Algorithms

Magnus Lie Hetland

Python Cookbook

David Beazley and Brian K. Jones

Testing Python

David Sale

Programming Collective Intelligence

Toby Segaran

Data Analysis with open source tools

Philipp K. Janert

Python in a Nutshell: A Desktop Quick Reference

Alex Martelli, Anna Ravenscroft, Steve Holden

Python Machine Learning

Sebastian Raschka

The Art of Data Science

Roger D. Peng, Elizabeth Matsui

Machine Learning: The Art and Science of Algorithms that Make Sense of Data

Peter Flach

Modern Python CookBook

Steven F. Lo

Ensemble Methods: Foundations and Algorithms

Zhi-Hua Zhou

原文链接 https://opendatascience.com/blog/how-to-choose-a-great-data-science-book/

原作者 Radhouane Aniba

编译 CDA 编译团队

发表评论

评论已关闭。

相关文章