成为数据科学家必读的3本机器学习书籍
2019年04月29日 由 bie管我叫啥 发表
331948
0
在书海的包围中,我们通常会迷失方向,不知道接下来要读哪本书。
下面是一名机器学习工程师Strikingloo推荐的一个非常简短的清单,只有3本机器学习书籍,虽少却精。
每一本都在他的职业生涯中的不同阶段帮助了他,下面就来看一下他的推荐吧。
一
Data Science from Scratch: First Principles with Python by Joel Grus
这是此清单中最具引导性的一本。在阅读本书之前,我对数据科学几乎一无所知。
我确实拥有强大的概率和统计背景,并且了解足够的Python知识。但是,我忽视了它的实用性。
这本书为我做了很多事情。它:
- 向我展示了如何高效优雅地处理Python中的数据,并遵循Python的良好实践;
- 教我如何从头开始实现最简单的机器学习算法;
- 告诉我数据科学家的日常工作可能是什么样子;
- 教我如何将结果清楚地传达给他人。
如果你是数据科学社区的新手,我极力推荐它。它将为你提供你需要的大多数主题的清晰概述,以便使你开始数据科学家之路。
它还将展示Python最常用的库,以及许多惯用代码。
二
An Introduction to Statistical Learning: with Applications in R by Gareth James
这本书是迄今为止我发现的最全面的机器学习书。我从中学到了很多,像k -均值聚类这样的无监督学习算法,以及增强树这样的有监督学习算法。
如果你已经在这个领域工作,那么第一章可能会有点过于基础(至少对我来说)。但它还总结了许多你以前没有学过的东西。
后面的章节是真正宝贵的地方。它对随机森林,增强树和支持向量机的解释非常到位。
以下是你可以从统计学习简介中学到的一些主题:
- 回归和监督学习算法:从线性回归和SVM到基于树的方法;
- 无监督学习技术:尤其是聚类,包括K-Means算法;
- 采样方法和其他通用机器学习核心概念;
- 度量标准的含义和优缺点,如准确性、查全率、精确度等。
我认为今年到目前为止,这本书是我读过的最好的书,它让我成为了一个知识更加全面的数据科学家。它也是一本非常好的参考书,可以放在书架上。
三
Deep Learning by Ian Goodfellow,Yoshua Bengio,Aaron Courville
这本书的范围非常具体:人工神经网络或深度学习。
然而,第一章概述了深度学习的前身,它与众不同的原因,以及对深度学习如何运作的解释,这些都非常精彩。
它甚至可以在学习深度学习之前解释你需要知道的所有内容,有一整章专门介绍线性代数、概率和信息论,以及数值计算方法。
接下来的章节,只要你需要深入了解特定的神经网络架构,就可以作为一个很棒的参考。
它们包括对卷积神经网络和递归神经网络的深入解释,以及许多正则化或优化方法。
第三部分也是最后一部分,围绕尖端技术介绍了生成模型,自动编码器和许多其他有趣的算法。它们可能会给你带来很大的助力。
本书的作者现在是机器学习的名人。其中一人甚至最近获得了图灵奖,所以也许跟他们学习这门课程再好不过了。