大多数人学习数据科学的重心放在编程上面,然而,要真正精通数据科学的话是不能够忽视数据科学背后的数据基础。本篇文章,将分享给读者我喜欢的七本有关于数据科学基础的书,下面将逐一为大家介绍这七本数学基础书,请大家开始“享受”吧!
首先要明确一点,我们为什么要为学习数据科学的数学基础而努力呢?以下是激励我的原因:

  • 人工智能正在快速的改变着世界。Geoffrey Hinton大牛使得我们重新对BP算法有了新的思考。
  • 理解背后的数学原理会帮助你更好地理解人工智能的变革。它将帮助你从深度上理解人工智能,与那些浅尝辄止的研究者区分开来。
  • 它还将帮助你更好地了解人工智能知识产权(IP)的潜力。
  • 最后,理解数据科学背后的数学知识也能引导你进入人工智能和数据科学更高端的工作。

1.统计学习理论的本质(The Nature Of Statistical Learning Theory)——Vladimir Vapnik

在数学界中,如果你想创建一个关于数学书的列表并不包括伟大的俄国数学家,那是不可能的。所以,在本文列表中的第一本书籍自然而然就是由Vladimir Vapnik编写的统计学习理论。该书是七本书中最难找到的一本,当然,在中国这都不是事儿。Vladimir Vapnik也是支持向量机(SVM)算法的创造者,其维基百科页面上介绍了很多关于他的工作。

2.模式分类(Pattern Classification)——Richard O Duda

类似于Vladimir Vapnik的书,Duda是另一个时代的经典书籍。首次发表于1973年,在25年后(2000年)得到更新,之后再也没有进行更新,但这并不妨碍本书成为一本重要的书籍。该书采用模式识别的方法,并涵盖了大量的算法。

3.机器学习:算法透视(Machine Learning: An Algorithmic Perspective, Second Edition (Chapman & Hall/Crc Machine Learning & Pattern Recognition))——Stephen Marsland

此书现在有第二版,这本书也是我读过最早的书籍之一。第一版和第二版都很好,其中第二版有更多的Python代码。与前两本书类似,该书也非常强调算法。

4.统计学习要素:数据挖掘、推理和预测(The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition)——Trevor Hastie, Robert Tibshirani, Jerome Friedman

又一本经典教材,我使用的版本印刷得非常好,具有很高的参考价值。

5.模式识别与机器学习(Pattern Recognition and Machine Learning (Information Science and Statistics))——Christopher M. Bishop

Christopher M. Bishop编写的模式识别和机器学习(信息科学和统计学)也是一本深入浅出且非常完善的书籍,参考价值高。

6.机器学习:理解数据的算法中的艺术和科学(Machine Learning: The Art and Science of Algorithms that Make Sense of Data)——Peter Flach

我喜欢Peter Flach的书籍,尽管购物网站上的一些评论说其有些冗长并缺少代码,但我喜欢其整本书的布局(算法的分组:逻辑模型、线性模型以及概率模型)和主题的整体处理。

7.深度学习(Deep Learning)——Goodfellow、Bengio和 Corville

该书也被称作“花书”,内容很详细且知识新,涵盖你能想到的一切知识点。
两个值得推荐的其它资源:

  • 机器学习的第一门课程(A First Course in Machine Learning, Second Edition (Machine Learning & Pattern Recognition))——Simon Rogers、Mark Girolami
    这本书有第一版和第二版,其中第一版是我得到的第一本书,但我不建议初学者看这本书,但这不妨碍该书是本好书(尤其是第二版)。
  • 机器学习:从概念的角度(Machine Learning: A Probabilistic Perspective )——Kevin Murphy
    该书评价很高,但我没有亲自阅读它,因此没有放在列表中。

总结

除了“花书”以外,我不会推荐从头到尾的阅读。我偏爱于按照主题阅读书籍,即将其作为参考书,当需要清楚哪部分内容时阅读相应的内容。通过阅读以上这些书籍使我觉得自己很谦卑,知道的很少,而机器学习和数据科学领域是多么的广阔。
书籍是永恒的,也是不会抛弃自己的朋友,一直在那里等着你去相遇、相识。Vladimir Vapnik现在已经81岁高龄,Duda这本书首次出版与1973年,我估计50年后,这个行业的从业者仍将阅读它们,就像经受住时间考验的老朋友一样。这展示了基于数学方法的寿命,永不褪色和凋零!

数十款阿里云产品限时折扣中,赶紧点击领劵开始云上实践吧!

作者信息

Ajit Jaokar,数据科学家、教师
个人主页:https://www.linkedin.com/in/ajitjaokar/
本文由阿里云云栖社区组织翻译。
文章原标题《7 Books to Grasp Mathematical Foundations of Data Science and Machine Learning》,译者:海棠,审校:Uncle_LLD。
文章为简译,更为详细的内容,请查看原文。

七本书籍带你打下机器学习和数据科学的数学基础相关推荐

  1. 收藏 | 10本免费的机器学习和数据科学书籍(附链接)

    来源:云栖社区 本文约2500字,建议阅读6分钟. 本文为大家介绍了免费学习机器学习和数据科学方面的书籍. 听说,最近大家都开学了?不对,是学生们都已经开学了,开学第一件事是什么?发新书!发新书!发新 ...

  2. 机器学习和数据科学领域必读的10本免费书籍

    摘要: 暑期来了,别出去溜达了,看书学习一波- 在这个暑假,有兴趣的可以阅读一下这些免费的有关机器学习和数据科学的书籍,他们能给你打开一扇看清机器学习和数据科学的窗.如果在阅读完这一文章后想知晓更多免 ...

  3. 机器学习、数据科学与金融行业 系列七:金融科技(FinTech)上 --- 基本状况

    机器学习.数据科学与金融行业 系列七:金融科技(FinTech)上 - 基本状况 "The major winners will be financial services companie ...

  4. 推荐你10本机器学习和数据科学书籍,确定不看一下么?(附资料)

    是时候让你的书架上新增几本机器学习和数据科学书籍了,KDnuggets 网站编辑 Matthew Mayo 挑选了 10 本机器学习和数据科学相关的书籍.这些书籍都是免费的,对机器学习和数据科学感兴趣 ...

  5. 20本机器学习与数据科学书籍

    20本机器学习与数据科学必读书籍 高校的暑假即将来临,有没有想利用这个暑假为自己充电,为未来的自己赢在起跑线上,成为人工智能界的人生赢家呢?来自 KDnuggets 的 Matthew Mayo 就提 ...

  6. 春节充电 | 送你10本机器学习和数据科学必读书(附PDF下载)

    作者:Matthew Mayo 翻译:肖镇东 校对:梁傅淇 本文共1800字,建议阅读6分钟. 让一系列免费的机器学习与数据科学书籍开启你的假期学习之旅吧! 在读完本文列出的书单之后,如果你想要更多免 ...

  7. 必读 | 六月份不容错过的十大重磅好文,机器学习和数据科学的小伙伴拿走不谢 原创 2017-07-10 爱收藏的 AI科技大本营 作者 | Flavian Hautbois 翻译 | AI科技大

    必读 | 六月份不容错过的十大重磅好文,机器学习和数据科学的小伙伴拿走不谢 原创 2017-07-10 爱收藏的 AI科技大本营 作者 | Flavian Hautbois 翻译 | AI科技大本营( ...

  8. 机器学习和数据科学从业者必读的10本免费英文书

    本文编译自https://www.kdnuggets.com/2018/05/10-more-free-must-read-books-for-machine-learning-and-data-sc ...

  9. 达人观点 :你应该选机器学习还是数据科学?

    作者:Jason Jung  译者:杨志昂   本次编辑转自:海边的拾遗者 导读 随着数据科学行业自 2013 年以来的爆炸式流行,该行业一直不断地朝着更宽泛的方向发展,但同时也逐渐出现了更具体的职业 ...

最新文章

  1. 《HeadFirst设计模式》笔记
  2. BeautifulSoup解析库详解
  3. 花了几百万,创业一年学到了什么
  4. override覆盖
  5. 软件测试工具LoadRunner中如何定义SLA?--转载
  6. Quartz 2D编程笔记
  7. git的历史版本拉分支、回撤revert、回退reset
  8. 图解JVM内存三大核心区域及其JVM内存案例实战剖析
  9. Mysql自增id用完怎么办?
  10. 第10题 正则表达式匹配(动态规划)
  11. 1小时场景生活圈来了!苏宁双十一引领零售体验革命
  12. python新建代码编辑文档快捷键大全_Python IDE PyCharm的快捷键大全
  13. LiveData介绍
  14. 个人微信公众号——定位策略
  15. 微信小程序--wx-charts图表插件使用教程
  16. opencv中的GMM(混合高斯分布)算法原理及C++实现(BackgroundSubtractorMOG)
  17. STM32自学笔记15-步进电机驱动项目-磁编码器MT6816驱动
  18. Greenplum实战--standby master的模拟故障与修复
  19. 区块链游戏为何如此火?大概是因为投机者和“韭菜”太多
  20. 2022年嵌入式开发就业前景怎么样?

热门文章

  1. tf.keras.losses.BinaryCrossentropy 损失函数 示例
  2. python中tkinter圆弧_Tkinter(Python)中弧的选项
  3. c#语言编写汉诺塔游戏,c#实现汉诺塔问题示例
  4. mysql返回惟一不同值_SQL/MySQL-选择不同/唯一但返回所有列?
  5. apk里面的图片不显示是加密了吗_【App】智能电视机视频盒子软件,你们缺吗?...
  6. C++_类和结构体所占内存大小,静态成员问题
  7. LeetCode-笔记-45.跳跃游戏II-贪心算法
  8. Windows10系统变慢,程序员该出手了,电脑性能大幅度提升!
  9. Java8 详解Lambda表达式
  10. pandas 排序 给excel_懂Excel轻松入门Python数据分析包pandas(二十五):循环序列分组...