7本书带你掌握数据科学中的数学基础(附下载)
作者:Ajit Jaokar
翻译:李海明
本文约1500字,建议阅读6分钟。
想要精通数据科学,学好数学功不可没。
微信后台回复“7本书”获取文章内的书籍资源
关键词:书,数据科学,Ian Goodfellow,机器学习,数学, Robert Tibshirani, Vladimir Vapnik
想要精通数据科学,学好数学功不可没。基于这一常识,现推荐7本好书。
很多人在学习数据科学的时候都非常重视编程的学习。然而,如若有意精通数据科学(亦或是机器学习)这一门类,我们绝不能忽视数据科学的数学背景。所以,接下来我会推荐我在学习数据科学的过程中非常享受的7本数学基础方面的书。说“享受“可能不是特别准确,因为要非常非常努力才行!
那么问题来了,为什么你需要去学好数据科学中的数学基础呢?
以下几条原因一直激励着我这样去做:
人工智能技术一直处于高速更迭中。良好的数学基础有助于你理解人工智能技术的进化,同时也能让你更深入地去理解并使用人工智能技术,而不是停留在AI技术的表面。另外,这样做也可以帮助你更好地去看待AI知识产权的问题。最后,职业规划方面,一旦你掌握了数据科学背后的数学基础,便可去从事更高端的AI和数据科学方面的工作。
与这7本书打交道时,我还有另外两个动因:
首先,其内容可以作为我在牛津大学教授互联网数据科学课程的一部分,另外我本人还教授AI应用课程,在这些课程中我都要涉猎一些基础的数学方法。
其次,我还在写一本从数学角度简化AI的书,目的是让14到18岁年龄段的读者也能看懂。理解数据科学和AI中的数学基础,你需要知道4类知识:线性代数,概率论,多变量微积分以及优化。这些知识大多数(至少是一部分)都来自于高中课本,因此我正在尝试通过强调数学建模的意义,将高中数学和AI、数据科学联系起来。也欢迎评论我的方法。
以下是书单以及我对这7本书的评价:
1. 《统计学习理论的本质》Vladimir Vapnik. 【有中、英文版】
没有涵盖这位伟大的俄罗斯数学家Vladimir Vapnik著作的数学推荐书单都是无稽之谈。所以,我把Vladimir Vapnik的《统计学习理论的本质》放在首位。在我的书单中,他的书是最难找到的。我有一本较早前的印度版本。他是支持向量机的发明者,维基百科中涵盖了很多关于他的成就的介绍。
2. 《Richard O Duda教你模式分类》(2007-12-24) Richard O Duda 【有英文版】
与Vapnik博士的书类似,Duda的书是另一个时代的经典力作。这本书最早发行于1973年,后改版了25次(至2000年),是一部有份量的数学学习资源。该书采用了模式识别方法,并提供了广泛的算法覆盖。
3. 《机器学习:从算法出发》第二版 (Chapman & Hall/Crc 机器学习与模式识别) Stephen Marsland 【有英文版】
Stephen Marsland的书已经有了第二版。Stephen Marsland的这本是同类书中我读的最早的一批中的一本(我只有第一版)。两个版本都非常好。我认为该书的第二版会有更多的python代码。就像前两本一样,这本书非常强调算法。
4. 《统计学习基础:数据挖掘,推断与预测》 第二版 Trevor Hastie, Robert Tibshirani, Jerome Friedman 【有英文版】
又是一本经典之作。我有的这本书是彩色打印的,非常精美,可以作为学习的一本参考书。
5. 《模式识别与机器学习》(信息科学与统计学) Christopher M. Bishop 【有英文版】
Christopher M. Bishop的力作《模式识别与机器学习》(信息科学与统计学)是一本深入浅出的学习参考书。
6. 《机器学习:数据门类中算法的科学与艺术》Peter Flach 【有英文版】
虽然这本书在amazon上有评论说多文字而少代码,但我喜欢Peter Flach的书,特别是算法的分组(逻辑模型,线性模型,概率模型)以及其对主题的整体处理风格。
最后,是我最最推荐的一本:
7. 《深度学习》Goodfellow, Bengio and Corville 【有中文 draft版、英文版】
这是一本值得你从一字不落头读到尾的好书。该书既详细又现代,涵盖了你能想到的所有问题。
还有两本也值得阅读:
1. 《机器学习第一课》第二版 (机器学习与模式识别) Simon Rogers,Mark Girolami
这是我看的第一本AI和数据科学的书。他不太适合初学者,但是仍然是一本不错的书(特别是第二版)
2.《机器学习:从概率出发》 Kevin Murphy
这本书评价颇高,但是我自己还没有读过(所以没有列在7本书的范围之内)
如果我错过了一些好书,正好你又有其他推荐,也请让我了解。
总结评论
1. 除了《深度学习》,我不建议大家通读其他书籍。我更倾向于需要学习哪类知识就去读哪本书。我还喜欢不同作者在书中举的不同例子,比如Duda的鱼分类;Hastie的广告数据销售电视与广播;Flach假设空间概念与海洋动物的例子等等。
2. 我发现这些书还赋予了我一点点的谦卑,让我们知道这个世界浩瀚无垠,错综复杂,而我们实在是知之甚少。
3. 这些书也不会过时。Vladimir已经81岁高龄了,Duda的这本书发布于1973年,我希望50年后,整个行业仍然会去读它们。就像老朋友能经得起时间的考验一样,令人欣慰。同时,这也显示出数学方法的长寿与价值。
原文标题:
7 Books to Grasp Mathematical Foundations of Data Science and Machine Learning
原文链接:
https://www.kdnuggets.com/2018/04/7-books-mathematical-foundations-data-science.html
微信后台回复“7本书”获取文章内的书籍资源
译者简介
李海明 中国科学院大学在读研究生,铁人三项业余运动员,热爱音乐、艺术、生活。喜欢结交各路神仙~一起坐驰神游,一起南辕北辙
翻译组招募信息
工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。
你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。
其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。
点击文末“阅读原文”加入数据派团队~
转载须知
如需转载,请在开篇显著位置注明作者和出处(转自:数据派ID:datapi),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。
发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。
点击“阅读原文”拥抱组织
7本书带你掌握数据科学中的数学基础(附下载)相关推荐
- Github标星3.7k:微软出的数据科学入门课程(附下载)
推荐微软开源的一个非常棒的课程:面向初学者的数据科学. 目前收到了 3.7K 个Stars,可见数据科学初学者对微软的认可! 课程介绍 这个课程有10次周,共20节课.每节课包括课前和课后测验.完成课 ...
- 书单推荐:六本好书带你入门数据科学
编者按:在日常的数据科学运算中,人们其实很少考虑"人"在其中的意义,尽管数据本身都是为人服务的.因此,要想做最完美的统计方案,就不仅要阅读技术类的文章,还要阅读一些研究人们如何做出 ...
- 数据科学中的离散型数据的处理策略
点击上方"AI公园",关注公众号,选择加"星标"或"置顶" 作者:Dipanjan (DJ) Sarkar 编译:ronghuaiyang ...
- 数据科学中的陷阱II:定性变量的处理
在之前的文章里<数据科学中的陷阱I:变量的数学运算合理吗?>,我们讨论过定性变量,也就是表示类别的变量,比如性别.省份等.对于这类变量,不能在模型里直接使用它们,因为定性变量之间的数学计算 ...
- 数据科学中必须知道的5个关于奇异值分解(SVD)的应用
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转自|机器学习算法那些事 前言:本文为大家介绍了5个关于奇异值 ...
- 独家 | 在数据科学中需要多少数学技能?(附链接)
作者:Benjamin Obi Tayo 翻译:刘思婧 校对:车前子 本文约1600字,建议阅读5分钟 本文为大家介绍了在数据科学和机器学习中所需要的基本数学技能,并且分类给出了相应的主题建议. Je ...
- 数据科学中的强大思维
如果你参加过统计学入门课程,就会知道数据点可以用来激发灵感,也可以用来测试理论,但两者却不能兼顾,这是为什么呢? 人类擅长在所有的事物中寻找对应的模式. 真模式,假模式,命名的模式. 我们是那种能在薯 ...
- 数据科学中一些不常用但很有用的Python库
Parul Pandey 2020-09-22 Tuesday ➤ 00导读 提到数据科学的python包,大家想到的估计是numpy,pandas,scikit-learn之类的,这里给大家介绍一些 ...
- 数据科学中的6个基本算法,掌握它们要学习哪些知识
晓查 发自 凹非寺 量子位 出品 | 公众号 QbitAI 如果想从事数据科学,但是又没有数学背景,那么有多少数学知识是做数据科学所必须的? 统计学是学习数据科学绕不开的一门数学基础课程,但数据科学也 ...
最新文章
- android 4.2 桌面快捷方式,Android 添加桌面快捷方式操做
- 超不清视频播放器-用Python将视频转成字符
- 如何使Putty会话颜色更美观
- atoi函数_每日一道 LeetCode (50):字符串转换整数 (atoi)
- 华为服务器更改从系统盘启动不了,华为服务器设置启动项
- Python格式化输出--%s,%d,%f
- 《Python 黑帽子》学习笔记 - 原书 netcat 代码分析 - Day 7
- 动态规划算法——2020美团校招合并金币算法
- 移动端网站设计需要注意的四要点
- 邯郸云计算中心正式开通运营
- 沙普利算法的java实现_盖尔-沙普利算法告诉你,你的对象在哪里?
- Android的识花软件推荐,形色、苗叔、花伴侣三大主流识花软件全面评测
- 共享单车蓝牙锁方案phy6222系列蓝牙芯片
- 语义分割系列论文 ParseNet
- EhViewer(E绅士)最新版_ehviewer白色版_Ehviewer显示网络错误怎么解决?e站进不去了怎么办
- 汽车行业标准程序西门子1500大型程序发那科机器人焊装CCD 扫描MES通讯RFID读写
- matlab裂纹扩展程序,SMART裂纹扩展实例讲解
- COLING 2022 | CogBERT:脑认知指导的预训练语言模型
- 信息与通信的数学基础——第一章 复数与复变函数
- 超图解python物联网实作入门_完美图解物联网IoT实操:ESP8266 Arduino,Cordova物联网移动App,JavaScript微控制器编程...
热门文章
- P1209 修理牛棚
- python脚本多线程爬虫爬电脑壁纸
- 切换执行等级的命令init
- 进入Xcode4,选择菜单“Product”-“Profile”,快捷键Command+I 监测内存泄露
- 职场新人:工作七大忌
- java摄像头推流_悄摸直播(一)—— 推流器的实现(获取笔记本摄像头画面,转流推流到rtmp服务器)...
- java ee webservice_javaEE调用webservice总结【利用WSDL】(转载)
- python正则表达式re.sub用法
- 条件随机场CRF 无向图/有向图模型
- String对象不可修改指的是对象本身不可修改,而不是引用不可修改。