作者:Charlotte77  数学系的数据挖掘民工  
博客专栏:http://www.cnblogs.com/charlotte77/ 
个人公众号:Charlotte数据挖掘(ID:CharlotteDataMining)

总结一下我读过的机器学习/数据挖掘/数据分析方面的书,有的适合入门,有的适合进阶,没有按照层次排列,先总结一下,等总结的差不多了再根据入门--->进阶分块写。下面列的书基本上我写的都是读完过的,不然不敢写,怕误人子弟  = =,持续更新ing~

数据分析

实习的时候只会Matlab,公司小,没钱买正版,所以领导要我两星期把R学会,当时看的有这些书

1.R语言实战

评价:很好的入门书,从安装、入门、基本的统计分析,作图命令,以及常见的分类、回归、降维等方法都有写

推荐指数:五颗星

2.数据分析-R语言实战

评价:专门用R语言写的数据分析的书,掌握R的基础后可以看看,侧重数据分析的基本方法,介绍了一些常见的分析方法,比较基础。

推荐指数:四星半

3.探索性数据分析

评价:外国人写的书,但是翻译真的太烂了。而且内容其实没什么干货啊,关于分位数、展布等这些概念直接找本统计学的教材看看吧。

推荐指数:三颗星

4.R语言编程艺术

评价:在图书馆意外发现了这本好书,对于R中的数据结构和性能提升讲的不错。

推荐指数:四颗星

5.利用Python进行数据分析

评价:这本书是pandas模块的作者写的书,一句话总结:Pandas使用手册。如果用Python做数据分析,基本上Pandas是必不可少的包。

推荐指数:四颗星

数据挖掘/机器学习

4.大数据时代的R语言 数据挖掘:R语言实战

评价:和上面的“数据分析-R语言实战”好像是一个系列的,基本上常见的数据挖掘方法都介绍了,有理论有实例,适合入门。

推荐指数:四颗星

5.数据挖掘概念与技术

评价:入门书,理论多,好像是很多研究生学数据挖掘的教材,很详细,孟小峰老师的翻译还是不错的,相对很多翻译很烂的还是可以的。

推荐指数:四颗星

6.机器学习实战

评价:Python写的,没有Python基础的话还是先学学Python吧,基本上都是实例为主,代码很详细,讲的也很通俗易懂,github上可以下载代码

推荐指数:五颗星

7.集体智慧编程

评价:和机器学习实战一起看的,也基本上都是实例,翻译的也可以,比“探索性数据分析”的翻译好多了!!有代码,可以实操,基本上真正掌握了可以应对一般的数据挖掘的需求了。

推荐指数:五颗星

8.统计学习方法

评价:李航博士写的机器学习常见算法的数学推导,讲的算是比较详细了,对于有数学基础的还是很好理解的,如果没有数学基础,可以先看看数分高代凸优化之类的书再看。适合有一定基础的学习。

推荐指数:五颗星

9.推荐系统实战

评价:看名字就知道是讲推荐系统的,对于不知道推荐系统是啥的可以好好看看,看完基本上了解推荐系统的大概框架和流程,也有一些例子,但是每个例子以及理论都讲的很浅,没有深入,只适合入门。

推荐指数:四颗星

10.数据挖掘导论

评价:实习的同事本科时上课的教材,也是一部大巨头啊,外国人写的书,很通俗易懂,非常非常详细。

推荐指数:四颗星

11.Spark快速大数据分析

评价:8.4/10,很薄的一本书,主要介绍的Spark的基本语法命令之类的,适合快速入门,Learning Spark的中文版

推荐指数:五颗星

12.Spark高级数据分析

评价:豆瓣上评价很少,但是我买回来看了以后发现还是不错的,基本上从分类,聚类,推荐,征信这几块都有实例讲解,比较详细,看的也很快,上手不错。

推荐指数:五颗星

13.Hadoop权威指南

评价:7.8/10,很厚,Hadoop讲的很深,不太适合入门,适合做数据仓库的人看,数据挖掘的可以先看看hadoop实战

推荐指数:三颗星

14.Hadoop实战

评价:7.0/10,我看的是国内的一个教授写的,并不是“Hadoop in anction”的中文译本,这个写的很浅,适合入门,但是感觉还是Hadoop in action 写的好一些

推荐指数:三星半

15.Hive编程指南

评价:7.4/10 ,讲Hive操作的,讲真,如果真的只想了解下hive怎么操作,可以不用看这本书,直接去搜一下hive编程命令集合就可以了,这本书比较适合ETL的人,如果只是数据挖掘入门入门的话可以暂时先不用看这本书。但是书本身讲的还是很好的

推荐指数:四颗星

16.R语言与网站分析

评价:7.4/10,本来只是去国图偶然看到的一本书,但是看了几章后觉得讲的挺清晰,而且后面的实例讲的挺好的,就去亚马逊上买了kindle电子书,关联规则和社群分析讲的都挺不错的,看的特别快。

推荐指数:四颗星

17.R的极客理想工具篇

评价:7.5/10,作者是张丹,最开始是关注他的博客,写的很清晰,步骤也很明确,对于学习R的人来说是个不错的学习地方。这本书后面几张讲的主要是R的性能、以及数据库、hadoop、hive结合起来做的方法,值得一看。

推荐指数:四颗星

18.Mysql必知必会

评价:8.4/10,不多说,入门Mysql必读书,很薄的一本小册子。

推荐指数:五颗星

19.高性能MySQL

评价:8.7/10,专业级的MySQL书籍,适合进阶,但是中文翻译很烂,买英文版英文版英文版

推荐指数:两颗星(还有三颗星给了英文版)

19.凸优化

评价:9.4/10,很好的教材,而且很全,之前上数值分析这门课学的很多内容都包含在里面了,机器学习的很多概念也可以在里面找到,读完可以让你更深入的理解机器学习,而不是仅仅只会套用包。

推荐指数:五颗星!!

20.Pattern Recognition and Machine Learning

评价:9.6/10,PRML是机器学习的经典教材啊,非常值得看!有人翻译了中文版的,如果需要的话可以留言我把链接发出来~

推荐指数:五颗星

22.统计自然语言处理

评价:8.8/10,做自然语言处理的入门书,书很厚,但是讲的很多概念性的东西,却一点也不觉得枯燥,唯一的缺点就是,大概因为是经典教材类的书,所以实例比较少,有点像综述,大而全,如果想实战,可以看看Python写的一本自然语言处理的书,nltk,忘记叫啥名了,想起来了贴上来(评论里有人补充了,贴一个,Natural Language Processing with Python)

推荐指数:四颗星

再推荐几本科普书,业余可以看看提升下兴趣

1.从0到1

2.大数据时代

3.浪潮之巅

4.数学之美

5.数据之巅

23.机器学习

评价:上次居然忘了写这本书,周志华老师的新书,公式推导很详细,豆瓣评分9.2,周老师在讲数据挖掘的算法之前先讲了如何评估算法的效果与选择,可以宏观的了解机器学习一些基础知识,在之后学习算法的时候对于它们的适用场景也会有个大概的了解。作者的思路很清晰,强烈推荐啊!!

推荐指数:五颗星

公众号后台回复关键字即可学习

回复 R               R语言快速入门免费视频 
回复 统计          统计方法及其在R中的实现
回复 用户画像   民生银行客户画像搭建与应用 
回复 大数据      大数据系列免费视频教程
回复 可视化      利用R语言做数据可视化
回复 数据挖掘   数据挖掘算法原理解释与应用
回复 机器学习   R&Python机器学习入门

数据分析/数据挖掘/机器学习---- 必读书目相关推荐

  1. 【原】数据分析/数据挖掘 入门级选手建议

    1.数据分析和数据挖掘联系和区别 联系:都是搞数据的 区别:数据分析偏统计,可视化,出报表和报告,需要较强的表达能力.数据挖掘偏算法,重模型,需要很深的代码功底,要码代码,很多= =. 2.怎么入门 ...

  2. 数据挖掘机器学习[七]---2021研究生数学建模B题空气质量预报二次建模求解过程:基于Stacking机器学习混合模型的空气质量预测{含码源+pdf文章}

    相关文章: 特征工程详解及实战项目[参考] 数据挖掘---汽车车交易价格预测[一](测评指标:EDA) 数据挖掘机器学习---汽车交易价格预测详细版本[二]{EDA-数据探索性分析} 数据挖掘机器学习 ...

  3. 数据挖掘机器学习[六]---项目实战金融风控之贷款违约预测

    相关文章: 特征工程详解及实战项目[参考] 数据挖掘---汽车车交易价格预测[一](测评指标:EDA) 数据挖掘机器学习---汽车交易价格预测详细版本[二]{EDA-数据探索性分析} 数据挖掘机器学习 ...

  4. 数据分析 —— 数据挖掘是什么、能干嘛、怎么做

    数据分析 数据挖掘 什么是数据挖掘 数据挖掘:用于寻找数据中隐含的知识,并用于产生商业价值的一种手段 为什么要做数据挖掘 技术和商业就像一对双生子,在互相促进中不断演进发展.随之而来的就是个大公司的业 ...

  5. 拓扑数据分析在机器学习中的应用

    作者:曾凤 责任编辑:周建丁(zhoujd@csdn.net) 本文为<程序员>原创文章,未经允许不得转载,更多精彩文章请订阅2016年<程序员>http://dingyue. ...

  6. 大数据分析、机器学习、智能化等概念梳理

    1 引言 最近半年来一直在学习数据分析.机器学习等智能化相关的知识,过程中积累了不少技术和经验,收获很多,启发很大. 2 统计工具的学习 最初,以数据的关联性分析为切入点,展开分析工作,希望在大量.静 ...

  7. 机器学习第一章之大数据分析与机器学习简介

    大数据分析与机器学习简介 1.1 大数据分析与机器学习概述 1.1.1 大数据分析与机器学习的应用领域 1.1.2 机器学习的基本概念 1.1.3 Python在数据科学中的作用 1.2 Python ...

  8. python数据分析和机器学习入门,我有一些书单来推荐

    想要快速入门python数据分析与机器学习,书籍是一个很好的门路,可以帮助我们系统的快速入门! 下面是一些不错的书单,分享给大家,我也在拔草中,未来会把阅读笔记分享在我的公众号:python数据分析和 ...

  9. 人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载...

    人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载 ImageNet挑战赛中超越人类的计算机视觉系统 微软亚洲研究院视觉计算组基于深度卷积神经网络(CNN)的 ...

  10. 数据分析与机器学习实战(一)——机器学习基础

    数据分析与机器学习实战(一)--机器学习基础 数据分析与机器学习实战(二)--聚类分析(以K-means聚类为例) 文章目录 数据分析与机器学习实战(一)--机器学习基础 数据分析与机器学习实战(二) ...

最新文章

  1. 百度员工吐槽:百度江河日下,不知该何去何从?
  2. opencv对图像是软解码_在图像识别上深度学习和opencv有什么不同啊,我只用过opencv,对深度学习不了解...
  3. socket的缓冲区
  4. 老李分享:shell 监控cpu,memory,load average 1
  5. 所有计算机都可以安装win7,几种安装win7系统的方法介绍
  6. python插件化设计_Python打造出适合自己的定制化EclipseIDE
  7. Spark SQL概述,DataFrames,创建DataFrames的案例,DataFrame常用操作(DSL风格语法),sql风格语法
  8. 水稻已知os基因号,利用DAVIA进行GO功能富集分析
  9. 前端学习(2491):refused to apply style from ‘‘ because its MIME type (‘text/html‘) is not a supported sty
  10. oracle12 group by 拼接字符串
  11. Sharepoint WebService引用
  12. 【转】使用频率最高的美语口语296句
  13. linux popen阻塞_linux popen()与system()的区别
  14. CentOS下安装Docker-CE
  15. 给自己一个不断学习的理由
  16. html5学生作业简单源代码,html5 简单实例源代码
  17. mysql dlz驱动,安装wddns3 /dlz_mysql_driver.c:76:19: 错误:mysql.h:没有那个文件或目录...
  18. 数据挖掘_task2数据探索分析
  19. android系统网络管理,详解安全管家Android平台上网管理功能
  20. OllyDbg分析crackme-AcidBurn

热门文章

  1. 一入职!就遇到上亿(MySQL)大表的优化....
  2. python求解微分方程组_用python解一阶微分方程组
  3. gradle脚本源码查看环境搭建
  4. [tldk][dpdk][dev] TLDK--基于dpdk的用户态协议栈传输层组件简单调研
  5. 虚拟机克隆后没有IP
  6. 定时器编写   例子
  7. 2013杭州网赛 1001 hdu 4738 Caocao's Bridges(双连通分量割边/桥)
  8. 通过创建一个位图的XY Chart来学习Android绘图类Rect,Paint,Bitmap,Canvas(附源码)
  9. ubuntu 版安裝mysql8
  10. 洛谷P1217回文质数(特判筛选,取巧判断顺序)