应该是目前网上能搜到的最全和最靠谱的入门书单了,几乎零基础(懂一点高数就可以入门),而且基本上都是我看完的书,有一些我看过完全没用的比如head first SQL等就不列入在内了。算是了了一直想要汇总书单的一个念想。

一、概率论和数理统计基础

1、《茆诗松概率论和数理统计》前七章(大数据的基础:概率论和相关的数理统计)

1.1、《商务经济统计学》

茆诗松更偏向严谨的论断和课堂式的学习,比较适合正在学校的或者刚出学校的学生。如果想快速了解常用的商用概率论和数理统计知识的话,这本是比较不错的选择,该了解的概率论和数理统计知识都能在上面找到,甚至作为茆诗松的补充都绰绰有余。

2、线性代数(普通高校教材即可,能理解矩阵的运算、特征值等思想即可、作为工具书碰上了再翻阅)

二、工具类

1、SPSS

1.1、《应用多元统计分析》-朱建平

这本不仅介绍了常见的数据分析和数据挖掘方法的spss操作,比如判别分析、聚类分析、因子分析、相应分析、典型相关分析和多维标度法等。更重要的是介绍了各种方法的背后原理和计算公式。

2、R

2.1、《统计建模与R语言》《R in action》二选一,熟悉R语言的基础操作

2.2、《机器学习与R语言》

以实例方式清楚地讲解了如何运用R语言进行常用的机器学习方法建模以及相应的调参,机器学习方法包括:近邻分析、朴素贝叶斯、决策树、线性回归、神经网络、支持向量机、关联规则、k均值聚类等。而且包括模型性能的评价和提高模型性能的方法等。

3、Python

Python作为未来一阶段内主流的语言,无论是作为爬虫、数据挖掘还是处理数据都是相当强大的工具。

3.1、《python编程-从入门到实践》

零基础的完美级入门教材,从基础语法到制作一个游戏再到web应用程序,perfect。

3.2、《利用python进行数据分析》

日常数据处理和熟悉python不同数据分析的包

3.3、《机器学习实战》

用python作机器学习,会比R能实现的功能更多

3.4、《从零开始学python网络爬虫》

爬虫是互联网分析必备技能

4、excel

不必专门买书了,常用的功能和函数即可。

常用的聚合函数、vlookup函数和数据透视表,养成良好的数据分析习惯。比如sheet1存放raw_data、sheet2存放加工数据和sheet存放可视化图表等。总之excel作为R/Python的补充还是相当有必要的。

5、SQL

5.1、计算机等级考试的二、三级

花一周半的时间看完并且通过即可,那两本书和真正的商业应用比较脱节,不过作为SQL的入门还是比较不错的,可以让你短时间内熟悉Sql的方方面面,经常有人买了SQL的入门书籍半年后还是只会写简单的"select * from table_name limit 1;"。

5.2、《HIVE编程指南》

基本上互联网公司用的都是hadoop等,有hadoop使用经验对于找到合适的数据分析实习还是有很大帮助的。

三、数据挖掘算法原理

1、《数据挖掘导论》

不仅有数据预处理的一些介绍,还包括常用的数据挖掘方法原理。

2、《机器学习》

大名鼎鼎的西瓜书。

3、《统计学习方法》

进阶书。

4、《统计学习基础 数据挖掘、推理与预测 》

*高阶书。

四、其他书籍,各取所需

1、《Web Analytics》

网站分析,以数据驱动决策

2、《实用数据分析》

3、根据自己感兴趣的方向自己搜相关书籍或者网站

4、数据结构(相当重要但是我暂时还没看,所以放在四中,应该单独成一类)

[DataAnalysis]数据分析和大数据入门推荐书单相关推荐

  1. 大数据入门第一课 Hadoop基础知识与电商网站日志数据分析

    大数据入门第一课 Hadoop基础知识与电商网站日志数据分析 本课程从Hadoop核心技术入手,以电商项目为依托,带领你从0基础开始上手,逐步掌握大数据核心技术(如:HDFS.YARN.MapRedu ...

  2. 女友问粉丝过万如何庆祝,我发万字长文《保姆级大数据入门篇》感恩粉丝们支持,学姐|学妹|学弟|小白看了就懂

    2021大数据领域优质创作博客,带你从入门到精通,该博客每天更新,逐渐完善大数据各个知识体系的文章,帮助大家更高效学习. 有对大数据感兴趣的可以关注微信公众号:三帮大数据 目录 粉丝破万了 新星计划申 ...

  3. hive使用适用场景_大数据入门:Hive应用场景

    在大数据的发展当中,大数据技术生态的组件,也在不断地拓展开来,而其中的Hive组件,作为Hadoop的数据仓库工具,可以实现对Hadoop集群当中的大规模数据进行相应的数据处理.今天我们的大数据入门分 ...

  4. 女友问粉丝过万如何庆祝,我发长文《保姆级大数据入门篇》感恩粉丝们支持,学姐|学弟看了就懂

    文章目录 粉丝破万了 新星计划申请时粉丝数 新星内卷抢热榜之旅 运营整顿新星执行新规 重整旗鼓输出内容为王 女友问粉丝过万如何庆祝 保姆级大数据入门篇 一.学习重点划定 二.Java和大数据关系 三. ...

  5. 零基础小白的大数据入门手册

    零基础小白的大数据入门手册,学大数据前,大家可能听过不少说大数据难学.入行做好心理准备的.大家听完也很动摇很犹豫,怀疑自己能不能学好大数据.这其实完全没有必要,觉得一个东西难,百分之八十的原因是你不了 ...

  6. 大数据入门基础系列之初步认识大数据生态系统圈(博主推荐)

    不多说,直接上干货! 之前在微信公众平台里写过 大数据入门基础系列之初步认识hadoop生态系统圈 http://mp.weixin.qq.com/s/KE09U5AbFnEdwht44FGrOA 大 ...

  7. 大数据入门课程_我根据数千个数据点对互联网上的每门数据科学入门课程进行了排名...

    大数据入门课程 by David Venturi 大卫·文图里(David Venturi) A year ago, I dropped out of one of the best computer ...

  8. 大数据入门概念及应用场景

    参考内容: [知乎]深入浅出大数据:到底什么是Hadoop? [知乎]五万字 | Hive知识体系保姆级教程​ 大数据入门概念及应用场景 一.入门概念 1.1 大数据的4V 1.2 大数据处理的最佳工 ...

  9. 大数据入门-大数据技术概述(一)

    目录 大数据入门系列文章 1.大数据入门-大数据是什么 一.概念 二.技术详解 1.基础架构:Hadoop 2.分布式文件系统:HDFS 3.数据仓库:Hive 4.存储引擎:Kudu 5.分布式数据 ...

最新文章

  1. PHP学习笔记-PHP语言基础1
  2. mysql自带命令使用教程_自用mysql自带命令实现数据库备份还原
  3. 图片识别不了小程序怎么办_图片转文字【微信小程序】
  4. 「前端工程化」该怎么理解?
  5. 你必须知道的CSS盒模型,顺利通过阿里面试
  6. register_globals(全局变量注册开关)
  7. java如何构建图_如何从传递边构建子图?
  8. unef螺纹_螺纹标准大全
  9. 计算机网络:自顶向下(Top-Down)学习笔记_1.1
  10. PTA2-6 打印学生选课清单(15 分)
  11. 浅谈分子动力学(MD)模拟及其势文件
  12. 0723Python总结-递归函数及练习
  13. Mysql优化碎片空间
  14. OSChina 周一乱弹 —— 年迈渔夫遭黑帮袭抢
  15. 随笔之大学四年生活有感
  16. 自建数据库MySQL和云数据库Rds MySQL的优缺点
  17. [渝粤教育] 中南大学 科学计算与MATLAB语言 参考 资料
  18. 《产品游戏化》电子书下载(epub+mobi+pdf) Netflix、迪士尼、微软巨头在使用的产品策略
  19. 江苏省普通高校“专转本”选拔考试 计算机专业大类专业综合基础理论考试大纲
  20. C++ 探索之旅 | 第一部分第二课:C++ 编程的必要软件

热门文章

  1. 每天学点clickhouse
  2. 树莓派(USB麦克风和麦克风阵列) 录音和播放
  3. Linux安装配置ssh 基于unbantu22.04.1 LTS版本
  4. C++ string CString 详解
  5. Android 学习
  6. windows 10 arm架构ISO下载
  7. uni-app z-index无效的解决办法(遮罩层)
  8. 微信公众号及CSDN文章爬取
  9. 初识数据结构——“数据结构与算法”
  10. 哪个学校计算机最牛?全国计算机专业大学排名清单来了!