一、概率论和数理统计基础

1、《茆诗松概率论和数理统计》

前七章(大数据的基础:概率论和相关的数理统计)

1.1、《商务经济统计学》

茆诗松更偏向严谨的论断和课堂式的学习,比较适合正在学校的或者刚出学校的学生。如果想快速了解常用的商用概率论和数理统计知识的话,这本是比较不错的选择,该了解的概率论和数理统计知识都能在上面找到,甚至作为茆诗松的补充都绰绰有余。

2、线性代数

普通高校教材即可,能理解矩阵的运算、特征值等思想即可、作为工具书碰上了再翻阅

二、工具类

1、SPSS
1.1、《应用多元统计分析》-朱建平

这本不仅介绍了常见的数据分析和数据挖掘方法的spss操作,比如判别分析、聚类分析、因子分析、相应分析、典型相关分析和多维标度法等。更重要的是介绍了各种方法的背后原理和计算公式。

2、R
2.1、《统计建模与R语言》《R in action》二选一,熟悉R语言的基础操作
2.2、《机器学习与R语言》

以实例方式清楚地讲解了如何运用R语言进行常用的机器学习方法建模以及相应的调参,机器学习方法包括:近邻分析、朴素贝叶斯、决策树、线性回归、神经网络、支持向量机、关联规则、k均值聚类等。而且包括模型性能的评价和提高模型性能的方法等。

3、Python

Python作为未来一阶段内主流的语言,无论是作为爬虫、数据挖掘还是处理数据都是相当强大的工具。

3.1、《python编程-从入门到实践》

零基础的完美级入门教材,从基础语法到制作一个游戏再到web应用程序,perfect。

3.2、《利用python进行数据分析》

日常数据处理和熟悉python不同数据分析的包

3.3、《机器学习实战》

用python作机器学习,会比R能实现的功能更多

3.4、《从零开始学python网络爬虫》

爬虫是互联网分析必备技能

4、excel

不必专门买书了,常用的功能和函数即可。

常用的聚合函数、vlookup函数和数据透视表,养成良好的数据分析习惯。比如sheet1存放raw_data、sheet2存放加工数据和sheet存放可视化图表等。总之excel作为R/Python的补充还是相当有必要的。

5、SQL
5.1、计算机等级考试的二、三级

花一周半的时间看完并且通过即可,那两本书和真正的商业应用比较脱节,不过作为SQL的入门还是比较不错的,可以让你短时间内熟悉Sql的方方面面,经常有人买了SQL的入门书籍半年后还是只会写简单的"select * from table_name limit 1;"。

5.2、《HIVE编程指南》

基本上互联网公司用的都是hadoop等,有hadoop使用经验对于找到合适的数据分析实习还是有很大帮助的。

三、数据挖掘算法原理

1、《数据挖掘导论》

不仅有数据预处理的一些介绍,还包括常用的数据挖掘方法原理。

2、《机器学习》

大名鼎鼎的西瓜书。

3、《统计学习方法》

进阶书。

4、《统计学习基础 数据挖掘、推理与预测 》

*高阶书。

四、其他书籍,各取所需

1、《Web Analytics》

网站分析,以数据驱动决策

2、《实用数据分析》
3、根据自己感兴趣的方向自己搜相关书籍或者网站
4、数据结构(相当重要但是我暂时还没看,所以放在四中,应该单独成一类)

数据分析师入门推荐书单相关推荐

  1. 数据分析师入门_数据分析师入门基础指南

    数据分析师入门 Back in the summer of 2018, I was just starting my first internship as a Data Analyst. 早在201 ...

  2. 大数据分析师入门6-HIVE进阶

    本文为<大数据分析师入门课程>系列的第6篇,主要讲解大数据分析师在工作中需要用到的HIVE进阶知识,主要包括: 窗口函数 数据倾斜 性能调优 explain 替换引擎 那,就直接开讲了. ...

  3. [DataAnalysis]数据分析和大数据入门推荐书单

    应该是目前网上能搜到的最全和最靠谱的入门书单了,几乎零基础(懂一点高数就可以入门),而且基本上都是我看完的书,有一些我看过完全没用的比如head first SQL等就不列入在内了.算是了了一直想要汇 ...

  4. 常用SQL语句大全,数据分析师入门必备!

    1 基础 1.说明:创建数据库 CREATE DATABASE database-name 2.说明:删除数据库 drop database dbname 3.说明:备份sql server --- ...

  5. 大数据分析师工程师入门6-HIVE进阶

    本文为<大数据分析师入门课程>系列的第6篇,主要讲解大数据分析师在工作中需要用到的HIVE进阶知识,主要包括: 窗口函数 数据倾斜 性能调优 explain 替换引擎 那,就直接开讲了. ...

  6. 转行学习数据分析师还来得及吗?

    2015年,"大数据" 成为国内年度热词,并首次出现在国家的<政府工作报告中>.同年,数据分析也开始如雨后春笋般成为朝阳行业,数据分析和大数据相关职位一度霸屏各大招聘网 ...

  7. 数据分析师需要具备什么能力,大数据分析书单

    数据分析师到底在做什么? 数据分析师需要具备什么能力? 快速学习能力应该是每位数据分析师必备的.大数据环境下催生了很多新的数据分析工具和方法,分析师们比拼的就是学习速度.快速掌握很重要. 如何快速成为 ...

  8. 从入门到进阶,这10本高分书籍,优秀数据分析师越早读完越好

    2021年即将过去,新的一年也需要给自己准备好一份书单充电.今天就给大家推荐一份2022年最接地气且实用的数据分析书单,每一本都是我精挑细选的,全程都是实用干货,记得收藏备用! 一.Excel 1.入 ...

  9. 数据分析师培训机构带你3分钟快速入门数据分析

    随着"云计算"."互联网"."物联网"的快速发展,大数据也吸引了越来越多的人关注,成为社会热点之一.据统计,目前国内有90%的企业都在使用大 ...

最新文章

  1. sqlite数值长度超过7位出错_数值计算方法 第一章 绪论
  2. win10桌面倒计时插件_win10 桌面如何做到清爽好看?这篇教程给你答案
  3. openglshader实现虚拟场景_云桌面,实现办公终端的统一管理与运维
  4. php 下拉菜单多选get,Jquery实现select二级联动多选下拉菜单
  5. ubuntu 13.04安装注意事项和ROOT密码设置
  6. matlab用之前的计算结果递归,[转载]Matlab正则表达式(递归、匹配上下文等)(转载)...
  7. CentOS 6系统FreeSwitch和RTMP服务 安装及演示(二)
  8. ORACLE 9 默认密码
  9. iPad mini2 Vieux降级ios10.3.3 问题解决合集
  10. JavaScript中 切割截取字符串的几种方法
  11. 二十一个心理学效应 笔记
  12. python将图片变成水墨画
  13. 链表的中间结点--快慢指针思想
  14. 教你用python爬取王者荣耀英雄皮肤图片,并将图片保存在各自英雄的文件夹中。(附源码)
  15. STM32实现任意角度移相全桥PWM
  16. 石溪计算机学校校服,美国纽约州著名高中推荐盘点,总有你想去的!
  17. oracle如何清理sys_lob,清理 oracle lobsegment | 学步园
  18. 浦东计算机学校排名2015,浦东重点初中排名:四大名校、八大金刚。。(2015新编)...
  19. 工程电磁场导论第三章总结
  20. 妈妈再也不用担心我会出现NullPointerException空指针了,java处理空指针,java利用Lambda处理空指针

热门文章

  1. 4G Modbus Json边缘网关接入阿里云IoT平台
  2. 电脑技巧:分享六个有趣好玩的网站,值得收藏
  3. 欧式距离和马氏距离的关系(公式推导)
  4. 超出限定字段截断,鼠标悬停显示全部文字
  5. 服务器整机性能测试实验室,分析测试中心-重点实验室
  6. html中初始化css样式,css样式初始化 normalize
  7. Matlab GUI handles的相关函数汇总
  8. 朴素贝叶斯关于naivebayes包核函数等
  9. 李兴华java开发实战经典-枚举
  10. Arduino与Proteus仿真实例-HG7881(L9110)驱动直流电机仿真