声明:

开头还是要先申明一下的,博主纯粹是爱好,在业余时间学习相关的知识。希望能给博主一样情况的入门同学提供一个比较短的学习路径,提高学习效率。博主看过很多个学习的视频和数据,发现很多内容都是重复的,有些内容需要重点学,有些可以带过。所以,在下文会推荐一些自己认为比较好的学习资源。

1.R还是Python:

目前,数据分析很多都是用R或Python。博主2个都学了,发现刚开始学习时,还是用R比较好。虽然,R和别的语言相比,速度真的会很慢,但是,R的统计函数,各种R包真的很完善,语法也很简洁,易学易操作。所以,对于像博主这种业余的,还是推荐用R进行大数据学习的入门。

2.在学习前,一定要首先需要了解一下R Studio和R Markdown。

看了很多视频,发现很多大牛,老师讲课时,几乎只用R就能搞定一切工作和讲课。但是,作为初学者,我还是建议同时下个R Studio(界面舒适,操作方便)。还有就是R Markdown。一定一定要用R Markdown来做日常学习的摘记,真的非常非常好用。先花一点时间学习R studio和R Markdown的操作,然后再进行R语言的学习,这个是事半功倍的。

3.数据分析是什么?

先和大家分享一下博主对数据分析的学习后的个人感受吧。

个人认为数据分析主要有:数据导入,数据整理,数据进行统计描述,数据可视化。

虽然是简单的这么几个字,但是里面细节真的很多。举个例子:数据导入,就有Flat Files,Excel,Database,Web和其他统计软件数据的导入。其中,Flat Files的导入能用的工具就有R内置的utils包,readr包,data.table包。然后是数据整理,包括对数据初步的观察,如有没有NA,异常值,数据框有没有弄成tidy table的形式等等的。

毕竟,在现实生活中,你遇到的数据问题是千差万别的,很多问题都是人为导致的。例如,给你上个季度的公司销售额,然后需要和以前的数据进行比较。你可能会发现这些你认为的数字,可能被人为设置成字符串;或是某几天的营业额,没有填上内容;还有可能是有些部门统计是科学计数法。这些种种的问题产生数据格式不一致,经常导致后续数据分析总出错。

所以,数据整理有时可能占整个工作的3/4时间。等数据整理好后,就可以进行后续的工作,可以只是做个年度的销售额报表,或是把数据用于机器学习,差异分析,画图。这就看你自己的需求了,这些数据的应用的内容,博主可能会在以后的帖子中继续分享。

4.初步大致的理解R语言

如果和博主一样,R语言刚刚入门,看不进书。那么,首先推荐就是通过视频教学的方式,进入对R语言基础部分的大致学习。

博主看过很多不同的学习视频,这些视频一般都是免费的,且在B站就能搜索到。给大家推荐 炼数成金系列的视频,之前在B站上看了好多遍,老师讲的很好,不过后来链接失效了,大家可以再去搜索一下。

通过视频课程主要是对R有个基本认识,熟悉R语言基本函数。一般有数据处理和可视化2大部分大家看完就行,后面才是学习重点。

5.仔细的看几本书籍,对R语言的应用有大致的理解

不得不说,大家都说好的书真的是非常好的书。博主看了很多本关于R的书籍,发现真的是经典真就是最好的。

给大家推荐:1.R语言实战。大家下载时,需要注意一下,有很多版本下载后是不全的,缺少后面内容。这本书涵盖的内容很全面,看完后,你大致就能明白R语言能用在哪些方面。2.R数据科学。必看,非常好的数据处理书籍,全面,经典。3.统计建模与R软件。这个更偏向数学统计方面,大家可以选读,但是,如果真的要学习数据分析的话,数学统计方面的知识大家一定要回去回顾回顾。

一般这几本书看完后,对R的感觉就出来了。

6.R包和相应书籍

以上几本书看完后,我们对R的总体框架就有了。接下去就是真对一些经典的R包进行学习了。

R包一般分为3种:工具包,注释包和数据包。R语言在数据分析上非常好用,主要还是有丰富多彩的R包,方便了你对数据进行处理。常用的R包,在上面3本书中都有涉及,很多书籍对这些R包有详细的讲解。

等你看完这些书籍后,你会有种感觉:只要清楚相应的问题,只要去网站上找对应R包,然后可以使用就行,可以边学习边解决问题边工作了。不需要懂所有的知识点,只要清楚如果能找到解决你问题的方法。比如,你想话热图,确定好用pheat包,然后去网站上搜索对应的代码。你只要把你需要分析的数据格式转换为R包要求的那样,就能进行后续操作了。

但是,一些经典的R包还是需要好好看一遍的。

推荐网站:

http://www.bioconductor.org

https://www.stat.auckland.ac.nz/~paul/RGraphics/rgraphics.html

http://www.ggobi.org

https://www.r-bloggers.com

7.cheatsheet

当你完成上面几步时,你会发现可以应对工作中一些初级的问题了。然后,可以免费下载几个cheatsheet贴在桌面上,方便平时查询。

推荐网站:

https://www.rstudio.com/resources/cheatsheets

http://www.cheat-sheets.org/#PostgreSQL

8.网站推荐

最后,给大家推荐一个收费网站:datacamp,不过也不贵。博主是之前网站搞活动时,用几百块就注册了1年的会员。里面的课程非常好,几乎涵盖了数据分析的各个方面。博主,花了几个月的时间,把里面的R相关的课程全学了,亲测过,可食用,资源非常非常香,强烈推荐。

其实,到这里,博主认为算是数据分析入门了。之后,还是得在日常工作项目中进行积累。之后,更加深入的数据分析,就涉及到了机器学习啊,统计算法啊,人工智能啊。这些进阶课程的经验贴,博主之后也会分享。

收集的资源链接:

https://pan.baidu.com/s/1NqD62BLpD1D5mOYQ330QzQ

希望这个帖子对数据处理感兴趣的朋友有用。节省出一定的学习时间。

python零基础入门大数据_【资源分享】零基础入门大数据(数据分析)经验分享...相关推荐

  1. Splunk大数据分析经验分享

    转自:http://www.freebuf.com/articles/database/123006.html Splunk大数据分析经验分享:从入门到夺门而逃 Porsche 2016-12-19 ...

  2. 大恶人吉日嘎拉之走火入魔闭门造车之.NET疯狂架构经验分享系列之(一)后台控制逻辑代码部分...

    我也是本着善意把自己的代码结构分享给大家,欢迎大家用批评指点.首先我为什么把这个标题写为恶人,因为我很喜欢招惹别人,因为喜欢跟别人交流,喜欢指出别人的缺点,偷偷学习别人的优点,所以大家都会反感我,因为 ...

  3. 大恶人吉日嘎拉之走火入魔闭门造车之.NET疯狂架构经验分享系列之(三)商业逻辑代码部分...

    其实,写好几套管理软件后发现,其实大多管理软件,很多也不过是数据库设计得合理一些后 就是把数据搬来搬去而已,添加.删除.修改,然后进行一些统计分析而已.其实写代码都是 那些简单的程序Copy来Copy ...

  4. 大恶人吉日嘎拉之走火入魔闭门造车之.NET疯狂架构经验分享系列之(三)商业逻辑代码部分

    其实,写好几套管理软件后发现,其实大多管理软件,很多也不过是数据库设计得合理一些后 就是把数据搬来搬去而已,添加.删除.修改,然后进行一些统计分析而已.其实写代码都是 那些简单的程序Copy来Copy ...

  5. 大恶人吉日嘎拉之走火入魔闭门造车之.NET疯狂架构经验分享系列之(四)高效的后台权限判断处理

    一般一个用户都有个默认的岗位,例如我是项目经理,那项目经理应该 有啥权限等.我们设计时考虑到了复杂情况,一般会设计为一对多关系, 但是日常生活中,大部分情况下,导入导出数据时,都希望获得一个单 一的关 ...

  6. 大恶人吉日嘎拉之走火入魔闭门造车之.NET疯狂架构经验分享系列之(二)后台服务代码部分

    程序写太长了,大家看着也累,我也写着也很辛苦,接下来,还是写得简短一些,尽量多一些截图,少一些文字吧. 同样是,欢迎指点批评的同学,我虚心学习提高,改改以往的高姿态. 架设软件系统就像大家看饭店厨师炒 ...

  7. 大恶人吉日嘎拉之走火入魔闭门造车之.NET疯狂架构经验分享系列之(一)后台控制逻辑代码部分

    我也是本着善意把自己的代码结构分享给大家,欢迎大家用批评指点.首先我为什么把这个标题写为恶人,因为我很喜欢招惹别人,因为喜欢跟别人交流,喜欢指出别人的缺点,偷偷学习别人的优点,所以大家都会反感我,因为 ...

  8. 大恶人吉日嘎拉之走火入魔闭门造车之.NET疯狂架构经验分享系列之(二)后台服务代码部分...

    程序写太长了,大家看着也累,我也写着也很辛苦,接下来,还是写得简短一些,尽量多一些截图,少一些文字吧. 同样是,欢迎指点批评的同学,我虚心学习提高,改改以往的高姿态. 架设软件系统就像大家看饭店厨师炒 ...

  9. python自学入门12周_新手怎么100天入门Python?

    作为目前最火也是最实用的编程语言,Python 不仅是新手入门程序界的首选,也逐渐成为了从大厂到小厂,招牌需求 list 的必要一条. 但学 Python 这件事情,你可能和大多数人一样,下了一百次决 ...

  10. c++使用单向链表存储一组有序数据_数据结构笔试题基础

    第一章 数据结构与算法 一.算法的基本概念 计算机解题的过程实际上是在实施某种算法,这种算法称为计算机算法. 1.算法的基本特征:可行性,确定性,有穷性,拥有足够的情报. 2.算法的基本要素:算法中对 ...

最新文章

  1. github删除错误的commit并保留之前的提交
  2. [翻译 EF Core in Action 2.1] 设置一个图书销售网站的场景
  3. 腾讯DCI上线基于集中控制的SR-TE方案
  4. flask-restful接口
  5. LeetCode 其他部分 简单 Python实现
  6. 小程序模板消息报错41028。解决方法
  7. 单按钮启停电路实物图_什么是电路的主回路?什么是控制回路?它们之间有什么区别?...
  8. 小说APP网站源码运营版+在线采集
  9. 醉枕江山第五十二章 公主中的公主
  10. 零基础元宇宙AR Avatar制作教程
  11. 三十岁的男人应该有多少存款?
  12. 【C++】计算两个日期之间的差
  13. 关于报错django.core.exceptions.ImproperlyConfigured: mysqlclient 1.3.13 or newer is required; you hav
  14. JavaWeb学习笔记2 —— Web服务器简介
  15. 泰山OFFICE技术讲座:FreeType获取kerning函数FT_Get_Kerning研究
  16. 7-6厘米换算英尺英寸
  17. 政考网:一年最多可以参加几次公务员考试?
  18. Karamata 不等式
  19. 来黑马,赢得漂亮!(黑马11月开班时间)
  20. String比较大小

热门文章

  1. 人工智能的未来需要M1吗
  2. 难道这是残差结构的本质(addnorm)
  3. zabbix3.2自动发现批量监控redis端口状态
  4. 玩Android微信小程序版
  5. Python命令行参数学习
  6. Java并发编程高级篇(八):在执行器中取消任务
  7. 科技下的仓库,数据库
  8. 解决Mysql复制Relay log read failure 的问题
  9. noclobber:避免文件的重写
  10. 7个建议帮你完成更多的工作