sql 获取两个月内数据_如何在3个月的时间内自学成为数据分析师?
从一名0基础的用户运营自学成为数据分析师,我花了大半年的时间,但是抛开工作时间,系统性的学习只花了3个月。
这篇文章会从学习资源和学习路径两个方面分享我的自学经验,希望能对大家有所帮助。
先来说说有哪些优质的学习资源
分析思维
对于一名数据分析师,最重要的就是分析思维,这里给大家推荐3本入门数据分析的必读读物:
这三本书中:
- 《啤酒与尿布》可以培养大家的分析兴趣
- 《金字塔原理》训练大家的结构化思维
- 《精益数据分析》给大家打下专业的数据分析基础
初期学习读这三本完全足够了,书单太长容易进收藏夹吃灰,毕竟万事开头难,能够开心愉快地学习才是坚持下去的基础。
关于分析思维,除了这三本书,大家还可以多学习一些常见的业务分析模型如漏斗模型、分层模型、留存模型、画像分析、路径分析,经典的还有有RFM、SWOT、PEST等等等等,直接百度搜索,然后阅读相关文章即可。
SQL
SQL是分析师必须熟练掌握的技能,毕竟取数永远是数据分析中绕不开的一步。
SQL入门学习直接推荐给大家这本《SQL必知必会》,大家记得购买最新版。
刷完本书后SQL的基础语法和原理基本上就搞懂了,每天两个小时,一周左右就能搞定。
学完《SQL必知必会》后,直接去sqlzoo做题,这是一个特别良心的sql练习网站,难度逐步递增,让你刷着刷着就学会了SQL。
SQL Tutorial/zh - SQLZOOsqlzoo.net
Python
Python课程方面推荐coursera上的《零基础 Python 入门 专项课程》,课程免费,认真看完就能入门。
https://www.coursera.org/specializations/pythonwww.coursera.org
但是编程语言一定要勤加练习,初期练习的话推荐大家和鲸社区的专栏,从基础入门一直到深度学习,专栏里都有项目可以学习参考。
社区专栏链接:
和鲸社区 - Kesci.comwww.kesci.com
推荐新手练习的项目:
和鲸社区 - Kesci.comwww.kesci.com
Python书籍方面推荐大家这本“松鼠书”《利用Python进行数据分析》,虽然这本书不适合直接拿来上手Python,但是适合当语法速查手册,在大家有一定基础后进行查缺补漏。
R
R是一门由统计学家专门设计的数据分析语言,在大规模数据分析上和Python的作用是一样的。
R的学习直接推荐阿里云大学上免费的R课程:
大数据之R语言速成与实战 - 阿里云大学 - 官方网站,云生态下的创新人才工场edu.aliyun.com
这个课程系统全面,撸一遍,R基本上就会用了。
AI算法
这里强推吴恩达老师的《Machine Learning Yearning》,这本书深入浅出、提纲挈领,看完马上明白机器学习的基础原理和应用。
如果想要练习,建议大家跟着网易云课堂或者coursera上吴恩达老师的课程系统地进行学习:
https://mooc.study.163.com/smartSpec/detail/1001319001.htmmooc.study.163.com
当然,如果想要深入学习算法原理,推荐给大家“西瓜书”和“花书”。
回顾我刷这两本书的过程还是很痛苦的,但是刷完之后才真正弄懂了现代算法技术的原理。大家有时间的话一定要静下心来啃完这两本书。
注意,不要光看不练,看书的同时一定要找些相近的项目和数据进行练习,自己敲一遍代码才能更加真正领会。
除了书籍和课程,大家也可以在Kaggle、天池、和鲸、Datafoutain和FlyAI等竞赛社区找一些比赛练练手,如果能有不错的排名,在简历上会是一个加分项。
统计学
统计学一直是转型数据分析的小伙伴们比较担心的地方。
因为很多人的数理基础不是很好,对于毕业后的大多数小伙伴,拿出专门的时间学习统计学已经不太现实,并且很容易在初期挫伤大家的学习积极性。
所以我并不建议大家在学习初期把自己绕到数理基础里。初期宝贵的时间应该拿来培养兴趣,上手一门具体的生产力工具(Excel/Tableau/PowerBI/Python/R)。
真正适合大家的学习方法应该是在用到统计学等专业知识的时候再具体补充,例如:
- 用到AB测试的时候详细学习假设检验
- 用到箱形图的时候再补充描述性统计
所以统计学的学习资料就推荐一本李航的《统计学习方法》,供大家补充知识点之用:
再强调一下,没有数理基础的小伙伴一定不要直接钻研统计学,需要用到的时候再去补充才是统计学等专业知识最高效的学习方式。
Excel
快速通关Excel直接推荐刘伟老师的课程,大家可以去B站搜索“刘伟Excel"免费学习,也可以去刘伟老师的官网购买课程。
则秀教育 - 强大的在线教育培训 - Powered By EduSohowww.zesow.com
刘伟老师的Excel课程非常非常良心,从函数到VBA基本上都讲完了,课程系统高效,跟他过一遍就不用了再学Excel了。
Tableau
目前市面上的Tableau书籍和教程都比较老,很多还是照搬的官方文档,所以Tableau这方面没有特别好的学习资源推荐。
而我自己的Tableau是在一次Linda老师的线下课程上学会的,高阶技能则一直在请教Tableau第一届可视化大赛的冠军——纪洋。
Linda和纪洋都是我第一份工作上的业务伙伴,特别感谢他们一直以来对我在Tableau学习上的帮助!
但是我会在《数据分析300讲》中先从Tableau讲起,希望自己可以尽自己一点小小的努力补充这部分学习内容的空白,为后来的小伙伴们铺平学习的道路。
这里推荐我自己的专栏《数据分析300讲》,我会尽力把Tableau的学习内容做得有趣而又系统,欢迎大家与我在专栏中交流~
数据分析300讲zhuanlan.zhihu.com
推荐完了学习资源,再来说说我的学习顺序与经验
一、初学阶段一定要快速上手一门分析工具,保持学习的新鲜感,建立持续的正反馈
一开始我是直接从Python开始上手数据分析的,因为那个时候Python特别火,感觉数据分析就是要用Python做才显得专业。
学了之后才发现学Python数据分析前期投入太大了,基础语法要学3天,然后才能开始做一些基础的数据分析,并且出图效率还特别低。
后来接触了Tableau,一天就上手了,惊奇地发现原来数据分析可以这么高效有趣。
往往Python需要很多代码才能解决的图表,Tableau只需要拖拽几步就可以轻松实现。
在初学阶段我基本都在补充图表知识和分析框架,并且深入学习Tableau这款高效的生产力工具,用来实现自己的分析思路。
但这些分析都是基于现有的数据,没有直接连接到数据库,所以就没学SQL。
二、熟练掌握一门分析工具后,学习SQL提升取数和分析效率
熟练掌握Tableau后,要分析的东西太多,数据需求实现得又太慢,这个时候就不得不用SQL自己取数了。
直接请教了公司的数据分析师如何学习SQL,分析老哥甩给了我一本《SQL必知必会》,让我看完之后去sqlzoo刷题。
因为那个时候我的很多分析已经必须要直连数据库才能进行,所以学习SQL的动力很大,不到一周看完了《SQL必知必会》,3天就刷完了sqlzoo。
从此之后,我再也不用提取数需求了,想要看什么数都可以用SQL自己取出来,特别特别开心。
三、遇到大规模的数据处理和建模再学Python
其实Tableau+SQL已经能解决我当时99%的数据分析问题了,不过随着分析技能的提升,想看的数越来越大,数据也越来越复杂。
虽然Tableau百万级的数据都能随便玩,但是大规模的数据处理和建模上还是有短板的,这个时候就必须借助Python或R来解决问题了。
Python和R我都学过,学下来的感觉是Python更全能,所以当初主要学了Python,R只是过了一遍。
实际应用过程中,Python在商业数据分析场景下比R更流行,招聘需求也更大,所以只学一个的话,我推荐大家学Python。
四、最后补充数据爬虫、数据挖掘、统计学等知识
等SQL取数+Tabelau分析+Pyhon处理与建模的基本工作流程熟练后,我们可以开始补充数据爬虫、数据挖掘、统计学等知识。
具体如何学习这些知识取决于工作场景。
以爬虫为例,工作中我只需要用Pyhton爬高德的API数据,就算有网页数据,量级不大的话我也直接用后羿采集器(一款巨好用的爬虫工具)解决。
后羿采集器_真免费!导出无限制网络爬虫软件_人工智能数据采集软件www.houyicaiji.com
专业的爬虫所需要的背景知识特别多,学会了基本赶上半个开发,所以我也是需要什么学什么,实在解决不了会直接提爬虫需求。
至于数据挖掘和统计学也是同理,需要的时候再去学,一点点拓展自己的知识边界。
结语
以上就是我在3个月的时间内自学成为数据分析师的全部经验分享啦~
关于如何在工作中应用学到的数据技能,大家可以看我的上一篇文章:
数据戴师兄:毕业半年,我如何用数据技能让自己薪资3翻zhuanlan.zhihu.com
在熟练掌握这些数据技能和工具后,通过海投和面试,我成功拿到了7个数据分析岗位的offer,具体的笔试面试经验我会在下一篇文章中跟大家分享。
觉得这篇自学经验好的小伙伴们可以给我点个赞,觉得不好的欢迎大家在评论区与我讨论~
最后感谢大家的支持,希望大家都能早日入门数据分析,加油加油!
sql 获取两个月内数据_如何在3个月的时间内自学成为数据分析师?相关推荐
- jsp在mysql中删除数据_如何在jsp页面中删除数据库中的数据
如何在jsp页面中删除数据库中的数据 各位大虾! 我想在jsp页面上写一个按钮功能,从而动态的删除数据库中的一行数据. 不知道怎么实现 这是我写的一段代码 数据库是MySql UserBean p3= ...
- 怎么提取pdf中的表格数据_如何从pdf第1部分中提取表格数据
怎么提取pdf中的表格数据 In this article, we talk about the challenges and principles of extracting tabular dat ...
- python 抓取解析接口数据_[干货]用python抓取摩拜单车API数据并做可视化分析(源码)...
原标题:[干货]用python抓取摩拜单车API数据并做可视化分析(源码) 在APP中能看到很多单车,但走到那里的时候,才发现车并不在那里.有些车不知道藏到了哪里:有些车或许是在高楼的后面,由于有GP ...
- .net 从txt中读取行数据_【VBA项目】从指定文件中读取数据并绘制图表
VBA 是一种很久远的编程语言,但并不过时.在满足以下两个条件时,借助 VBA 可以极大的提升生产率,降低出错率: 你的电脑上不允许自主安装软件: 你需要执行的工作中大部分的步骤都是固定且重复的. 项 ...
- python爬实时数据_如何用python爬取实时更新的动态数据?
爬虫实时更新 互联网是绝对豪爽的数据源.不幸的是,倘若没有轻易构制的CSV文献可供下载和说明,则绝大部门.倘若要从很众网站拘捕数据,则必要测验举办收集抓取. 倘若您照样一个初学者,请不要忧愁-正在数据 ...
- pythonrequests发送数据_在python中使用requests 模拟浏览器发送请求数据的方法
在python中使用requests 模拟浏览器发送请求数据的方法 如下所示: import requests url='http://####' proxy={'http':'http://#### ...
- datetime插入数据_量化学习:聚宽jqdatasdk对接vnpy的数据服务
-- 本篇文章 by 丁智 数据服务:使用聚宽jqdatasdk获取分钟数据按vnpy的Bar格式导入至mongodb中 提供downloadAllMinuteBar(),可以通过定时任务的形式,按v ...
- docker 容器共享数据_如何在Docker容器之间共享数据
docker 容器共享数据 介绍 (Introduction) Docker is a popular containerization tool used to provide software a ...
- origin处理多组红外数据_【图文】用Origin作多组红外数据图
场景 有时候我们需要多组红外光谱作在同一张图上,以做对比,类似于下图,我们该怎么做呢. 步骤 打开OriginPro软件,博主用的8.6版本的. 依次点File->Import->CSV( ...
最新文章
- 【Android 应用开发】 Android 相关代码规范 更新中 ...
- android四大组件五大存储六大布局,物联网研报:物联网进入规模化应用时代
- A53 cache的架构解读
- Python-理解装饰器
- 信奥中的“骗”分神技 ---“打表”
- tapestry autocomplete 更改样式及定位
- seata分布式事务一致性锁机制如何实现的
- java的如何创建js_[Java教程]JS创建事件的三种方式(实例)
- 多线程的那点儿事(之大结局)
- eureka集群 ha_EurekaServer集群配置
- 在 OSX 10.9.4 上编译安装 FastDFS 及其 PHP 扩展
- layui-treeTable v2.0添加搜索功能
- 打造linux回收站功能
- 数学分析:有理数的稠密性证明
- 程序员吐槽培训班简历造假,经验包装竟拿到阿里外包26k的offer
- sql server 按拼音分类排序的功能
- maplesim matlab,MapleSim 2020
- vue 未登录 登录超时跳转到登录页
- 2022商业地产百货零售行业IT及数字化转型分析
- 模拟定时自动关机编程程序源码
热门文章
- 自嗨锅要持续嗨,还得碾碎这四个“绊脚石”
- mysql安装尝试创建新用户失败_Linux MySQL yum安装 创建新用户
- 文件头_常见文件文件头
- matlab里面板有什么作用,MATLAB轻松享受GPU的强大功能
- css样式 数据展示,教程:使用CSS设置数据样式
- 网络安全比赛理论答题(七)
- Buuctf(pwn) ciscn_2019_n_5
- 一篇文章学会Python函数重写,每天进步一个知识点
- Python 模块初始化的时候,发生了什么?
- ubuntu装双系统win7和linux,Ubuntu下安装WIn7(双系统)