数据分析师常用工具有哪些?初学者必看
我给你一份数据分析师常用工具指南,按照这份指南,小白也能成为数据分析高手!
这是一份入门到熟练的工具指南,并不包含数据挖掘等高阶内容。
Step1:Excel学习掌握
所用的工具正是职场中最常用的Excel!
①重点函数学习
重点是了解各种函数:Vlookup、sum,count,sumif,countif,find,if,left/right,时间日期函数、文本函数
②数据透视表学习
我曾说过,如果Excel只能学习一个功能,那唯一能入选的就是数据透视表。
掌握vlookup和数据透视表是最具性价比的两个技巧。学会vlookup,SQL中的join,Python中的merge很容易理解。学会数据透视表,SQL中的group,Python中的pivot_table也是同理。
这两个搞定,基本10万条以内的数据统计没啥难度,80%的办公室白领都能秒杀。
Step2:数据可视化
所用工具:PowerBi、Excel
数据分析界有一句经典名言,字不如表,表不如图。
数据可视化是数据分析的主要方向之一。首先要了解常用的图表:
Excel的图表可以100%完成上面的图形要求,但这只是基础。后续的进阶可视化,势必要用到编程绘制。为什么?比如常见的多元分析,你能用Excel很轻松的完成?但是在IPython只需要一行代码。
其次掌握BI,下图是微软的BI。
BI(商业智能)和图表的区别在于BI擅长交互和报表,更擅长解释已经发生和正在发生的数据。将要发生的数据是数据挖掘的方向。
BI的好处在于很大程度解放数据分析师的工作,推动全部门的数据意识,另外降低其他部门的数据需求(万恶的导数据)。
BI市面上的产品很多,基本都是建立仪表盘Dashboard,通过维度的联动和钻取,获得可视化的分析。最后需要学习可视化和信息图的制作。
Step3:数据库学习
所用工具:SQL
Excel对十万条以内的数据处理起来没有问题,但是互联网行业就是不缺数据。但凡产品有一点规模,数据都是百万起。这时候就需要学习数据库。
越来越多的产品和运营岗位,会在招聘条件中,将会SQL作为优先的加分项。
SQL是数据分析的核心技能之一,从Excel到SQL绝对是数据处理效率的一大进步。
学习围绕Select展开。增删改、约束、索引、数据库范式均可以跳过。主要了解where,group by,order by,having,like,count,sum,min,max,distinct,if,join,left join,limit,and和or的逻辑,时间转换函数等。如果想要跟进一步,可以学习row_number,substr,convert,contact等。另外不同数据平台的函数会有差异,例如Presto和phpMyAdmin。再有点追求,就去了解Explain优化,了解SQL的工作原理,了解数据类型,了解IO。以后就可以和技术研发们谈笑风生,毕竟将“这里有bug”的说话,换成“这块的数据死锁了”,逼格大大的不同。SQL的学习主要是多练,网上寻找相关的练习题,刷一遍就差不多了。
好了,经过这三步之后,你已经具备数据分析基本功力,剩下的需要训练的就是你的思维和实际的业务分析能力了。
鉴于你是传统会计专业出身,那就需要考虑目前你是需要往哪方面发展,一般数据分析师职业规划有单纯的数据分析岗、数据建模岗。
下面我们就说说一般数据分析师常用的工具有哪些?
1、数据处理工具:Excel
数据分析师,在有些公司也会有数据产品经理、数据挖掘工程师等等。他们最初级最主要的工具就是Excel。有些公司也会涉及到像Visio,Xmind、PPT等设计图标数据分析方面的高级技巧。数据分析师是一个需要拥有较强综合能力的岗位,因此,在有些互联网公司仍然需要数据透视表演练、Vision跨职能流程图演练、Xmind项目计划导图演练、PPT高级动画技巧等。
在Excel,需要重点了解数据处理的重要技巧及函数的应用,特别是数据清理技术的应用。这项运用能对数据去伪存真,掌握数据主动权,全面掌控数据;Excel数据透视表的应用重在挖掘隐藏的数据价值,轻松整合海量数据:各种图表类型的制作技巧及Power Query、Power Pivot的应用可展现数据可视化效果,让数据说话。因此想从事数据分析岗位的,需要快速掌握快各种Excel数据处理与分析技巧。
2、数据库:MySQL
Excel如果能够玩的很转,能胜任一部分数据量不是很大的公司。但是基于Excel处理数据能力有限,如果想胜任中型的互联网公司中数据分析岗位还是比较困难。因此需要学会数据库技术,一般Mysql。你需要了解MySQL管理工具的使用以及数据库的基本操作;数据表的基本操作、MySQL的数据类型和运算符、MySQL函数、查询语句、存储过程与函数、触发程序以及视图等。比较高阶的需要学习MySQL的备份和恢复;熟悉完整的MySQL数据系统开发流程。
3、数据可视化:Tableau & Echarts
如果说前面2条是数据处理的技术,那么在如今“颜值为王”的现在,如何将数据展现得更好看,让别人更愿意看,这也是一个技术活。好比公司领导让你对某一个项目得研究成果做汇报,那么你不可能给他看单纯的数据一样,你需要让数据更直观,甚至更美观
如何理解数据可视化?像我们以前上学的时候学过的柱状图,饼状图,也是数据可视化的一种。只是在现在,简单的柱状图已经不能满足工作所需。目前比较流行的商业数据可视化工具是Tableau & Echarts。
Echarts是开源的,代码可以自己改,种类也非常丰富,这里不多做介绍,可以去创建一个工作区了解下。
4、大数据分析:SPSS & Python& HiveSQL 等
如果说Excel是“轻数据处理工具”,Mysql是“中型数据处理工具”那么,大数据分析,涉及的面就非常广泛,技术点涉及的也比较多。这也就是为什么目前互联网公司年薪百万重金难求大数据分析师的原因
大数据分析需要处理海量的数据,这对于数据分析师的工作能力要求就比较高,一般来说,大数据分析师需要会
(1)会使用Hive的SQL方法HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。知道Hive如何在Hadoop生态系统进行数据分析工作。
(2)会一些SPSS modeler基础应用,这部分技能对应数据建模分析师
(3)何使用R语言进行数据集的创建和数据的管理等工作;会使用R语言数据可视化操作,让学员学会如何用R语言作图,如条形图、折线图和组合图等等;是R语言数据挖掘,本部分数据挖掘工程师
(4)用Python来编写网络爬虫程序,从页面中抓取数据的多种方法,提取缓存中的数据,使用多个线程和进程来进行并发抓取等
总结一下:
写在最后
1、自身定位很重要
以上所有介绍的这些技能,都是根据你的自身定位而言,如果你定位只是小企业的数据分析岗位,那你也许只要把Excel玩的很6就可以了。但是从长远来看,这部分工作岗位,终将会被大数据分析所取代。这也就是为什么之前所说互联网公司重金难求大数据分析师了。
2、终身学习很重要
为什么这么说,你会发现这个是时代的脚步越来越快了,你一不学习就很容易被时代淘汰,暂时把自己定位小型企业数据分析师的人,别忘了还是要去学习现在更流行的更有趋势的技术。自己的工作领域能跟互联网挂钩的尽量往上靠,毕竟这是大势所趋。
最最后
善用数据分析师常用工具,祝愿大家早日成为一名优秀的数据分析师!
数据分析师常用工具有哪些?初学者必看相关推荐
- python新手入门英语词汇_python常用英语单词词汇 -初学者必看
1. Darcula IntelliJ IDEA自带的黑色主题名称,Android Studio是基于IntelliJ IDEA的. 2. Appearance /prns/ n. 外观: 3. Cu ...
- 数据分析师常用的数据分析方法有哪些?
很多做数据分析或者刚接触数据分析的小伙伴,不知道怎么做数据分析.一点思路都没有,今天就给大家盘点数据分析师常用的数据分析方法.希望看完此文的小伙伴,有一个清晰的数据分析思维. 方法论和方法有什么区别? ...
- 数据可视化常用工具推荐
数据可视化是将数据分析的结果以图形.表格等形式展示出来,这样能我们更加清晰.明了的理解分析结果.判断数据走势等,让没有进行过数据分析的人也能清楚的了解数据中所含有的规律.趋势等.下面小编将向大家介绍几 ...
- 开课吧:数据分析师常用的分析方法有哪些?
作为一名合格的数据分析师,掌握良好的分析方法论是必然需要掌握的,为了能够更好地掌握数据分析师,需要搞明白数据分析师常用的分析方法有哪些. 数据分析师常用的分析方法包括: PEST分析法 PEST为一种 ...
- arma模型_Eviews经典案例 | 初学者必看!ARMA模型精讲
[本期分析师介绍]希音老师,<数据分析学堂>金牌分析师,对eviews的时间序列.ARMA.VAR.VECM.ARCH.GARCH等操作有深入的研究和实战经验,累计服务客户1000+.今天 ...
- 初学者必看篇之国产数据库---达梦
初学者必看篇之国产数据库-达梦 需要了解的可以点进去看看----达梦官网 首先,写这篇文章的目的是为了把学到的新知识做个总结梳理,同时我也希望在学习的过程中把一些需要注意的细节和大家分享,正所谓,共同 ...
- Qt Designer入门教程 初学者必看
在Linux下,一个非常流行的RAD工具就是Qt Designer.它是嵌入式公司 Trolltech的Qt软件包的一个组成部分. Qt Designer入门教程 初学者必看是本文要介绍的内容,不说这 ...
- 简单的CreateRemoteThread例程-初学者必看
简单的CreateRemoteThread例程-初学者必看 // _remotethreaddemo.cpp : Defines the entry point for the console app ...
- myeclipse文档链接oracle,[数据库]MyEclipse 连接Oracle数据库(初学者必看)
[数据库]MyEclipse 连接Oracle数据库(初学者必看) 0 2015-05-06 22:03:18 前言:刚接触Oracle数据库,便有一个需求,编写控制台程序,实现主人登录.数据库为Or ...
- led驱动电源初学者必看_初学者:如何在Windows 8中查看Metro应用程序的已用驱动器空间...
led驱动电源初学者必看 In Windows 8 there is no obvious way of checking how much space each Metro app is takin ...
最新文章
- iPad随想:苹果的妙招、谷歌的尴尬和中移动MM的局限
- 努比亚红魔有人脸识别_魅族魅蓝6T、努比亚红魔Mars电竞手机、华为畅享10Plus对比...
- 2019年猪年海报PSD模板-第四部分
- 使用MNIST数据集,在TensorFlow上实现基础LSTM网络
- iis7 运行 php5.5 的方法
- visual studio 2019 未能在命名空间“System.IO.Ports”中找到类型名“SerialPort”
- 2020亚太内容分发大会 阿里云荣获“边缘计算领航企业”奖
- 【BZOJ2095】【POI2010】Bridge 网络流
- Android获取图片资源的4种方式
- 推荐系统实战1——什么是推荐系统与常见的推荐系统评价指标
- 从极速号码魔方软件中获取手机号码的城市号段归属地数据
- 基于python flask的网上商城源码 mysql数据库
- 超好用的数学公式识别软件mathpix!
- 智能柜子锁方案开发,蓝牙智能防盗。
- python读取写入pickle、npy格式文件(代码+注释)
- 2015武汉大学计算机学院录取,2015年武汉大学计算机专业研究生录取名单
- 万丈高楼平地起,勿在浮沙筑高台--论程序员基础知识的重要性
- 短视频内容创作:内容发给谁?为什么发?发什么?以什么形式发?
- 数学建模国赛经验分享
- 在UBUNTU中使用北通USB游戏手柄
热门文章
- JavaScript实现语音助手核心代码
- 给大家推荐一款好用的背单词APP(目前只支持苹果手机)
- 触动人心:如何设计优秀的iPhone应用
- 大数据周周看:金融科技公司融360赴美IPO,小蓝单车人去楼空,用户押金退还困难
- 【转】Ogre 1.7版本重大改进by 诡辩
- pip3.7.5安装环境依赖onnxruntime、onnx、numpy、skl2onnx
- 数据库索引的填充因子
- 现代电子计算机数学理论基础,知到食品营养学(暨南大学)2020网课答案
- spring data jpa 多表UNION ALL查询按条件排序分页处理:未搜到方法,解决后记录:2018年11月13日15:22:00
- 文本分类(0)——scrapy爬新浪滚动新闻