举一个例子,铅笔、钢笔、圆珠笔、水彩笔、中性笔,它们的区别是什么?同理,spss、sas、excel 、python、powerbi ,这些常见的数据分析工具有什么区别?很显然,这两个问题是有共性的。这些都是数据处理类工具,但在功能侧重点是各有不同的:

Python- 通用编程语言,其中包含的数据处理类库可用于数据科学类分析excel - 一般数据量处理的办公软件 SAS- 金融投资数据建模常用工具之一SPSS- 经典统计学数学工具Power BI - 以数据模型以及语义层为核心的商业智能工具

让我们具体来看看,它们的使用场景是怎样,方便大家能够最简单高效选择适合自己的分析工具。

python

  • 关键词:  编程语言
  • 频次: 高频工具技能要求之一
  • 特点: 语言简单,具有数据结构化优势
  • 场景: 编程类数据分析
  • 难度: 一般

严格意义来说,python和其他几类不属于同一类,它是是编程语言,编程界有句至理名言,“人生苦短,我用Python”,没有python不能编地东西,有种“万物皆可盘”的意味。

主要优点:

1、简单:Python是一种代表简单主义思想的语言。阅读一个良好的Python程序就感觉像是在读英语一样。它使你能够专注于解决问题而不是去搞明白语言本身。

2、易学:Python极其容易上手,因为Python有极其简单的说明文档 。

3、速度快:Python 的底层是用 C 语言写的,很多标准库和第三方库也都是用 C 写的,运行速度非常快。

3、免费、开源:Python是FLOSS(自由/开放源码软件)之一。使用者可以自由地发布这个软件的拷贝、阅读它的源代码、对它做改动、把它的一部分用于新的自由软件中。FLOSS是基于一个团体分享知识的概念。

4、高层语言:用Python语言编写程序的时候无需考虑诸如如何管理你的程序使用的内存一类的底层细节。

5、可移植性:由于它的开源本质,Python已经被移植在许多平台上(经过改动使它能够工作在不同平台上)。

如何学习: 1、基本语法。包括数据类型和结构、变量、函数、逻辑语句(判断、循环)、匿名函数、错误处理、遍历和迭代、进程和线程、库的使用。2、一定的代码训练量。网上找一些代码训练题目,大量刷题熟练基本语法。3、基于Python语法的数据分析工具。包括scipy/numpy、pandas、matplotlib、scikit-learn。补充:

  • scipy/numpy:它是一个由多维数组对象和用于处理数组的例程集合组成的库。
  • pandas:是基于NumPy 的一种工具,具备强大的数据展示功能。
  • matplotlib:可以生成各种硬拷贝格式和跨平台交互式环境的出版物质量数据。
  • scikit-learn:机器学习库,可以对数据进行分类,回归,无监督,数据降维,数据预处理等等

推荐书目:《利用python进行数据分析》《python编程 从入门到编程》

Excel

  • 关键词: 办公软件
  • 频次: 数据分析普通技能
  • 特点: 满足日常数据分析需求
  • 场景: 一般数据量处理需求 
  • 难度: 简单

Excel是我们生活中最为常见的数据处理工具,功能太多,出版的书都够好几本新华字典了。但我们也没有必要完全学习所有的功能,有需则取即可。

主要优点:

1、数据透视功能:一个数据透视表演变出10几种报表,只需吹灰之力。

2、统计分析:其实包含在数据透视功能之中,但是非常独特,常用的检验方式一键搞定。

3、图表功能:这几乎是Excel的独门武功,其他程序望其项背而自杀。

4、高级筛选:这是Excel提供的高级查询功能,而操作之简单。非常超值享受。

5、自动汇总功能:这个功能其他程序都有,但是Excel简便灵活。

6、高级数学计算:只要一两个函数轻松搞定

如何学习: 1、基本操作。作为数据分析最常用的分析工具,需要掌握基本功能,比如透视表 ,刷选, 多列排序,数据导入分隔符设置 等。2、数据可视化。数据可视化能够让我们的数据更为直观展现出来,excel中 折线图,直方图,双坐标图,甘特图 等都需要熟练。3、基本函数。函数的使用能大大提高我们的工作效率,尤其是在数据量相对较大时候。其中基本函数包括:IF、Round函数、INT函数、Vlookup函数 等。推荐书目:《为什么精英都是excel控》

SPSS

  • 关键词: 统计分析工具
  • 频次: 特定领域使用较多
  • 特点: 侧重于统计分析类模型
  • 场景: 在预测、建模、机器学习有很多包
  • 难度: 一般

spss是学科数据定量分析的工具,所以在社会科学(如经济分析,市场调研分析)和自然科学等林林总总,几乎只要你想要稍微复杂点地看出一大串数据和各种表格之间的逻辑关系,都可以用spss做。不过对学习者的统计学能力要求较高。

主要优点:

1、操作简便:界面非常友好,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。

2、编程方便:只要了解统计分析的原理,无需通晓统计方法的各种算法,即可得到需要的统计分析结果。

3、功能强大:具有完整的数据输入、编辑、统计分析、报表、图形制作等功能

4、数据接口:能够读取及输出多种格式的文件。文本编辑器软件生成的ASCⅡ数据文件,Excel的*.xls文件等均可转换成可供分析的SPSS数据文件。

5、模块组合:SPSS for Windows软件分为若干功能模块。

6、针对性强:SPSS针对初学者、熟练者及精通者都比较适用。

如何学习:1、学好统计学基础。spsss作为学科定量分析工具,有一定的建模能力要求,所以学好统计学是根本。2、熟悉spss界面。有了统计学基础后,利用spss工具可“傻瓜式”导入导出数据进行相关的线性分析等。3、掌握建模分析思维。多了解相关分析模型,平时多积累理论知识点,丰富自己的知识架构。推荐书目:《SPSS统计分析基础教程》

SAS

  • 关键词:  统计分析工具
  • 频次:  金融投资数据建模常用工具之一
  • 特点:  金融大数据分析
  • 场景:  金融风控建模较多
  • 难度: 较高

SAS大多应用于金融、保险、调研、研究所等领域,也是制药行业为开发和评估药物提供统计分析的商用软件。不过sas对学习者的专业性要求较高,需要具备一定的编程语言能力,和较深的统计学基础,可能不太适用于刚入门的小白学习。

主要优点:1、功能强大,统计方法齐。SAS提供了从基本统计数的计算到各种试验设计的方差分析,相关回归分析以及多变数分析的多种统计分析过程。2、使用简便,操作灵活。SAS以一个通用的数据(DATA)步产生数据集,尔后以不同的过程调用完成各种数据分析。

3、提供联机帮助功能。使用过程中按下功能键F1,可随时获得帮助信息,得到简明的操作指导。

如何学习:SAS包含了多个工具模块,其模块按功能主要掌握四类:1、数据库部分:BASE, FSP, ACCESS,..2、分析核心:STAT, ETS, QC, OR, INSIGHT3、开发呈现工具:AF, EIS, GRAPH,...4、分布处理与数据仓库:CONNECT, WA,...

Power BI

  • 关键词: 商业工具
  • 频次: 使用频次较高
  • 特点: 开源,强调个性化与定制化
  • 场景: 满足大量数据定制化分析需求
  • 难度: 较高

Power BI是微软最新的商业智能(BI)概念,它包含了一系列的组件和工具。一提到它,很多人会拿tableau进行比较,我们可以简单来看一下。与tableau比较:1、tableau:操作简单,可视化;如果要在一个大企业内推广,tableau更容易,因为入门简单。但很多报表做不了。软件设计的太傻瓜,由几个大模块组成,导致了你想把大模块再细化,做不了。而且和ios一样,生态封闭。2、powerbi:可以做复杂报表,筛选、计算逻辑清晰,可自定义,但很多功能要用DAX编小程序,托拉拽能实现的功能很有限,不易入门。和Android一样,生态开放。推荐书目:《power BI商业数据分析项目实战》

总之,谈区别的时候,可以从目的和你的角色入手:你的目的是什么?你的角色是什么?

也许用哪一支笔都可以完成一篇文章,只不过是跟不跟手,费多大力的问题。

当搞清楚了自己的目的,选对角色,再谈具体的使用工具,这样也许工作效率会提高很多。

来源:中国统计网/知乎免责声明:来源于网络,仅供学习、交流使用,版权归原作者所有,如有问题及时联系我们删除。

arcgis直方图工具在哪_这些分析工具都分不清?别说你懂数据分析!相关推荐

  1. 程序崩溃 分析工具_程序分析工具| 软件工程

    程序崩溃 分析工具 A program analysis tool implies an automatic tool that takes the source code or the execut ...

  2. 第09章_性能分析工具的使用

    第09章_性能分析工具的使用 文章目录 1. 数据库服务器的优化步骤 2. 查看系统性能参数 3. 统计SQL的查询成本:last_query_cost 4.定位执行慢的 SQL:慢查询日志 4.1 ...

  3. 文本分析工具 数据科学_数据科学工具

    文本分析工具 数据科学 The Data Scientist is the "Sexiest job of 21 Century", by Harvard Business Rev ...

  4. python足球数据可视化_NBA数据分析_python可视化数据分析_可视化数据分析工具_可视化分析工具-帆软...

    夺冠没含金量!python和BI可视化分析,湖人赢在这点上. 在经历了很多很多之后,湖人队终于获得了总冠军,众望所归. 如果科比还在的话,一定也很自豪吧,毕竟上一次夺冠还是10年前. 那问题来了,为什 ...

  5. java 对比工具_Java几款性能分析工具的对比

    在给客户进行应用程序维护的过程中,我注意到一些关于高负载条件下的性能问题.理论上,增加对应用程序的负载会使性能有所下降,但是我认为性能下降的比率远远高于负载的增加,同时我也发现,性能可以通过改变应用程 ...

  6. php抓包分析工具下载,Wireshark(抓包分析工具) V3.2.1 32位多国语言安装版

    Wireshark是一款功能强大的抓包分析工具,该Wireshark可以轻松抓取网络数据,而且使用很简单,所以有需要的朋友赶紧下载吧! 功能介绍 1.Wireshark拥有许多强大的特性 包含有强显示 ...

  7. mysql慢日志分析工具_mysql慢查日志分析工具 percona-toolkit

    备忘自: http://blog.csdn.net/seteor/article/details/24017913 1. 工具简介 pt-query-digest是用于分析mysql慢查询的一个工具, ...

  8. android分析内存工具,Android Studio内存泄漏分析工具汇总

    Android Studio内存泄漏分析工具汇总 时间:2017-04-25     来源:Android开发学习网 在Android开发过程中,让人头疼的就是内存泄露问题了,很小的一个错误都会引起内 ...

  9. mysql+web日志分析工具_WEB日志格式及分析工具

    WEB日志是网站分析和网站数据数据整理最基础的数据,了解其格式和组成将有利于更好地进行数据的收集.处理和分析. 一.日志格式类型 目前常见的WEB日志格式主要由两类,一类是Apache的NCSA日志格 ...

最新文章

  1. Linux Tomcat 6.0安装配置实践总结
  2. JavaScript面向对象编程指南(五) 原型
  3. 实现对数组找最大最小数
  4. [CF1095F]Make It Connected
  5. Oracle 11g系统自动收集统计信息的一些知识
  6. asp.net 将此项目作为引用添加将导致循环依赖项
  7. java监听mysql某张表的insert操作_MySql轻松入门系列————第一站 从源码角度轻松认识mysql整体框架图
  8. 有了malloc/free为什么还要new/delete ?
  9. 2M口,电口,光口的区别
  10. elasticsearch索引模块缓存
  11. ado创建mysql数据库_ADO创建数据库文件(*.MDB) | 学步园
  12. html能不能连数据库,html下利用javascript连数据库
  13. java park_我可以在纯Java中实现park / unpark方法吗?
  14. oracle物理结构视频教学,oracle物理结构
  15. kali linux查看局域网下所有IP,并对指定IP实施局域网内攻击
  16. java工具类_16 个超级实用的 Java 工具类
  17. ORACLE 10g命令大全
  18. Kafka - which is larger than the maximum request size you have configured with the max.request
  19. twosum 两数之和 C++实现 java实现
  20. 当你输入信用卡号码的时候,有没有担心输错了而造成损失呢?其实可以不必这么担心, 因为并不是一个随便的信用卡号码都是合法的,它必须通过Luhn算法来验证通过。

热门文章

  1. 地质勘查土质分类图片_收藏必备!自然资源部:岩石、砾质、土质、泥质统一这样划分!...
  2. UE4之VR手柄和3D UI控件如何交互
  3. java放大缩小_如何用Java实现图形的放大和缩小?
  4. 传统呼叫中心与云呼叫中心哪个好
  5. 优秀的图文识别开源项目PandaOCR
  6. 手机端兼容iPhoneX刘海屏
  7. 基于重构误差的同构图分类模型
  8. 曼谷这些旅游景点文化地标推荐
  9. 日紫白飞星算法_九星紫白飞星规律
  10. 5个超实用的浏览器插件,让你的上网体验翻天覆地!