描述性统计分析和可视化方法汇总(力求精简)
文章目录
- 一、为什么要描述和可视化
- 1. 统计研究的过程
- 2.描述性统计分析的作用
- 二、如何描述和可视化
- 1. 数据类型是基础
- 2. 单变量分布分析
- 3. 两变量相关性分析
- 4. 多变量交叉相关分析
- 小结
之前学过spss的探索性数据分析,在此分享以下之前学过的方法,重在精简,打开数据描述的思路,若有不清楚的地方,可以在留言区探讨。
一、为什么要描述和可视化
1. 统计研究的过程
2.描述性统计分析的作用
描述性统计分析属于整理数据这个环节,它的作用主要有以下几点:
- 描述某变量的分布信息
就是它长什么样子、高矮胖瘦,值大的多还是小的多等等。 - 数据筛查,发现缺失值、异常值
有关把握数据的质量,缺失和异常值对后续的分析影响很大。 - 发现和验证与其他变量的(相关)关系
变量多的时候,例如身高和体重有没有关系等。
二、如何描述和可视化
1. 数据类型是基础
不同的数据类型采用的数据描述方法也不同,因此需要先对变量的类型进行确定。统计中一般是用计量层次的角度对数据进行分类。
2. 单变量分布分析
单变量的描述,主要是看它的取值分布。
举例子,一个班级里学生的身高是连续变量,如何了解班级的身高分布呢?身高平均值、众数统计量等,画个直方图看看是不是符合正态曲线等等。
挂科与否,是离散型变量。如何了解分布呢? 挂科的人数(也就是频数),挂科占比等。画个图更直观。
另外,对于连续性变量,直方图看图形与钟形曲线吻合程度、箱线图看图形是否对称、P-P 图和 Q-Q 图可以用来比较数据是否符合指定分布.
3. 两变量相关性分析
相关关系是相对于函数关系来说的, 是指变量间确实存在、 但数量上不固定的相互依存. 这种关系不能用函数关系精确表达;同时,一个变量的取值不能由另一个变量惟一地确定;当变量 x 取某个值时,与之相关的变量 y 的取值可能有若干个;各观测点分布在一条直线或曲线周围.
相关分析要解决两个问题:
- 判明所考察的定量数据各属性之间有无关联,即是否独立.
- 在判定变量之间存在关联性后,用多种定量指标来刻画其关联程度.
4. 多变量交叉相关分析
这一块有挺多知识的,思路是,可以再原有图形的基础上,施加一个或多个变量,控制颜色、大小、标签等。主要是为了整个多个变量的同时,进行对比。
例如,y轴是价格、x轴是分类标准1,柱子上的是分类标准2,这个图,实现了三个因素的整合。只为了直观展示在两个分类变量下,价格的分布情况。
小结
图形 | 适用范围 | 控制轴 |
---|---|---|
条形图 | 单变量分类型频数、 | x=变量,y=频数,【颜色、柱子粗细、标签】 |
饼图 | 单变量分类型占比、 | 角度【颜色、标签】 |
直方图 | 单变量连续型 | |
茎叶图 | 单变量连续型 | |
箱线图 | 单变量连续型 | |
散点图 | ||
折线图 | ||
相关系数矩阵 | ||
热图 |
描述性统计分析和可视化方法汇总(力求精简)相关推荐
- 二、描述性统计分析及可视化
目录 描述性统计分析概述 示例 描述统计总结 一个分类变量 一个连续变量 两个分类变量 分类变量和连续变量 汇总表:两个分类变量+一个连续变量 描述性统计分析概述 python原始的数据类型:字符型. ...
- 描述性统计分析都用到哪些可视化图表?
正 文 来 源:知乎/作 者:Roar 转自:爱数据LoveData 本文内容是描述性统计分析,我觉得有必要弄清什么是描述性统计,于是去google了一下得到如下答案: 描述统计(Descript ...
- 数据分析方法-描述性统计分析
一.数据分析的分类与作用 二.数据分析方法-描述性统计分析
- 在R中对李克特量表(likert)数据进行可视化描述性统计分析,热力图、密度图、柱状图
在R中对李克特量表带数据进行可视化描述性统计分析 李克特量表是一种常用的社会调查问卷模式.常规论文中对多级的李克特量表数据大多计算均值来进行描述性统计分析,但均值较难表现样本整体分布状况,R中like ...
- R语言描述性统计分析:使用epiDisplay包的summ函数获取dataframe数据中每个变量的常用统计量、对每个变量进行汇总统计
R语言描述性统计分析:使用epiDisplay包的summ函数获取dataframe数据中每个变量的常用统计量.对每个变量进行汇总统计 目录
- python DataFrame常用描述性统计分析方法
python DataFrame常用描述性统计分析方法 文章目录 python DataFrame常用描述性统计分析方法 sum() 求和 mean() 求平均值 max() 最大值 & mi ...
- 使用Python可视化卷积神经网络方法汇总
介绍 深入学习中最具争议的话题之一是如何解释和理解一个经过训练的模型--特别是在医疗等高风险行业的背景下."黑匣子"一词经常与深度学习算法联系在一起,如果我们不能解释模型是如何工作 ...
- python数据分析学习——1.描述性统计分析
描述性分析 描述性统计分析是关于数据的描述和汇总.它使用两种主要方法: 定量方法以数值方式描述和汇总数据. 可视化方法通过图表,曲线图,直方图和其他图形来说明数据. 一般在数据分析的过程中,拿到数据不 ...
- 光滑噪声数据常用的方法_九大常用数据分析方法汇总
来源:数据宝典 转载:中国统计网 一.描述性统计 定义:描述性统计是一类统计方法的汇总,揭示了调查总体的数据分布特性.描述性统计分析要对调查总体所有变量的有关数据进行统计性描述,主要包括数据的频数分析 ...
最新文章
- 四象限法推导lm曲线_【老王讲放射】四象限理论
- Xamarin iOS开发实战上册-----2.2 添加和定制视图
- 后置通知(After Advice)
- Spring事务隔离级别,事务传播行为
- Druid 介绍及配置
- python线程,进程,队列和缓存
- andriod连接mysql测试工具,Android数据库调试工具
- [转帖]VBS 教程
- 《熊出没·原始时代》首映 导演点赞宋祖儿配音
- 巅峰对决!2020人工智能创新创业大赛总决赛评委阵容、项目亮点震撼揭晓
- 人工智能于交通系统而言
- 快速理解数据库函数依赖(平凡函数依赖、非平凡函数依赖、完全函数依赖、部分函数依赖、传递依赖)
- 2021高考成绩查询微信预约推送,2021高考微信推送文案内容
- android xp wifi连接不上,手把手解决xp系统电脑无线网络连接不上的处理技巧
- oracle与大学合作,深入合作 CUUG于哈尔滨师范大学成立Oracle WDP俱乐部
- php 调用java 接口
- JavaScript事件 DOMNodeInserted DOMNodeRemoved
- Python3 从零单排13_re模块
- 本周大新闻|上海培育元宇宙新赛道,星纪时代将推出XR产品
- 触摸菜单:纸质菜单终结者