统计学之描述性统计(一)

1、描述性统计分析
描述性统计分析主要是对所收集的数据进行分析,得出反映客观现象的各种数量特征的一种分析方法,它包括数据的集中趋势分析、数据离散程度分析、数据的频数分布分析等,描述性统计分析是对数据进一步分析的基础。

2、数据的集中趋势
集中趋势又称 “数据的中心位置”,它是一组数据的代表值。集中趋势的概念就是平均数(Average)的概念,它能够对总体的某一特征具有代表性,表明所研究的对象在一定时间、空间条件下的共同性质和一般水平。

2.1平均数

算术平均数(Arithmetic mean): 统计学术语,是表示一组数据集中趋势的量数,是指在一组数据中所有数据之和再除以这组数据的个数。是数据中心趋势的主要度量指标。对于由n个数据组成的X, 平均值是总和除以总量(N):

加权平均数:是不同比重数据的平均数,加权平均数就是把原始数据按照合理的比例来计算。
若n个数据中,X1出现f1次,X2出现f2次,…,Xk出现fk次,那么:

叫做X1,X2,…,Xk的加权平均数。f1,f2,…,fk分别是X1,X2,…,Xk的权,其中f1+f2+…+fk=n。

几何平均数(Geometric mean):是n个数据的连乘积的开n次方根,那么对于数据X1,X2,…,Xn的几何平均数为:

2.2中位数(Median): 代表一个样本、种群或概率分布中的一个数值,其可将数值集合划分为上下两部分。对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。如果观察值有偶数个,通常取最中间的两个数值的平均数作为中位数。

对于定量数据X,中位数是数值大小位于中间(奇偶总量处理不同)的值:

2.3 众数(Mode): 在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个)。另有定义就是一组数据中出现次数最多的数值,叫众数,有时众数在一组数中有好几个。对于定性数据来说,众数是出现次数最多的值。

3、数据的离散程度

数据的离散程度即衡量一组数据的分散程度如何,其衡量的标准和方式有很多,而具体选择哪一种方式则需要依据实际的数据要求进行抉择。主要包括以下方式:

3.1数值型数据:方差、标准差、极差、平均差

3.1.1方差(Variance)和标准差(Standard Deviation)

方差 是在概率论与统计方差衡量随机变量或一组数据时离散程度的变量。统计中的方差(样本方差)是各个数据分别与其平均值之差的平方的和的平均数。
标准差 是方差的算术平方根。它反映的也是数组内个体间的离散程度。
对于一组数据X1,X2,…,Xn,则方差为:

标准差为:

3.1.2极差(Range) 是指一组测量值内最大值与最小值只差,又称范围误差或全距。它是标志值变动的最大范围,它是测定标志变动的最简单的指标。即:

3.1.3平均差是对一组数据中各个变量与其算术平均数的离差绝对值的算术平均数。它综合反映了总体各变量的变动程度。平均差越大,则表示标志变动度越大,反之则表示标志变动度越小。一组n个数据X1,X2,…,Xn。则平均差为:

3.2 顺序数据:四分位差

四分位数(Percentage): 是将一组数据由小到大(或由大到小)排序后,用3个点将全部数据分为四等份,与3个点上相对应的变量为四分位数,分别记为Q1(第一四分位数,25%)、Q2(第二四分位数,50%)、Q3(第三四分位数,75%)。

四分位差是四分位数中的Q3(第三四分位数)到Q1(第一四分位数)之间的距离的一半,一般记为Q。

四分位差越小,说明中间的数据越集中;四分位差越大,则意味着中间部分的数据约分散。

3.3分类数据:异众比率(Variation ratio)

异众比率:又称离异比率或变差比,是指的是非众数的次数与全部变量值总次数的比率,即众数不能代表的那一部分变量值在总体中的比重。
对于一组数据X1,X2,…,Xn,出现的频率分别为f1,f2,…,fk。其中众数出现的次数为fm,则异众比率为:

异众比率的作用是衡量众数对一组数据的代表程度。异众比率越大,说明非众数组的频数占总频数的比重越大,众数的代表性就越差;异众比率越小,说明非众数组的频数占总频数的比重越小,众数的代表性越好。

4、相对离散程度

离散系数:即变异系数,针对不同数据样本的标准差和方差,因数据衡量单位不同其结果自然无法直接进行对比,为出具一个相同的衡量指标,则进行了离散系数的计算。离散系数为一组数据的标准差与平均数之比。离散系数为:

统计学之描述性统计(一)相关推荐

  1. No.01统计学之数据的描述性统计

    数据的描述性统计主要包括以下几部分: 数据的集中趋势: 众数.中位数.平均数.分位数 算术平均数.加权平均数.几何平均数 数据的离中趋势: 数值型数据:方差.标准差.极差.平均差 顺序数据:四分位差 ...

  2. 统计学之数据的描述性统计(基础)

    数据的描述性统计 一篇笔记,至少我还在努力 目录: 数据的集中趋势: 众数,中位数,平均数,分位数,极差 算术平均数,加权平均数,几何平均数 数据的离中趋势: 数值型数据:方差,标准差,极差,平均差 ...

  3. 应用统计学与R语言实现学习笔记(三)——描述性统计

    Chapter 3 Descriptive Statistics 本篇是第三章,内容是描述性统计.同时在这一章会开始渗透R语言的相关内容.但整体还是以理论为主. Chapter 3 Descripti ...

  4. python数据分析及可视化(一)课程介绍以及统计学的应用、介绍、分类、基本概念及描述性统计

    数据分析及可视化介绍 这门课涉及多个库,其中Numpy用于数值运算:Pandas用于数据处理:Matplotlib.Seaborn.Pyecharts用于数据可视化. 数据分析介绍 概念 用适当的统计 ...

  5. 数据挖掘之统计学基础(1):【理论】描述性统计

    0x00前言 描述性统计是一种汇总统计,用于定量描述或总结信息集合的特征.描述性统计的对象既可以是总体,也可以总体的一部分即是样本. 描述性统计分为集中趋势和离散趋势. 0x01集中趋势 集中趋势又称 ...

  6. 统计正数和负数的个数然后计算这些数的平均值_描述性统计-统计学基础

    前言 所谓"工欲善其事必先利其器",作为一名数据分析师,统计学知识就是手中的"器",亦是数据分析的基础.在日常工作中统计学知识用到最多的就是描述性统计方法,有些 ...

  7. 统计学基础1:描述性统计(数据的离散度、极差、方差、标准差)

    python 统计学基础1:描述性统计 一.频数 二.数据的位置(平均数.中位数.众数.百分位数) 三.数据的离散度(极差.偏差.方差.标准差) 3.1.极差(Range) 3.2 .平均绝对偏差(M ...

  8. 机器学习数学基础:数理统计与描述性统计

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:吴忠强,Datawhale优秀学习者 所谓机器学习和深度学习, ...

  9. 发掘数据中的信息 -- 数据探索之描述性统计

    在如今这个大数据时代,数据的价值得到普遍的认可.可是,数据为什么有价值呢?如果,数据只是静静地躺在服务器中,又或是默默地流淌在网络中,它们又能带来什么? 数据就如同海边的沙子,潮起潮落,岁月轮转,它们 ...

最新文章

  1. McAfee安装后无法启动服务的解决办法
  2. ajax基本用法介绍
  3. 12.MapReduce第2部分(WordCount词频统计、自然连接)
  4. css 用direction来改变元素水平方向,价值研究。
  5. 同一接口有多个实现类,怎么来注入一个指定的实现?@Resource、@Autowired、@Qualifier
  6. leetcode 40. 组合总和 II 思考分析
  7. 内网和外网的区别_在家办公不再难,花生壳盒子助你内网穿透一臂之力
  8. java写算法之二叉搜索树查找
  9. cassss服务未启动_不要再本地启动项目调试了,试SpringBoot远程调试你会发现新大陆!...
  10. 【机器学习】广义回归神经网络(GRNN)的python实现
  11. zabbix详解(十五)——zabbix proxy配置实战
  12. 模式识别算法:SVM支持向量机
  13. python分布式定时任务_Python 定时任务框架 APScheduler 详解
  14. 离散数学(五):命题逻辑的推理理论
  15. 心理学与生活 - 情绪与情感
  16. ​特拉华大学彭曦教授招收2021 Fall全奖博士生
  17. php更换banner图片,如何替换banner上的图片?
  18. 金融类APP上架经验分享
  19. 使用Gstreamer播放未知格式视频(python)
  20. 【CodeForces - 869】 A B C E 【组合数打表】

热门文章

  1. 技术管理者对知识组织的认识
  2. Sublime3安装,使用教程以及优秀的插件推荐
  3. mip-NeRF代码debug
  4. 关于前端 后端 数据库 时间的设置与传递
  5. linux u盘修复引导文件,centos bootloader安装到u盘后修复方法
  6. Dos 命令(2021/3/1)
  7. 51nod 1113 矩阵快速幂 模板
  8. 51nod 矩阵快速幂模版题
  9. 【python 处理亿级数据】使用 Pandas 处理亿级数据
  10. 购买安防监控摄像头时如何省钱