前言

这一章主要介绍了反映数据分布特征的几个特征值以及其计算方法、特点及其应用场合。

1. 集中趋势的度量

分类数据

众数是一组数据中出现次数最多的变量值,用M0表示。

比如 1080 215 1080 758 489 258 这一组数据中1080出现的次数最多,所以该组数据的众数为1080,众数是不受数据中极端值的影响。
顺序数据

中位数是一组数据排序后处于中间位置上的变量值。

未排序的数据不具备这一特征值。

中位数位置 = (n + 1)/ 2,n为数据个数

四分位数

四分位数也称四分位点,它是一组数据排序后处于25%和75%位置上的值。四分位数通过3个点将全部数据等分为4部分。

设下四分位数QL(处在25%位置上的数值),上四分数为QU(处在75%位置上的数值):
QL位置 = n / 4
QU位置 = 3n / 4

值的计算:
分位数值 = 下侧值 + (上侧值 - 下侧值)× 0.25 or 0.75
下四分位数乘0.25,上四分位数乘以0.75,其中下侧值和上侧值是确定分位数位置之后相临近的两个值,比如下四分位数的位置为2.25,那么它的下侧值则是位置为2对应的数值,上侧值为位置为3对应的数值
数值型数据: 平均数

平均数也称为均值,它是一组数据相加后除以数据的个数得到的结果。

平均值这一数据特征应用最为广泛,是集中趋势的最主要的测度值。
众数、中位数和平均数的比较
在一组数据中众数可能不止一个,也可能没有众数。在数据量较多时使用众数才有意义;中位数适合顺序数据中的集中趋势测度值;平均数应用与数值型数据,它利用到了全部的数据信息,但是当数据偏斜程度较大时,平均数的代表性没有那么好。

2. 离散程度的度量

分类数据: 异众比率

异众比率是指非众数组的频数占总频数的比例

异众比率越大,众数的代表性越差;异众比率越小,众数的代表性越好。它适合度量分类数据的离散程度。
顺序数据: 四分位差
四分位差 = QU - QL,它反映了中间50%的数据的离散程度。
数值型数据:方差和标准差

方差是各变量值与其平均数离差平方的平均数。

方差在衡量数值型数据的离散程度上具有重要的意义,方差越大说明数据的离散程度越大,方差越小数据离散度越小即数据越集中,标准差则是方差的算术平方根。
关于样本方差公式除以n - 1的问题:
首先明白自由度的含义:自由度是指附加给独立的观测值的约束或限制的个数
假如当一个样本的平均数确定下来后,我们只有n - 1个数取自由值,这些值一旦确定另一个数的值就是唯一的,我们可以称这个样本的自由度为n - 1。
样本方差的自由度为什么是n - 1?因为在计算样本方差的公式中,分子叫做离差平方和,而分子中的样本平均数我们事先要知道,而样本平均数是附加给分子的一个约束,所以计算离差平方和时只有n - 1个独立的观测值。
从实际应用来解释,我们用样本方差去估计总体方差,这是无偏估计。

《统计学》 贾俊平 第四章 数据的概括性度量 学习总结相关推荐

  1. 贾俊平-第四章:数据的概括性度量

    贾俊平-第四章:数据的概括性度量 4.1 集中趋势的度量 集中趋势&离散趋势: 集中趋势:低层次数据的集中趋势测度值适用于高层次的测量数据:但反之并不适用. 4.1.1 分类数据:众数M0 只 ...

  2. 《统计学》——思考题第四章数据的概括性度量(贾俊平)

    目录 1.一组数据的分布特征可以从哪几个方面进行测度? 2.简述众数.中位数和平均数的特点和应用场合. 3.简述异众比率.四分位差.方差或标准差的应用场合. 4.标准分数有哪些用途? 5.为什么要计算 ...

  3. 第四章 数据的概括性度量

    1 集中趋势的度量 分类数据:众数 顺序数据:中位数和分位数 分位数:上四分位数(Ql).下四分位数(Qu) Ql位置=n/4,Qu位置=3n/4 如果位置是整数,四分位数就是在该位置对应的值:如果是 ...

  4. 统计学-基于R (第四版) 贾俊平编著 第二章: 数据可视化 2.1, 2.2 习题答案 【自用】

    2.1 用R自带的Titanic绘制图形 数据和包准备 library(DescTools) dataframeT = Untable(Titanic) #转为数据框形式 1. Sex 和 Survi ...

  5. 《统计学》第八版贾俊平第六章统计量及抽样分布知识点总结及课后习题答案

    一.知识框架 二.练习题 调节一个装瓶机使其对每个瓶子的灌装量均值为μ盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差σ=1.0盎司的正态分布.随机抽取这台机器灌装的9个瓶子组成一个样本,并测定每 ...

  6. 第4章 数据的概括性度量

    利用图表展示数据,可以让我们对数据分布的形状和特征有一个大致的了解.但是要全面把握数据分布的特征,还需要找到反映数据分布特征的各个代表值.数据分布的特征可以从三个方面进行测度和描述: 分布的集中趋势: ...

  7. 《统计学》第八版贾俊平 思维导图

    思维导图 第一章 导论 - 第二章数据的搜集 - 第三章 数据的图表展示 - 第四章数据的概括性度量

  8. 《统计学》贾俊平 第一章 导论总结

    前言 在学习<统计学>一书之后,在这里按照章节进行整理总结,也是对知识的一个复习,学习统计学的意义我认为就是以后在做数据分析的时候,能用科学的.有效的方法处理数据. 1. 什么是统计学 统 ...

  9. 《统计学》(贾俊平)考研初试完整学习笔记10~14章

    贾俊平<统计学第6版>学习笔记 这是我自己去年考研时整理的笔记,希望能给到432考研以及正在学习统计学的小伙伴们一点帮助吧,我是把这份笔记当作复习时的框架来用的,时不时过一遍,有不熟悉的地 ...

最新文章

  1. 【37.38%】【codeforces 722C】Destroying Array
  2. perl 远程 mysql_perl联接mysql
  3. 移动端web,tap与click事件
  4. SAE去掉index.php实现自定义固定链接
  5. http的请求体body的几种数据格式
  6. 部署FIM 2010 R2—1先决条件准备
  7. sshclientCRT连接linux使用技巧
  8. Java实现求二叉树的路径和
  9. python如何实时查询oracle_python针对Oracle常见查询操作实例分析
  10. vue-cli初始化一个项目
  11. 微信小程序微商城(四):动态API实现商品详情页(上)
  12. 10月18号、19号、20号三天PC端云音乐项目总结
  13. uniapp文件路径转base64格式
  14. SVM多分类的几种方式
  15. ABB机器人示教器无法读取U盘怎么办
  16. ERROR: Cannot uninstall ‘certifi‘. It is a distutils installed project and thus we cannot accurately
  17. 把m个球放到n个盒子里,有多少种方法 球盒问题,8种情况
  18. IC验证笔试题(平头哥)
  19. 计算机教室最适合的植物,适合放电脑前的植物 电脑前放什么植物比较好
  20. xpath兄弟结点语法

热门文章

  1. JTAG仿真器接反了会出现什么现象
  2. 给Arduino烧录BootLoader引导程序,包括Atmega 16U2(通信芯片),Atmega 328P(主控芯片)
  3. 勤学好问的名人名言(分享)
  4. Tomcat SEVERE: Failed to initialize end point associated with ProtocolHandler [“http-bio-8080“] 异常处理
  5. linux 系统rc.d启动脚本剖析
  6. iOS 从创建证书到发布
  7. 谷雨了。且惜春光,且迎初夏。
  8. 光伏阵列故障诊断笔记
  9. 训练ViT和MAE减少一半计算量!Sea和北大提出新优化器Adan:深度模型都能用!
  10. 编程自救指南--0x01 第一章 你真的了解你的专业吗 ?