1.异常值的检测

有时候数据集中会包含一个或多个异常大或小的观测值,这些极端值称为异常值。
标准化数值(z-分数) 可以用来确认异常值。
什么是(z-分数):利用平均数和标准差,我们可以确定任何观察值的相对位置。任何观测值的z-分数都被认为是对数据集中观测值相对位置的量度。
计算公式为:

zi=(xi−xˉ)/s.z_{i} =(x_{i}-\bar x)/s. zi​=(xi​−xˉ)/s.
其中ziz_{i}zi​代表z-分数,xˉ\bar xxˉ为样本平均数;s为样本标准差。
经验法则:对具有钟形分布的数据,几乎所有的数据值与平均数的距离都在3各标准差之内。因此,利用z-分数来检测异常时,建议把z-分数小于-3或大于+3的任何数值都视为异常值。

另一种方法:
确认异常值的另一种方法是以第一四分位数和第三四分位数(Q1Q_{1}Q1​和Q3Q_{3}Q3​)以及四分位数间距(IQRIQRIQR)为依据。利用这种方法,我们首先计算如下的下限和上限:
下限=Q1−1.5×IQR上限=Q3+1.5×IQRIQR=Q3−Q1.下限=Q_{1}-1.5\times IQR\\ 上限=Q_{3}+1.5\times IQR\\ IQR = Q_{3}-Q_{1}. 下限=Q1​−1.5×IQR上限=Q3​+1.5×IQRIQR=Q3​−Q1​.
如果一个观测值的数值小于下限或者大于上限,则被归于异常值。

四分位数(Quartile)也称四分位点,是指在统计学中把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值。多应用于统计学中的箱线图绘制。它是一组数据排序后处于25%和75%位置上的值。四分位数是通过3个点将全部数据等分为4部分,其中每部分包含25%的数据。很显然,中间的四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上的数值(称为下四分位数)和处在75%位置上的数值(称为上四分位数)。与中位数的计算方法类似,根据未分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数值就是四分位数。

2.五数概括法和箱型图

五数概括法使用下面五个数来汇总数据:
(1)最小值
(2)第一四分位数
(3)中位数(第二四分位数)
(4)第三四分位数
(5)最大值
箱型图:基于五数概括法的数据图形汇总。

《商务与经济统计》学习笔记(三)相关推荐

  1. 学习《Linux设备模型浅析之设备篇》笔记(一)

    最近在学习Linux设备模型,前面几篇文章也是读这篇的时候遇到问题,然后为了搞清楚先转去摸索才写出来的. 当然了,刚开始是先读到<Linux那些事儿之我是Sysfs>,搞不清楚才去读的&l ...

  2. 学习《Linux设备模型浅析之设备篇》笔记(二)

    文件/drivers/base/platform.c int __init platform_bus_init(void) {         int error; early_platform_cl ...

  3. 学习《Linux设备模型浅析之驱动篇》笔记(一)

    原文中说了,内核版本为2.6.29:这里都贴3.15的内核源码: 文件/drivers/rtc/rtc-s3c.c static struct platform_driver s3c_rtc_driv ...

  4. 学习《Linux设备模型浅析之设备篇》笔记(深挖二)

    /**  * platform_add_devices - 添加一些platform设备  * @devs: 要添加的platform设备的队列  * @num: platform设备队列的书目  * ...

  5. 学习《Linux设备模型浅析之设备篇》笔记(深挖一)

    这篇文章既然说了是浅析,那就是跳过了一些东西,我们把这些跳过的东西给它尽可能的补回来 今天登陆 lxr.free-electrons.com 发现内核版本已经升级到3.15了,那以后都使用3.15的源 ...

  6. 学习《Linux设备模型浅析之设备篇》笔记(三)

    文件/drivers/base/core.c static struct kobject *get_device_parent(struct device *dev, struct device *p ...

  7. Linux设备模型之platform设备

    Linux设备模型之platform设备 1. Platform模块的软件架构 2. Platform设备 2.1 platform_device原型 2.2 注册添加device 2.2.1 pla ...

  8. RT-Thread记录(十三、I/O 设备模型之PIN设备)

    讲完UART设备之后,我们已经熟悉RT-Thread I/O 设备模型了,回头看看基本的 PIN 设备. 目录 前言 一.PIN 设备模型解析 1.1 初识 GPIO 操作函数 1.2 PIN 设备框 ...

  9. RT-Thread记录(十二、I/O 设备模型之UART设备 — 使用测试)

    从 UART 设备开始学会使用 RT-Thread I/O 设备模型 . 目录 前言 一.UART 设备操作 1.1 UART 设备控制块 1.2 UART 操作函数 1.2.1 查找 UART 设备 ...

  10. Linux设备模型、平台设备驱动、设备树(device tree)、GPIO子系统以及pinctrl子系统介绍

    文章目录 一.Linux设备模型介绍 (1)设备驱动模型总体介绍 (2)设备驱动模型文件表现 (3)设备驱动模型工作原理 [1]总线 [2]设备 [3]驱动 [4]注册流程 二.平台设备驱动介绍 (1 ...

最新文章

  1. 使用phpStudy运行伊人集项目
  2. Android Parcelable的介绍与使用
  3. 彩色图像到灰度转换 常见方法汇总与对比
  4. [No000010F]Git8/9-使用GitHub
  5. 红黑树二叉查找树二叉排序树的理解
  6. 表达对别人的感激之情
  7. sqlite数据库插入和读取图片数据 (for ios)
  8. arcsde9.3 the arcsde repository is not successfully created
  9. http响应协议分析
  10. [vue] 怎么解决vue动态设置img的src不生效的问题
  11. PHP监測memcache服务端的执行状况
  12. 服务器LIMIT是什么信号,Postfix添加milter-limit配置方案
  13. 什么不是预防计算机病毒的方法,预防计算机病毒的方法是什么
  14. java 不取空值_Java:如何更优雅的处理空值?
  15. win11安装助手闪退怎么办 Windows11安装助手闪退的解决方法
  16. 贪心 区间覆盖最小值
  17. activemq 搭建2
  18. SSM框架原理,作用及使用方法,详细解释
  19. C# 通过Http获取网页内容
  20. excel汇总报表如何做?

热门文章

  1. 冰河木马学习之监听服务端失败
  2. 怎么解决计算机键盘驱动,解决键盘失灵、安装更新键盘驱动方法
  3. 如何开发自己的股票软件102
  4. CocosBuilder 教程
  5. 魔兽世界服务器文件,【魔兽世界7.35】魔兽一键安装服务端[带GM管理工具]
  6. 魔兽怀旧服服务器怎么修改,魔兽世界怀旧服今日开服 魔兽世界怀旧服剥皮制皮玩法攻略 怀旧服服务器连不上怎么办?...
  7. 架构师必看-架构之美第15章伸缩性架构设计
  8. 软考中级系统集成项目管理工程师视频教程
  9. php导出 excel
  10. android 拦截qq消息,[Android] QNotified_v0.7.1-beta_QQ辅助增强XP模块【可屏蔽下拉小程序/屏蔽@全体/消息防撤回】...