看了https://blog.csdn.net/zhuiqiuuuu/article/details/82721935 这篇文章,但是因为用不到pd,所以改了改。
先上代码

# Outlier detection
import numpy as npdef detect_outliers2(df):outlier_indices = []# 1st quartile (25%)Q1 = np.percentile(df, 25)# 3rd quartile (75%)Q3 = np.percentile(df, 75)# Interquartile range (IQR)IQR = Q3 - Q1# outlier stepoutlier_step = 1.5 * IQRfor nu in df:if (nu < Q1 - outlier_step) | (nu > Q3 + outlier_step):df.remove(nu)return dfif __name__ == '__main__':df = [-3331,2,3,4,11111]Outliers_to_drop = detect_outliers2(df)# Drop outliersprint(Outliers_to_drop)

输出:[2, 3, 4]

效果描述:将输入的df清除异常值

理论:
首先计算出第一四分位数(Q1)、中位数、第三四分位数(Q3)。
中位数我们都知道,就是将一组数字按从小到大的顺序排序后,处于中间位置(也就是50%位置)的数字。
同理,第一四分位数、第三四分位数是按从小到大的顺序排序后,处于25%、75%的数字。

令 IQR=Q3−Q1IQR=Q3−Q1 ,那么 Q3+1.5(IQR)Q3+1.5(IQR) 和 Q1−1.5(IQR)Q1−1.5(IQR) 之间的值就是可接受范围内的数值,这两个值之外的数认为是异常值。
抄袭一张图:

Python清除异常值四分位法相关推荐

  1. python异常值处理四分位法_Python清除异常值四分位法

    看了https://blog.csdn.net/zhuiqiuuuu/article/details/82721935 这篇文章,但是因为用不到pd,所以改了改. 先上代码 # Outlier det ...

  2. 基于 Python 的自然邻域法空间插值的实现与优化

      接上期基于 Python 的自然邻域法空间插值的实现与思考.   上期说到,我们仅仅利用自然邻域法基础原理进行插值,会出现许多空值.异常值,且与ArcGIS相同分辨率.范围下的插值结果对比(对比图 ...

  3. python实现双向最大匹配法

    python实现双向最大匹配法 CSDN小马哥 于 2019-01-08 21:01:29 发布 2776  收藏 3 文章标签: python 中文分词技术 双向最大匹配法 自然语言处理 版权 -- ...

  4. df满足条件的值修改_如何用python实现熵值法求指标权重(实例)

    权重是指某一因素或指标相对于某一事物的重要程度,其不同于一般的比重,体现的不仅仅是某一因素或指标所占的百分比,强调的是因素或指标的相对重要程度,倾向于贡献度或重要性.而在我们的数据分析过程中,倘若各个 ...

  5. 运用python进行熵值法综合评价

    运用python进行熵值法综合评价 第一步,读取数据: 第二步,数据标准化: 第三步,计算指标信息熵e和信息效用值d; 第四步,计算指标权重: 最后,计算样本评价值. 第一步,读取数据: import ...

  6. 用python实现层次分析法(AHP)

    层次分析法是数学建模的入门算法,类似于算法竞赛中的cout<<"Hello,world!"<<endl; 对于python数据分析的初学者来说,在使用pyt ...

  7. Python实现“层次分析法”及“自调节层次分析法”

    Python实现"层次分析法"及"自调节层次分析法" 假设我们遇到如下问题: ①对于M个方案,每个方案有N个属性,在已知各个方案每个属性值&&任 ...

  8. Python实现熵值法确定权重

    该文为转载文章,无排版,链接直达 Python实现熵值法确定权重 本文从以下四个方面,介绍用Python实现熵值法确定权重: 一. 熵值法介绍 二. 熵值法实现 三. Python实现熵值法示例1 四 ...

  9. python中是什么意思权重_如何用python实现熵值法求指标权重(实例)

    权重是指某一因素或指标相对于某一事物的重要程度,其不同于一般的比重,体现的不仅仅是某一因素或指标所占的百分比,强调的是因素或指标的相对重要程度,倾向于贡献度或重要性.而在我们的数据分析过程中,倘若各个 ...

最新文章

  1. LeetCode 7. Reverse Integer
  2. java多线程-sleep()和wait()对比
  3. 网工协议基础(1) OSI七层模型
  4. 元气森林唐彬森:十万块就能爆发团队创造力
  5. 给ButtonBar组件设置自定义TOOLTIP。
  6. Android Studio(6)---编写APP
  7. 窗口发送消息参数详解
  8. [swift] LeetCode 136. Single Number
  9. 1684. 统计一致字符串的数目
  10. 收集 关于IDEA 开发工具的一些有用的设置 或 使用技巧
  11. 使用jQuery Uploadify在ASP.NET 上传附件
  12. 用 O(1) 时间检测整数 n 是否是 2 的幂次。
  13. Mysql千万级数据查询优化技巧
  14. Atitit 战略之道 attilax著 v4 r88
  15. 服务器网卡,10GE设备相关笔记
  16. 计算机网路课程设计——电子邮件客户端的设计与实现——接收邮件(POP3协议)
  17. RNN梯度消失和爆炸的原因
  18. 办公一定要有哪些基础软件?
  19. Arbitrary Style Transfer with Deep Feature Reshuffle
  20. R语言中的I(x^2)

热门文章

  1. SHT30 I2C 温湿度传感器实际应用
  2. 酒链世界平台 技术支持 系统开发
  3. 务必收藏,我珍藏多年的Python奇淫技巧,不看后悔啊~
  4. 【集合类】 1 java.util.ConcurrentModificationException异常详解ArrayListCopyOnWriteArrayList原理探究
  5. 阿里VLayout学习笔记(Kotlin)
  6. 计算机英语教学教案模板,初中英语课教案模板
  7. ARM 编程:C语言与汇编间互相调用,参数与返回值的传递方式详解
  8. 并行网关 Parallel Gateway
  9. 光的干涉衍射计算机模拟仿真技术,实验报告之仿真(光的干涉与衍射).doc
  10. QT5.5.1 嵌入式平台 鼠标键盘不能热插拔问题解决(一)