Python清除异常值四分位法
看了https://blog.csdn.net/zhuiqiuuuu/article/details/82721935 这篇文章,但是因为用不到pd,所以改了改。
先上代码
# Outlier detection
import numpy as npdef detect_outliers2(df):outlier_indices = []# 1st quartile (25%)Q1 = np.percentile(df, 25)# 3rd quartile (75%)Q3 = np.percentile(df, 75)# Interquartile range (IQR)IQR = Q3 - Q1# outlier stepoutlier_step = 1.5 * IQRfor nu in df:if (nu < Q1 - outlier_step) | (nu > Q3 + outlier_step):df.remove(nu)return dfif __name__ == '__main__':df = [-3331,2,3,4,11111]Outliers_to_drop = detect_outliers2(df)# Drop outliersprint(Outliers_to_drop)
输出:[2, 3, 4]
效果描述:将输入的df清除异常值
理论:
首先计算出第一四分位数(Q1)、中位数、第三四分位数(Q3)。
中位数我们都知道,就是将一组数字按从小到大的顺序排序后,处于中间位置(也就是50%位置)的数字。
同理,第一四分位数、第三四分位数是按从小到大的顺序排序后,处于25%、75%的数字。
令 IQR=Q3−Q1IQR=Q3−Q1 ,那么 Q3+1.5(IQR)Q3+1.5(IQR) 和 Q1−1.5(IQR)Q1−1.5(IQR) 之间的值就是可接受范围内的数值,这两个值之外的数认为是异常值。
抄袭一张图:
Python清除异常值四分位法相关推荐
- python异常值处理四分位法_Python清除异常值四分位法
看了https://blog.csdn.net/zhuiqiuuuu/article/details/82721935 这篇文章,但是因为用不到pd,所以改了改. 先上代码 # Outlier det ...
- 基于 Python 的自然邻域法空间插值的实现与优化
接上期基于 Python 的自然邻域法空间插值的实现与思考. 上期说到,我们仅仅利用自然邻域法基础原理进行插值,会出现许多空值.异常值,且与ArcGIS相同分辨率.范围下的插值结果对比(对比图 ...
- python实现双向最大匹配法
python实现双向最大匹配法 CSDN小马哥 于 2019-01-08 21:01:29 发布 2776 收藏 3 文章标签: python 中文分词技术 双向最大匹配法 自然语言处理 版权 -- ...
- df满足条件的值修改_如何用python实现熵值法求指标权重(实例)
权重是指某一因素或指标相对于某一事物的重要程度,其不同于一般的比重,体现的不仅仅是某一因素或指标所占的百分比,强调的是因素或指标的相对重要程度,倾向于贡献度或重要性.而在我们的数据分析过程中,倘若各个 ...
- 运用python进行熵值法综合评价
运用python进行熵值法综合评价 第一步,读取数据: 第二步,数据标准化: 第三步,计算指标信息熵e和信息效用值d; 第四步,计算指标权重: 最后,计算样本评价值. 第一步,读取数据: import ...
- 用python实现层次分析法(AHP)
层次分析法是数学建模的入门算法,类似于算法竞赛中的cout<<"Hello,world!"<<endl; 对于python数据分析的初学者来说,在使用pyt ...
- Python实现“层次分析法”及“自调节层次分析法”
Python实现"层次分析法"及"自调节层次分析法" 假设我们遇到如下问题: ①对于M个方案,每个方案有N个属性,在已知各个方案每个属性值&&任 ...
- Python实现熵值法确定权重
该文为转载文章,无排版,链接直达 Python实现熵值法确定权重 本文从以下四个方面,介绍用Python实现熵值法确定权重: 一. 熵值法介绍 二. 熵值法实现 三. Python实现熵值法示例1 四 ...
- python中是什么意思权重_如何用python实现熵值法求指标权重(实例)
权重是指某一因素或指标相对于某一事物的重要程度,其不同于一般的比重,体现的不仅仅是某一因素或指标所占的百分比,强调的是因素或指标的相对重要程度,倾向于贡献度或重要性.而在我们的数据分析过程中,倘若各个 ...
最新文章
- LeetCode 7. Reverse Integer
- java多线程-sleep()和wait()对比
- 网工协议基础(1) OSI七层模型
- 元气森林唐彬森:十万块就能爆发团队创造力
- 给ButtonBar组件设置自定义TOOLTIP。
- Android Studio(6)---编写APP
- 窗口发送消息参数详解
- [swift] LeetCode 136. Single Number
- 1684. 统计一致字符串的数目
- 收集 关于IDEA 开发工具的一些有用的设置 或 使用技巧
- 使用jQuery Uploadify在ASP.NET 上传附件
- 用 O(1) 时间检测整数 n 是否是 2 的幂次。
- Mysql千万级数据查询优化技巧
- Atitit 战略之道 attilax著 v4 r88
- 服务器网卡,10GE设备相关笔记
- 计算机网路课程设计——电子邮件客户端的设计与实现——接收邮件(POP3协议)
- RNN梯度消失和爆炸的原因
- 办公一定要有哪些基础软件?
- Arbitrary Style Transfer with Deep Feature Reshuffle
- R语言中的I(x^2)
热门文章
- SHT30 I2C 温湿度传感器实际应用
- 酒链世界平台 技术支持 系统开发
- 务必收藏,我珍藏多年的Python奇淫技巧,不看后悔啊~
- 【集合类】 1 java.util.ConcurrentModificationException异常详解ArrayListCopyOnWriteArrayList原理探究
- 阿里VLayout学习笔记(Kotlin)
- 计算机英语教学教案模板,初中英语课教案模板
- ARM 编程:C语言与汇编间互相调用,参数与返回值的传递方式详解
- 并行网关 Parallel Gateway
- 光的干涉衍射计算机模拟仿真技术,实验报告之仿真(光的干涉与衍射).doc
- QT5.5.1 嵌入式平台 鼠标键盘不能热插拔问题解决(一)