根据拉依达准则(3σ准则)去除异常值

3σ准则:设对被测量变量进行等精度测量,得到x1,x2,……,xn,算出其算术平均值x及剩余误差vi=xi-x(i=1,2,…,n),并按贝塞尔公式算出标准误差σ,若某个测量值xb的剩余误差vb(1<=b<=n),满足|vb|=|xb-x|>3σ,则认为xb是含有粗大误差值的坏值,应予剔除。贝塞尔公式如下:

代码如下:

import math
import matplotlib.pyplot as plt
# import numpy as np
import pandas as pd# generate random num tested
src_data = pd.read_excel('待处理数据.xlsx',sheet_name=0,header=0) # 第一张表格,第一行为列名
# pd.set_option('display.max_rows', src_data.shape[0] + 1)mean = src_data.mean()
std = src_data.std()drop_indices = []
for index, row in src_data.iterrows():# print(index, row['age'], row['gender'])tmp = (row - mean).abs() > 3 * stdif tmp.any():drop_indices.append(index)print(drop_indices)dst_data = src_data.drop(drop_indices)
# print(src_data)
writer = pd.ExcelWriter('处理后的结果.xlsx')
dst_data.to_excel(writer, 'page_1')
writer.save()

拉依达准则python实现相关推荐

  1. 拉依达准则的python代码

    部分代码 import pandas as pd src_data = pd.read_excel('XXX.xls',sheet_name=0,header=0) mean = src_data.m ...

  2. Python:使用拉依达准则(3σ准则)剔除excel表中异常数据

    1.简介 拉依达准则(Pau'ta Criteron)是先假设一组数据中只含有随机误差,首先按照一定准则计算标准偏差,按照一定概率确定一定区间,认为不在这个区间的为异常值.当数据呈正太分布或者近似正太 ...

  3. matlab实现拉依达准则,拉依达准则matalb程序

    页数:2 中图分类:O212 正文语种:CHI 关键词:数据分析;甑别值;拉依达准则;肖维勒准则;格拉布斯准则 摘要:对测量数据进行分析,是为了及时发现错误,防止错误,数据...... 原始信号 中值 ...

  4. 【数据异常校验】拉依达准则( PauTa Criterion 或 3σ准则) 处理异常数据

    拉依达准则是指先假设一组检测数据只含有随机误差,对其进行计算处理得到标准偏差,按一定概率确定一个区间,认为凡超过这个区间的误差,就不属于随机误差而是粗大误差,含有该误差的数据应予以剔除. 这种判别处理 ...

  5. C#使用拉依达准则(3σ准则)剔除异常数据(.Net剔除一组数据中的奇异值)

    1.问题的提出: 电池生产中,遇到一批电池的测量结果数据: 电压值 电池个数 电压值 电池个数 电压值 电池个数 电压值 电池个数 0.056 1   4.09 1   4.146 17   4.17 ...

  6. 进阶版拉依达准则(3sigm准则)的提出与应用

    修正版拉依达准则的提出与应用 前言 一:基于实验说明异常点对模型结果的影响 二:异常点的判定 三:修正版拉依达准则(3σ准则) 四:理论验证 五:代码实现 六:总结 前言 在前两次文章中,我们都提到异 ...

  7. java中算术异常值_依据拉依达准则来剔除异常值程序

    java源码在下,在main主方法里的data数组里输入要测量的数据(个数长度>=10个),会判断里面有误异常值,如果有则警告 /** * @author 廖启安 * @data 2018年4月 ...

  8. 拉依达准则剔除数据异常

    /// <summary>     /// 拉依达准则剔除数据异常     /// </summary>     public class DataExceptionHelpe ...

  9. 数据预处理 拉依达准则 matlab,数学建模数据预处理.doc

    数据预处理 摘要 目前,大量研究工作都集中于数据挖掘算法的探讨,而忽略了对数据预处理的研究.事实上,数据预处理对数据挖掘十分重要,而且必不可少.要使数据挖掘出有效的知识,必须为其提供干净,准确,简洁的 ...

最新文章

  1. php判断多维数组的技巧
  2. 线性模型的最小二乘法拟合(转)
  3. 你真的会二分查找吗?
  4. Hexo博客新福利:HexoEditor编辑器最新使用方法
  5. python 引用和对象理解
  6. linux stdin shell,关于shell:如何在Alpine Linux中修复“因为stdin不是终端而不会分配伪终端”?...
  7. c++11-Variadic Templates
  8. confluencejira集成_Jira Service Desk使用教程之如何将Jira Cloud与Confluence集成?
  9. LeetCode 662. 二叉树最大宽度(递归)
  10. 手机页面尺寸设置(二)
  11. Spark之hive的UDF自定义函数
  12. 蓝桥杯 ADV-81 算法提高 数的运算
  13. matlab和C/C++混合编程--Mex (转载)
  14. 我 45 岁还写代码,怎么了?
  15. 百度支持nofollow是百度的进步
  16. 利用WinEdt修改图片格式为eps
  17. oracle select into from 用法,数据库插入数据之select into from与insert into select区别详解...
  18. 透明图片怎么发给别人_怎么用秀米写公众号文章
  19. 腾讯T3手把手教你!从底层开始带你了解并发编程,重要概念一网打尽!
  20. java调用java程序,详细说明

热门文章

  1. Revisiting Over-Smoothness in Text to Speech
  2. 大数据华而不实么?大数据的本质是什么?
  3. 苹果手机app应用显示未受信任打不开怎么办
  4. 04.配置unp.h头文件出现开启 xinetd daytime 服务时 /etc/xinetd.d下 没有daytime 文件的解决办法
  5. Java设计模式之外观模式(门面模式,迪米特法则的具体实现,抽象外观类改进)
  6. Apsara Clouder云计算专项技能认证:云服务器ECS入门[考试真题]
  7. 蚂蚁金服-支付宝内推面试总结(已拿到offer)
  8. 3d Max安装失败(Microsoft Visual C++ 2010 SP1 Redistributable (x86) Failed...
  9. 跳一跳改分php源码,小游戏“跳一跳”居然可改分,微信小程序现漏洞
  10. python 按条件筛选行_Python之根据条件筛选特定行