Python:使用拉依达准则(3σ准则)剔除excel表中异常数据
1.简介
拉依达准则(Pau’ta Criteron)是先假设一组数据中只含有随机误差,首先按照一定准则计算标准偏差,按照一定概率确定一定区间,认为不在这个区间的为异常值。当数据呈正太分布或者近似正太分布时可以使用
2.数据集示例
3.完整处理代码
import numpy as np
import pandas as pd
#设置需读取文件的路径
datapath = "traning处理前.xlsx"
data = pd.read_excel(datapath)
# 记录方差大于3倍的值
#shape[0]记录行数,shape[1]记录列数
sigmayb = [0]*data.shape[0]
for i in range(1,data.shape[1]):print("处理第"+str(i)+"行")# 循环 每一列lie = data.iloc[:, i].to_numpy()#print(lie)mea = np.mean(lie)s = np.std(lie, ddof=1)# 计算每一列 均值 mea 标准差 sprint("均值和标准差分别为:"+str(mea)+" "+str(s))#统计大于三倍方差的行for t in range(1,data.shape[0]):if (abs(lie[t]-mea) > 3*s):print(">3sigma"+" "+str(t)+" "+str(i))#将异常值置空data.iloc[t,i]=' '
#将处理后的数据存储到原文件中
data.to_excel(datapath)
4.运行结果
Python:使用拉依达准则(3σ准则)剔除excel表中异常数据相关推荐
- Python办公自动化实践1:从多个excel表中提取数据并汇总到一个工作表页中,表格,抽取,sheet
Python办公自动化实践1:从多个excel表中提取数据并汇总到一个工作表页中,表格,抽取,sheet 发表时间:2020-04-26 问题:从当前目录或子目录中查询符合条件的excel表格,并从这 ...
- 《python 数据可视化编程实战》-从excel表中读取数据
从excel表中读取数据 #!/usr/nim/env python # _*_ coding:utf-8 _*_ import xlrd from numpy import *file1 = 'D: ...
- 【python】将多个tsv文件合并到excel表中
需求 将某个目录下多个特定文本文件,合并到excel表中.并要求将文件名作为sheet名,每个sheet中第一行第一个单元格填写对应文件的所在路径,单元格格式使用Times New Roman. 使用 ...
- python如何在exel中编程_如何使用Python以编程方式将行添加到现有Excel表中
尽管有各种各样的pythonexcel操作库和资源,但我无法找到具体的解决方案.在 现在,我有一个表格存在的Excel模板文件.我想编写一个Python程序来填充这个表.对于任何现有的Excel库都可 ...
- python提取excel表中的数据_用python从excel工作表中提取和操作数据
场景:我正在尝试编写一个python代码,它读取给定文件夹中的所有工作簿,获取每个工作簿的数据并将其放入单个数据帧中(每个工作簿都成为一个数据框,因此我可以单独操作它们).在 问题1:对于此代码,即使 ...
- 【Python自动化办公】实现excel表中的数据批量导入到word指定位置(表格形式和下滑线形式)
文章目录 案例1--word模板为表格 案例2--word模板中带有下划线形式 python docx基本操作 回到需求 案例1--word模板为表格 目的就是把excel中的数据,填入word模板中 ...
- Python对excel操作——分类汇总278张Excel表中的数据
目录 一.题目 1.描述 2.展示 ①原图 ②效果图 二.分析 1.创建工作簿对象以及工作表对象 2.获取数据 3.数据存储 4.数据处理 三.源码 一.题目 1.描述 从278张表中获取物料编号. ...
- JQuery从Excel表中获取数据添加到select下拉框多选的实现
JS代码如下 function importf(excel) {var perids = [];//for循环遍历Excel表中的数据,取出需要的列for(var i = 0 ; i < exc ...
- python excel对比_日常使用————python对比两个excel表中的数据
现在有两个相同的数据集的结构,把80年和2000年两个文件夹,文件名是一样的,但文件数据是不一致的80年xls格式存储,2000年使用xlrd读取数据存储在xlsx格式,使用openpyxl读取数据, ...
最新文章
- 什么阻碍了人工智能在制造业的应用?
- Keras Lambda层
- Spark- Checkpoint原理剖析
- java textfield 数字,如何将整数转换为文本以便在textfield java-blackberry中使用
- 动态矩阵控制matlab程序_【实时关注】你了解MATLAB吗?
- 【阿里巴巴研发效能峰会】低代码与数智化分论坛在线预约中……
- 一个数据科学家需要哪些核心工具包?
- 文字color颜色渐变(可一直变换) - 代码篇
- pyqt5 给按钮设置css样式和界面背景设置
- 硬盘的分区误删除的恢复
- PowerShell设置命令别名Alias
- 集合之五:Set接口
- 【真正离线安装】Adobe Flash Player 32.0 插件离线安装包下载(无需联网安装)
- 【安装教程】 【Visio2019】(附带安装包下载)
- 魔兽顶级装备如何打造各个职业最强装备包括宝石和全身附魔
- 正说:SAP HANA大裁员
- c语言我喜欢你,【幻 仿】UC启动时的我喜欢你
- Could not find a price list in Ordered UOM xxx and Primary UOM of the item
- 字体加粗造成文字抖动
- 优秀网页翻译:高精度 10MHz GPS 驯服钟 (GPSDO) - Part3