在数据清洗阶段,我们需要找到异常值,并对其进行相应的一些处理。在python中,异常值的处理常常需要结合一些数据模型或概率分布来解决。下面做一个简单的介绍。

1.打开pycharm开发工具,在运行窗口输入命令:

import pandas as pd #导入pandas库

2.输入数据集。

data=pd.DataFrame({'name':['A','B','C','D','E','F','G'],'cost':[2,127,4,6,3,13,14],'sales':[13,18,32,54,23,33,44]})

print(data)

3.通过z-score方法判断异常值,即对原始值X进行正态标准化:(X-mean(X))/std(X),根据计算的结果判断样本值与中心的偏离程度。

df1=data.copy()#为了不影响原始数据集,复制数据集data

print(df1)

4.按列计算均值和标准差。

df1['cost']=(df1['cost']-df1['cost'].mean())/df1['cost'].std()#标准化cost_z列

5.对sales列进行标准化。

df1['sales']=(df1['sales']-df1['sales'].mean())/df1['sales'].std()#标准化cost_z列

df1['sales']

6.查看标准化后的数据集。

print(df1)

标准化后的绝对值越大,数据越有可能异常,是否异常根据设定的阈值判断。

7.假设cost列阈值为2,通过下面的方法找到异常值。

df1['cost'].abs()>2#判断数据是否异常

data[df1['cost'].abs()>2]#取出原数据集中的异常点

python异常值处理箱型图_如何利用python处理异常值?相关推荐

  1. Python 详解箱型图法剔除异常值

    文章目录 一.引言 二.Python 实现 一.引言 箱型图提供了识别异常值的一个标准:异常值通常被定义为 小于 Q L − 1.5 I Q R Q_{L}-1.5IQR{ } Q

  2. python多个箱线图_箱线图Python

    1) 箱线图,又称箱形图(boxplot)或盒式图,不同于一般的折线图.柱状图或饼图等传统图表,只是数据大小.占比.趋势等等的呈现,其包含一些统计学的均值.分位数.极值等等统计量,因此,该图信息量较大 ...

  3. python slice函数画高维图_没想到Python还能画六维图

    我们的大脑通常最多能感知三维空间,超过三维就很难想象了.尽管是三维,理解起来也很费劲,所以大多数情况下都使用二维平面. 来自维基百科 不过,我们仍然可以绘制出多维空间,今天就来用 Python 的 p ...

  4. python画车辆轨迹图_如何利用 Python 绘制酷炫的 车辆轨迹 — 速度时空图?三维数据用二维图像呈现...

    说明:本文系交通攻城狮原创文章,如需转载请私信联系,侵权必究. 2020,第 30 期,编程笔记 建议直接阅读精编版:如何利用 Python 绘制酷炫的 车辆轨迹 - 速度时空图?三维数据用二维图像呈 ...

  5. python制作雷达图_如何利用Python matplotlib绘制雷达图

    本篇文章介绍使用matplotlib绘制雷达图. 雷达图也被称为网络图,蜘蛛图,星图,蜘蛛网图,是一个不规则的多边形.雷达图可以形象地展示相同事物的多维指标,雷达图几乎随处可见,应用场景非常多. 一. ...

  6. 如何用python画出一般函数图_如何使用python的matplotlib画一元一次函数图像

    python是一个很有趣的语言,可以在命令行窗口运行.python中有很多功能强大的模块,这篇经验告诉你,如何利用python的matplotlib模块,绘制一元一次函数的图像. 工具/原料 wind ...

  7. python如何制作一个工程软件_如何利用python制作一个解压缩软件-Go语言中文社区...

    如何利用python制作一个解压缩软件 python实现解压缩的重要模块就是--zipfile,其次是os 安装zipfile模块 首先得安装zipfile模块,打开cmd输入一下命令即可安装 pip ...

  8. python抓取朋友圈动态_如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)...

    原标题:如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下) 前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往 ...

  9. python如何实现微信自动聊天_如何利用python实现微信智能聊天功能,具体该怎么做?...

    这个实现不难,需要先安装一下itchat库,之后注册一下图灵机器人,最后就可以编程实现微信智能聊天功能了,下面我简单介绍一下实现过程,实验环境win10+python3.6+pycharm5.0,主要 ...

最新文章

  1. 智能应答系统php源码,佳蓝智能应答系统 php版下载|佳蓝智能应答系统 php版官方下载-太平洋下载中心...
  2. 深度特征提取方法_基于深度学习的文本数据特征提取方法之Glove和FastText
  3. 这些用来审计 Kubernetes RBAC 策略的方法你都见过吗?
  4. 华为交换机堆叠SVF助手(推荐)
  5. xcode开发php,xcode怎么编写c语言
  6. HttpRequest Java原生代码封装
  7. 大叔也说Xamarin~Android篇~环境部署与破解
  8. 13个坏习惯让IT工作者中过劳(转)
  9. wpf之内容超出布局是用滚动条
  10. 创建项目连接错误_在不同项目下S7-1200主站模块和 S7-300 CP342-5通信的实现方法...
  11. android随机生成字符串,Android随机字符串生成器
  12. 小程序switch内部加上文字_干货 | 微信小程序教程:写一个能自定义尺寸、样式的switch...
  13. Mysql 10位 13位时间戳对比现在时间 时间对比查询
  14. [笔记]Pytorch框架下的入门应用:resnet34实现分类
  15. NPDP知识推送-第一章新产品开发战略(2)
  16. linux裸设备文件系统,关于裸设备,文件系统,CIO/DIO
  17. MYSQL字段属性之int() 和 tinyint()的区别
  18. 学Linux到底学什么?老司机来告诉你!
  19. 低代码发展现状调研和思考
  20. 供应科研试剂Biotin-PEG-Thiol,Biotin-PEG-SH,生物素peg巯基

热门文章

  1. python 时间函数小总结
  2. 12-order by和group by 原理和优化 sort by 倒叙
  3. Mac下svn搭建和使用方法
  4. 【PHP】月末・月初の出力方法
  5. 简明易懂的call apply
  6. FusionCharts 的XML标签属性
  7. 蓝桥杯第五届省赛JAVA真题----n级台阶
  8. 求最大公约数——欧几里得算法(JAVA)
  9. Content后台的获取为什么为空
  10. python 装饰器 继承_Python设计模式之装饰器模式