使用describe()查看catering_sale.xls数据的基本情况,通过箱式图检测出catering_sale.xls中的异常值
使用describe()查看catering_sale.xls数据的基本情况
import numpy as np
import pandas as pd
a=pd.read_excel('C:\\Users\Administrator\.spyder-py3\catering_sale.xls')
print(a)
s=a.describe()
print(s)
箱形图
箱形图(英文:Box plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。在各种领域也经常被使用,常见于品质管理,快速识别异常值。
箱形图最大的优点就是不受异常值的影响,能够准确稳定地描绘出数据的离散分布情况,同时也利于数据的清洗。
通过箱式图检测出catering_sale.xls中的异常值
import pandas as pd
import os
import matplotlib.pyplot as plt
f1=pd.read_excel('C:\\Users\Administrator\.spyder-py3\catering_sale.xls')#换为自己的位置
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False
plt.figure(figsize=(8,8))
t=f1.boxplot(return_type='dict')
x=t['fliers'][0].get_xdata()
y=t['fliers'][0].get_ydata()
y.sort()
for i in range(len(x)):
if i>0:
plt.annotate(y[i],xy=(x[i],y[i]),xytext=(x[i]+0.05-0.8/(y[i]-y[i-1]),y[i]))
else:
plt.annotate(y[i],xy=(x[i],y[i]),xytext=(x[i]+0.8,y[i]))
plt.show()
使用describe()查看catering_sale.xls数据的基本情况,通过箱式图检测出catering_sale.xls中的异常值相关推荐
- 箱式图 添加异常值平均值_什么是脏数据?怎样用箱形图分析异常值?终于有人讲明白了...
导读:数据质量分析是数据挖掘中数据准备过程的重要一环,是数据预处理的前提,也是数据挖掘分析结论有效性和准确性的基础.没有可信的数据,数据挖掘构建的模型将是空中楼阁. 数据质量分析的主要任务是检查原始数 ...
- 数据特征分析-正太分布 (QQ图)
qq图通过把测试样本数据的分位数与已知分布进行比较,从而检验数据的分布情况. qq图是一种散点图,对应于正态分布的qq图,就是有标准正态分布的分位数(分为点即分位数)为横坐标.样本值为纵坐标的散点图. ...
- ubuntu中显示本机的gpu_Ubuntu下实时查看Nvidia显卡显存占用情况和GPU温度
一.查看Nvidia显卡显存占用情况 查看Nvidia显卡显存占用情况 nvidia-smi 效果如下: 显示的表格中: Fan: 风扇转速(0%–100%),N/A表示没有风扇 Temp: GPU温 ...
- Ubuntu下实时查看Nvidia显卡显存占用情况和GPU温度
一.查看Nvidia显卡显存占用情况 查看Nvidia显卡显存占用情况 nvidia-smi 效果如下: 显示的表格中: Fan: 风扇转速(0%–100%),N/A表示没有风扇 Temp: GPU温 ...
- 诚之和:什么是异常值?如何在统计数据中查找异常值
异常值是数据集的重要组成部分.它们可以保存有关您数据的有用信息.异常值可以为您正在研究的数据提供有用的见解,并且它们可以对统计结果产生影响.这可能会帮助您发现不一致之处并检测统计过程中的任何错误.因此 ...
- 数据正太分布验证——正太QQ图
正态QQ图的原理 QQ图通过把测试样本数据的分位数与已知分布相比较,从而来检验数据的分布情况.QQ图是一种散点图,对应于正态分布的QQ图,就是由标准正态分布的分位数为横坐标,样本值为纵坐标的散点图.要 ...
- pandas查看属性和数据
10.2 查看其属性.概览 1.属性 df.shape # 查看形状,⾏数和列数 df.dtypes # 查看数据类型 df.index # ⾏标签 df.columns # 列标签 df.valu ...
- pandas使用str函数和contains函数查看dataframe特定数据列中是否匹配或包含特定模式的字符串(match or contain a pattern in column value)
pandas使用str函数和contains函数查看dataframe特定数据列中是否匹配或包含特定模式的字符串(match or contain a pattern in column value) ...
- R语言write.xlsx函数将数据写入Excel文件:写入Excel文件并自定义表单的名称、将数据写入Excel文件新的表单(sheet)中、将文件保存为xls文件格式(而不是xlsx)
R语言write.xlsx函数将数据写入Excel文件:写入Excel文件并自定义表单的名称.将数据写入Excel文件新的表单(sheet)中.将文件保存为xls文件格式(而不是xlsx) 目录
最新文章
- dz mysql日志清理_Discuz教程:如何准确的清理数据库
- Kibana安装及简单使用
- 利用python将txt文件中的内容写入Excel文件中
- Vue ui 大法哪家强?
- php 2个经纬度之间的距离,php计算两个经纬度之间的距离
- html文字阴影php,HTML_html5文字阴影效果text-shadow使用示例,复制代码代码如下: !DOCTYPE h - phpStudy...
- 企业内部IT报修是如何操作的?
- BD_source code for problem 1555
- 高中计算机教学设计案例分析,高一年级信息技术教学设计(案例)
- 数据分析案例-电影数据可视化分析
- matlab kappa风险分析,我为什么反对在属性数据MSA中用Kappa分析(上) | 汽车质量管理笔记...
- drupal 8 php filter,Drupal 7 与 Drupal 8 的一些变化
- 安卓自定义View进阶-多点触控详解
- SuperMap iObjects .NET开发ASP .NET网站入门
- Mac运行node.js连接oracle数据库报DPI-1047: Cannot locate a 64-bit Oracle Client library: “dlopen(libclntsh.dy
- pytorch CNN手写字体识别
- app屏幕随手势放大缩小
- 微信小程序动态绑定unit-id
- 【题解】P2324[SCOI2005] 骑士精神
- 《惢客创业日记》2018.12.27(周四)重要的事情说三遍 上篇
热门文章
- Window线程安全与线程控制函数
- input 正则控制输入
- 优秀程序员的十个习惯
- 2020年ui设计师就业前景怎么样?2020ui设计师的缺口大吗
- 痞子衡嵌入式:ARM Cortex-M开发文件详解(3)- 工程文件(.ewp)
- PHP7 搭建简易的学生管理系统(四)
- c语言中用什么表示真假,C语言中如何表示“真”和“假”?系统如何判断一个量的“真”和“假”?...
- 【Python爬虫】Python网络爬虫案例:维基百科
- H5流式播放(FMP4转封装与mediaSource)
- 50个最佳机器学习公共数据集