使用describe()查看catering_sale.xls数据的基本情况

import numpy as np
import pandas as pd
a=pd.read_excel('C:\\Users\Administrator\.spyder-py3\catering_sale.xls')
print(a)
s=a.describe()
print(s)

箱形图
箱形图(英文:Box plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。在各种领域也经常被使用,常见于品质管理,快速识别异常值。

箱形图最大的优点就是不受异常值的影响,能够准确稳定地描绘出数据的离散分布情况,同时也利于数据的清洗。

通过箱式图检测出catering_sale.xls中的异常值

import pandas as pd
import os
import matplotlib.pyplot as plt
f1=pd.read_excel('C:\\Users\Administrator\.spyder-py3\catering_sale.xls')#换为自己的位置
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False
plt.figure(figsize=(8,8))
t=f1.boxplot(return_type='dict')
x=t['fliers'][0].get_xdata()
y=t['fliers'][0].get_ydata()
y.sort()
for i in range(len(x)):
    if i>0:
        plt.annotate(y[i],xy=(x[i],y[i]),xytext=(x[i]+0.05-0.8/(y[i]-y[i-1]),y[i]))
    else:
        plt.annotate(y[i],xy=(x[i],y[i]),xytext=(x[i]+0.8,y[i]))
plt.show()

使用describe()查看catering_sale.xls数据的基本情况,通过箱式图检测出catering_sale.xls中的异常值相关推荐

  1. 箱式图 添加异常值平均值_什么是脏数据?怎样用箱形图分析异常值?终于有人讲明白了...

    导读:数据质量分析是数据挖掘中数据准备过程的重要一环,是数据预处理的前提,也是数据挖掘分析结论有效性和准确性的基础.没有可信的数据,数据挖掘构建的模型将是空中楼阁. 数据质量分析的主要任务是检查原始数 ...

  2. 数据特征分析-正太分布 (QQ图)

    qq图通过把测试样本数据的分位数与已知分布进行比较,从而检验数据的分布情况. qq图是一种散点图,对应于正态分布的qq图,就是有标准正态分布的分位数(分为点即分位数)为横坐标.样本值为纵坐标的散点图. ...

  3. ubuntu中显示本机的gpu_Ubuntu下实时查看Nvidia显卡显存占用情况和GPU温度

    一.查看Nvidia显卡显存占用情况 查看Nvidia显卡显存占用情况 nvidia-smi 效果如下: 显示的表格中: Fan: 风扇转速(0%–100%),N/A表示没有风扇 Temp: GPU温 ...

  4. Ubuntu下实时查看Nvidia显卡显存占用情况和GPU温度

    一.查看Nvidia显卡显存占用情况 查看Nvidia显卡显存占用情况 nvidia-smi 效果如下: 显示的表格中: Fan: 风扇转速(0%–100%),N/A表示没有风扇 Temp: GPU温 ...

  5. 诚之和:什么是异常值?如何在统计数据中查找异常值

    异常值是数据集的重要组成部分.它们可以保存有关您数据的有用信息.异常值可以为您正在研究的数据提供有用的见解,并且它们可以对统计结果产生影响.这可能会帮助您发现不一致之处并检测统计过程中的任何错误.因此 ...

  6. 数据正太分布验证——正太QQ图

    正态QQ图的原理 QQ图通过把测试样本数据的分位数与已知分布相比较,从而来检验数据的分布情况.QQ图是一种散点图,对应于正态分布的QQ图,就是由标准正态分布的分位数为横坐标,样本值为纵坐标的散点图.要 ...

  7. pandas查看属性和数据

    10.2  查看其属性.概览 1.属性 df.shape # 查看形状,⾏数和列数 df.dtypes # 查看数据类型 df.index # ⾏标签 df.columns # 列标签 df.valu ...

  8. pandas使用str函数和contains函数查看dataframe特定数据列中是否匹配或包含特定模式的字符串(match or contain a pattern in column value)

    pandas使用str函数和contains函数查看dataframe特定数据列中是否匹配或包含特定模式的字符串(match or contain a pattern in column value) ...

  9. R语言write.xlsx函数将数据写入Excel文件:写入Excel文件并自定义表单的名称、将数据写入Excel文件新的表单(sheet)中、将文件保存为xls文件格式(而不是xlsx)

    R语言write.xlsx函数将数据写入Excel文件:写入Excel文件并自定义表单的名称.将数据写入Excel文件新的表单(sheet)中.将文件保存为xls文件格式(而不是xlsx) 目录

最新文章

  1. dz mysql日志清理_Discuz教程:如何准确的清理数据库
  2. Kibana安装及简单使用
  3. 利用python将txt文件中的内容写入Excel文件中
  4. Vue ui 大法哪家强?
  5. php 2个经纬度之间的距离,php计算两个经纬度之间的距离
  6. html文字阴影php,HTML_html5文字阴影效果text-shadow使用示例,复制代码代码如下: !DOCTYPE h - phpStudy...
  7. 企业内部IT报修是如何操作的?
  8. BD_source code for problem 1555
  9. 高中计算机教学设计案例分析,高一年级信息技术教学设计(案例)
  10. 数据分析案例-电影数据可视化分析
  11. matlab kappa风险分析,我为什么反对在属性数据MSA中用Kappa分析(上) | 汽车质量管理笔记...
  12. drupal 8 php filter,Drupal 7 与 Drupal 8 的一些变化
  13. 安卓自定义View进阶-多点触控详解
  14. SuperMap iObjects .NET开发ASP .NET网站入门
  15. Mac运行node.js连接oracle数据库报DPI-1047: Cannot locate a 64-bit Oracle Client library: “dlopen(libclntsh.dy
  16. pytorch CNN手写字体识别
  17. app屏幕随手势放大缩小
  18. 微信小程序动态绑定unit-id
  19. 【题解】P2324[SCOI2005] 骑士精神
  20. 《惢客创业日记》2018.12.27(周四)重要的事情说三遍 上篇

热门文章

  1. Window线程安全与线程控制函数
  2. input 正则控制输入
  3. 优秀程序员的十个习惯
  4. 2020年ui设计师就业前景怎么样?2020ui设计师的缺口大吗
  5. 痞子衡嵌入式:ARM Cortex-M开发文件详解(3)- 工程文件(.ewp)
  6. PHP7 搭建简易的学生管理系统(四)
  7. c语言中用什么表示真假,C语言中如何表示“真”和“假”?系统如何判断一个量的“真”和“假”?...
  8. 【Python爬虫】Python网络爬虫案例:维基百科
  9. H5流式播放(FMP4转封装与mediaSource)
  10. 50个最佳机器学习公共数据集