从集中趋势和离中趋势两个方面进行分析:

1、集中趋势度量

(1)均值

主要问题时对极端值比较敏感,因此可以使用截断均值来度量。

算术平均数:=mean()

几何平均数:=exp(mean(log()))

计算数据样本的指定阶中心距(R语言):moment(X,order),计算样本X的order阶的中心距。

(2)中位数

(3)众数

众数更适用于定性变量。众数不具有唯一性。

2、离中趋势度量

(1)极差

极差 = 最大值 - 最小值

极差的问题是忽略了位于最大值和最小值之间的数据是如何分布的。

(2)标准差

(3)变异系数

度量标准差相对于均值的离中趋势,用来比较两个或多个具有不同单位或不同波动幅度的数据集的离中趋势。

(4)四分位数间距

上四分位数与下四分位数之差,包含了全部观察值的一半。

#python
#编辑dataframe的describe()方法import pandas as pddata = pd.read_excel('catering_sale.xls',index_col = u'日期')
data = data[(data[u'销量']>400) & (data[u'销量']<5000)] #过滤异常数据
statistics = data.describe()statistics.loc['range'] = statistics.loc['max']-statistics.loc['min'] #极差
statistics.loc['var'] = statistics.loc['std']/statistics.loc['mean'] #变异系数
statistics.loc['dis'] = statistics.loc['75%']-statistics.loc['25%'] #四分位数间距statistics

输出结果为:

数据分析之定量数据的描述统计相关推荐

  1. 系统的认识大数据人工智能数据分析中的数据

    今天,大量数据.信息充斥我的日常生活和工作中,仿佛生活在数据和信息的海洋中,各类信息严重影响了我们的生活,碎片.垃圾.过时信息耗费了我们宝贵时间,最后可留在我们大脑中的数据.信息和知识少之又少,如何提 ...

  2. 数据分析系列之数据探索

    根据观测,调查收集到的初步的样本数据集后,接下来要考虑的是样本的数据集的数量和质量是否满足模型构建的要求 ,是否出现从未设想过的数据状态?其中有什么明显的规律趋势,各因素之间有什么关联性?通过检验数据 ...

  3. Python数据分析pandas之数据拼接与连接

    Python数据分析pandas之数据拼接与连接 数据拼接处理 数据拼接处理指的是numpy.pandas里对数据的拼接.连接.合并等多种方法的概称.有时我们处理的数据会分很多步骤,而中间或者最终的结 ...

  4. 深度解析数据分析、大数据工程师和数据科学家的区别

    数据越来越多的影响并塑造着那些我们每天都要交互的系统.不管是你使用Siri,google搜索,还是浏览facebook的好友动态,你都在消费者数据分析的结果.我们赋予了数据如此大的转变的能力,也难怪近 ...

  5. 数据分析和大数据哪个更吃香_处理数据,大数据甚至更大数据的17种策略

    数据分析和大数据哪个更吃香 Dealing with big data can be tricky. No one likes out of memory errors. ☹️ No one like ...

  6. mysql数据生产数据分析_基于MySQL玩转SQL数据分析课程 互联网数据分析师-SQL数据分析实战视频教程...

    基于MySQL玩转SQL数据分析课程 互联网数据分析师-SQL数据分析实战视频教程 课程目录 (1)SQL与数Ju分析;目录中文件数:23个 (1) 开课-课时3SQL与数Ju库的价值.flv (2) ...

  7. 多源异构数据分析为什么需要数据湖?

    随着我国网络化.信息化和智能化水平的不断提高,来自互联网数据.移动数据.社交媒体数据.物联网数据的规模,远远大于传统数据中心产生的数据. 对企业来说,拥有处理多源异构数据分析的能力,将为实现这些多种数 ...

  8. 大数据可视化python_大数据分析之Python数据可视化的四种简易方法

    本篇文章探讨了大数据分析之Python数据可视化的四种简易方法,希望阅读本篇文章以后大家有所收获,帮助大家对相关内容的理解更加深入. < 数据可视化是任何数据科学或机器学习项目的一个重要组成部分 ...

  9. 数据分析 常用的数据指标

    数据分析 常用的数据指标 数据指标的作用是用来衡量.追踪和监控业务的,对于一项具体的业务来说,它所包含的数据通常有三大类:用户数据(谁).行为数据(做了什么).产品数据(对应的产品是什么).那么,相应 ...

最新文章

  1. python if语句多个条件-Python中if有多个条件怎么办
  2. Lua移植到arm上 并实现在arm上 可以让lua脚本调c语言,C语言调用lua脚本
  3. 预算为0如何拉用户?类类教你5个独门绝技,并说说一些陷阱!
  4. Spring下载地址
  5. pdm 导入mysql 注释_PowerDesigner逆向导入MYSQL数据库并显示中文注释(转载)
  6. html记仇表情包源码,写小本本记仇表情包
  7. 邓俊辉数据结构学习-8-2-B树
  8. c#获取电脑硬件信息参数说明(CPU篇 Win32_Processor)
  9. csharp为何不流行_“我太南了”这些年度流行语到底是怎么选的?
  10. php utf8 正则中文表达式
  11. Java代码规范之编程规约
  12. 纹理——灰度共生矩阵公式及代码
  13. 使用php的GD库拼接图片
  14. uniapp(H5) + signalr 制作的简单的卡牌游戏
  15. matlab程序vpa用处,Matlab 提高精度 vpa
  16. SATA硬盘和IDE硬盘的区别
  17. 运动助手卡密增加了,周卡来领取!
  18. 编程实现古典问题(兔子生崽):有一对兔子,从出生后第3个月起每个月都生一对兔子,小兔子长到第三个月后每个月又生一对兔子,假如兔子都不死,问每个月的兔子总数为多少?
  19. 多款优秀的支持C、C++等多种语言的网络在线编译器
  20. Pytorch-《Deep learning with pytorch》1.2.2 使用GAN将“马变成斑马”

热门文章

  1. 如何将MathType嵌入Office 2016
  2. 徐凌云老师--沪师经纪
  3. 国产软件漏洞分析系列3:泛微OA e-cology 8.1代码审计(1)
  4. java excel图片压缩_java将HSSFWorkbook生成的excel压缩到zip中
  5. 从零开始跑ORB_SLAM2(一) 前期准备与环境配置
  6. 小羊驼和你一起学习cocos2d-x之四(摇杆)
  7. 视频大数据技术在智慧城市建设中的应用
  8. 笔记本计算机虚拟技术,教大家联想笔记本电脑如何打开Intel 虚拟化技术
  9. 【个人学习记录】从0开始学习前端开发
  10. element弹出toast提示窗口