统计:在我的理解里面,是对各种数字,情况的一个汇总,就像我们每天做的表格一样,汇集了不同种了不同数量不同来源的数据,但这些数据杂乱无章怎么识别,那么就需要一个方法来描述这些数据——描述统计分析,就是让数据可视化简洁化,让人们有需求的对数据进行分析和解读。

描述统计四个指标:

1.平均值

生活中最经常碰到的一种指标,但出现异常数据的时候,容易造成分析错误。

2.四分位数

定义:是指在统计学中把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值,处于25%的位置为下分位点,处于75%的位置为上分位点。

特点:可以识别异常的数据加以核实及删改。

识别异常数据方法:

最小估计值:Q1-k(Q3-Q1)

最大估计值:Q3-k(Q3-Q1)

k=1.5 中度异常

k=3极度异常

(Q1为下分位点,Q2为上分位点)

3.标准差

标准差是对整体数据的波动大小进行判断。

标准差公式:

标准差在不同的应用中有不同的额判断方式:

例如:一个球员是否值得留在球队,可分析其每场比赛得分的标准差,判断是否稳定,标准差越小越好,对于一个刚成立的公司来说,需分析其后期是否有较大的增值空间,则其正向波动越大则越好。

4.标准分

表示某个数值距离平均值有多少个标准差

公式:

【Z=(X-X_bar)/S

式中,X为原始分数,X_bar为原始分的平均数,S为原始分的标准差。】

等于0,等于平均值;

大于零,大于平均值;

小于零,小于平均值。

数据集的选择:表1购买商品数据集

表1购买商品(sample)sam_tianchi_mum_baby_trade_history.csv)

1)表1购买商品字段

用户ID:user_id 是用户注册的ID号,可识别是否为同一个人产生的购买行为

商品编号(item_id):auction_id,用于对应商品名称

商品二级分类:cat_id,商品种类ID,表示商品属于哪个类别

商品一级分类:cat1,商品种类ID,表示商品属于哪个类别

这两个分为一个大类,一个小类,可分析哪类产品销量比较高,销售力度大。

商品属性:property,可分析哪种类别的产品购买需求量大,对于商家来说可以增加相关产品库存量

购买数量:buy_mount:可分析相关产品销量的多少

购买时间:day 可分析在什么时间段内用户购买量最多

你想从该数据集中得到哪些描述统计信息?

1.购买数量的平均值,四分位数,标准差

2.购买时间的标准差

从该数据集中分析哪些业务问题?

1.用户在哪些时间段内购买需求最大,字段需求:购买时间:day,购买数量:buy_mount

2.哪种商品编号购买量, 字段需求:最多商品编号(item_id):auction_id,购买数量:buy_mount

3.该商品编号的商品哪种属性的商品购买量最多,字段需求:商品编号(item_id):auction_id,商品属性:property,购买数量:buy_mount

还需要学习的技能:标准差四分位数在Excel的函数公式,Python箱线使用

怎么统计是否内宿_第二关:描述统计分析相关推荐

  1. 怎么统计是否内宿_白杨SEO:工具推荐第十期——网站数据统计工具之百度统计(二)...

    序言:为啥想到写这篇呢,上周我付费群里一个小伙伴单独微信我的,想起就补一篇吧,上一篇还是几个月前写的呢,哈哈哈. 因为刚写了一篇权重文章花了我两个多小时.这一篇,我就加快进度了哈.这是一篇下,那我先把 ...

  2. java平均差_如何做好描述统计分析

    写在前面 什么是描述性统计分析,这不仅是数据分析面试中最常见的问题,也是我们日常分析中必过的一道关卡. 要把握数据的分布特征,需要从3个方面进行描述:集中趋势.离散程度和分布形状. 1.集中趋势 集中 ...

  3. ArcGIS for Desktop入门教程_第二章_Desktop简介 - ArcGIS知乎-新一代ArcGIS问答社区

    原文:ArcGIS for Desktop入门教程_第二章_Desktop简介 - ArcGIS知乎-新一代ArcGIS问答社区 1 Desktop简介 1.1 ArcGIS for Desktop ...

  4. sql 字符串比较大小_SQL简单查询第二关

    第二关目录大纲: 1.基本的查询语句 2.指定查询条件 3.注释和sql语句注意事项 4.运算符 5.字符串模糊查询 一.基本的查询语句 select <列名1>,<列名2>, ...

  5. c语言运行时更入下一行,C语言高级语言程序设计(一)_第二章 C程序设计基础(二).ppt...

    C语言高级语言程序设计(一)_第二章 C程序设计基础(二) * 问a,b能否交换?不能.示例 传值调用 如何改变参数的值?在后续章节中介绍 下:传值 * 传值的好处 下:问题3.2 * * * 使用范 ...

  6. java周志第二周_20165325 2017-2018-2 《Java程序设计》结对编程_第二周:四则运算

    20165325 2017-2018-2 <Java程序设计>结对编程_第二周:四则运算 一.码云链接 1.Git提交日志已经实现一个功能/一个bug修复的注释说明,如图所示: 2.测试代 ...

  7. iHRM 人力资源管理系统_第9章_文件上传与PDF报表入门_第二节_PDF报表入门

    iHRM 人力资源管理系统_第9章_文件上传与PDF报表入门_第二节_PDF报表入门 文章目录 iHRM 人力资源管理系统_第9章_文件上传与PDF报表入门_第二节_PDF报表入门 PDF报表入门 3 ...

  8. 数学建模国赛 2020B-穿越沙漠 第二关至第六关思路分享

    穿越沙漠第二关至第六关思路 开始讲题之前唠嗑一下: 很感谢所有读者和粉丝对上一篇的第一关解题博文的喜欢,也收到很多人的称赞,我很高兴大家能喜欢我写的东西. 其实这道题的模型在建立之处就是对着六关通用的 ...

  9. java 抢单 缓存服务器_第二节:抢单流程优化1(小白写法→lock写法→服务器缓存+队列→redis缓存+队列)...

    一. 小白写法 1.设计思路 纯DB操作 DB查库存→判断库存→(DB扣减库存+DB创建订单) 2.分析 A.响应非常慢,导致大量请求拿不到结果而报错 B.存在超卖现象 C.扣减库存错误 3.压测结果 ...

最新文章

  1. F-LOAM:基于激光雷达的快速里程计和建图
  2. gossip协议与memberlist实现
  3. 万维网与HTTP协议
  4. unity粒子系统_【笔记】关于unity的粒子系统和UI之间的位置冲突解决
  5. [TCP/IP] TCP如何实现流量控制和拥塞控制
  6. 逻辑漏洞挖掘初步总结篇
  7. 【Task5(2天)】模型调参
  8. 组策略应用之一:映射网络驱动器
  9. 又是一天,这次是网页显示的问题
  10. render注册一个链接组件_详解vue 动态加载并注册组件且通过 render动态创建该组件...
  11. JUnit5 @Disabled测试示例
  12. HttpClient 使用时,出现「no trusted certificate found」的原因 (JDK没有安装相应的证明书)
  13. python pyaudio_Python pyaudio.PyAudio方法代碼示例
  14. cocos creator--DragonBones 骨骼动画入门
  15. java 笔画排序_中文排序 - 笔画
  16. 区块链:核心技术概览
  17. 在VMware上如何创建虚拟机以及安装linux系统
  18. qq邮箱里面html的图片无法显示,QQ邮箱如何不显示图片? QQ邮箱如何不显示图片?...
  19. C#图片压缩,等比例缩小
  20. html手机端页面meta,移动端网页meta设置和响应式

热门文章

  1. Cloud for Customer系统里的附件url,可以通过partner编程自己生成么
  2. 一个nodejs里日志文件的实现
  3. 微信小程序开发系列七:微信小程序的页面跳转
  4. python模型的属性是什么_Python的自定义属性访问跟描述器以及ORM模型的简单介绍...
  5. oracle10递归 nocycle,oracle 使用递归的性能提示测试对比
  6. 最大流之最长递增子序列问题
  7. 西北工业大学matlab安装,西北工业大学Matlab实验报告.doc
  8. 知道python网课答案_Python程序设计答案
  9. python 读取文件_python读取docx文件,就是如此简单
  10. linux搭建hdfs