长按二维码,关注[学术点滴]获取更多资讯。

问:拿到一组数据首先要干什么?答:进行数据的基本分布描述
本次推文分两部分
第一部分:理论部分
第二部分:SPSS实战操作 操作者 微信公众号【学术点滴】
如喜欢此种方式介绍统计学和SPSS操作请点击右下角“在看”或分享出去,将决定之后的推送方式。第一部分:理论部分一组数据的描述性统计分析

集中趋势的度量
集中趋势是指一组数据向某一中心值靠拢的程度,它反应了一组数据中心点的位置所在
众数 :(一组数据中出现次数最多的变量值)
中位数 :(一组数据排序后处于中间位置的变量值)
四分位数 :(一组数据排序后处于25%和75%位置的变量值)
计算方式:

平均数:

几何平均数

众数、中位数和平均数的关系:

图片来源网络

离散程度的度量
离散程度反应的是各变量值远离其中心值的程度
异众比率:(非众数组的频数占总频数的比例)
四分位差:

极差:

平均差:

方差:

标准差:S
变异系数:标准差 除以 平均数

分布的形状
偏态与峰态的度量
偏态是对数据对称性的测度
峰态是对数据分布平峰或尖峰程度的测度
偏态系数与峰态系数:

图:来源网络第二部分:SPSS实战操作 step1:数据源
一家汽车零售店的11名销售人员5月份销售的汽车数量排序后如下:
2,4,7,10,10,10,12,12,14,15,16step2:描述性统计分析该组数据---SPSS实战

step3:输出结果

step4:结果分析1集中趋势:
众数(10)= 中位数(10)< 平均数(10.18),三者基本一致2离散程度:
方差和标准差越大,数据波动越大。多用于不组数据之间的比较。3分布形状:(参考理论部分图进行判断)
偏态系数(-0.631)< 0,故数据属于左偏分布,由于该值在-1~-0.5之间,被认为是中等偏态分布,偏斜程度不大。
一般认为:如果一组数据是对称分布,则偏态系数为0,若偏态系数大于1或小于-1,则为高度偏态分布,在0.5~1或-1~-0.5之间,则为中等偏态分布,该值越接近0,偏斜程度越低。
峰态系数(-0.273)< 0,数据分布偏平,该值越小,数据分布越分散。
正太分布的峰态系数为0,当大于0时为尖峰分布,数据分布更集中,当小于0时为偏平分布,数据分布更分散。
何为正太分布:
正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。
若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。

参考文献:
主要参考《统计学》第六版,作者:贾俊平 何晓群 金勇进 ,搜狗百科,及 相关网络资源多精品教程:
如有错误:加微信 w2013305084 探讨
如喜欢此种方式介绍统计学和SPSS操作请点击右下角“在看”,将决定之后的推送方式。长按二维码,关注[学术点滴]获取更多资讯。

http://weixin.qq.com/r/ui4vN9fELYpSrZNU93uo (二维码自动识别)

怎么计算一组数据的波动_[理论+spss实战]一组数据的描述性统计分析相关推荐

  1. js循环出来的数据补全_加推实战之数据预测

    加推实战之数据预测 ❝ 从数据中发现隐藏在背后的规律,形成知识? ❞ 从需求说起 对活动或成交数据进行未来一段周期的预测 分析并寻求方案 关于预测马上可以想到的是回归 现有的几个拟合方法可以立刻用上? ...

  2. 数据预处理 泰坦尼克号_了解泰坦尼克号数据集的数据预处理

    数据预处理 泰坦尼克号 什么是数据预处理? (What is Data Pre-Processing?) We know from my last blog that data preprocessi ...

  3. 怎么计算一组数据的波动_数据分析(一):数据描述统计

    一. 数据描述统计 看了一个纪录片 - The Joy Of Stats <统计的乐趣>,这虽然是一个关于数据统计分析的纪录短片,但短片中对于数据统计在实际应用场景中应用的效果还是很值得思 ...

  4. hive解决数据倾斜问题_八种解决 Spark 数据倾斜的方法

    有的时候,我们可能会遇到大数据计算中一个最棘手的问题--数据倾斜,此时Spark作业的性能会比期望差很多.数据倾斜调优,就是使用各种技术方案解决不同类型的数据倾斜问题,以保证Spark作业的性能. 数 ...

  5. 掌握大数据数据分析师吗?_要掌握您的数据吗? 这就是为什么您应该关心元数据的原因...

    掌握大数据数据分析师吗? Either you are a data scientist, a data engineer, or someone enthusiastic about data, u ...

  6. python大数据零基础_零基础学习大数据人工智能,学习路线篇!

    大数据处理技术怎么学习呢?首先我们要学习Python语言和Linux操作系统,这两个是学习大数据的基础,学习的顺序不分前后. Python:Python 的排名从去年开始就借助人工智能持续上升,现在它 ...

  7. 大数据技术基础_【基础】大数据技术栈介绍

    大数据技术的体系庞大且复杂,基础的技术包含数据的采集.数据预处理.分布式存储.NoSQL数据库.数据仓库.机器学习.并行计算.可视化等各种技术范畴和不同的技术层面. 首先给出一个通用化的大数据处理框架 ...

  8. vuepc端实现数据加载_多模态注意力机制+多模态数据,完全实现端到端课堂活动检测|ICASSP 2020...

    本文解读的是 ICASSP 2020 论文<MULTIMODAL LEARNING FOR CLASSROOM ACTIVITY DETECTION>,作者来自好未来. 作者 | 李 航 ...

  9. 打开应用蜂窝移动数据就关闭_基于移动应用行为数据的客户流失预测

    打开应用蜂窝移动数据就关闭 In the previous article, we created a logistic regression model to predict user enroll ...

最新文章

  1. 站长之家html视频播放,HTML5视频发展状况
  2. 4、Python —— 函数
  3. HashMap底层原理分析(put、get方法)
  4. mysql查询结果单位换算后小数位数的保留方式
  5. 大学生html5设计大赛方案,2018年大学生三维设计大赛策划书范文
  6. 处理数字_10_计算某列重复最多的值
  7. 按作用域分的话 php的变量可分为,mysql全局变量表
  8. 分享Silverlight/WPF/Windows Phone一周学习导读(12月20日-12月26日)
  9. 真的,没人能逃开“真香定律”
  10. 小马儿随笔十一:朋友一生一起走
  11. js组件slotmachine_Vue.js 系列教程 2:组件,Props,Slots
  12. 华为官方解锁工具_渣男为何爱用华为手机?
  13. android 应用市场发布以及流程(非原创)
  14. USB网卡驱动分析(rt8152)
  15. 科技软文营销标题写作的5个常用技巧
  16. CodeForces比赛规则
  17. 管理学必读书籍排行榜
  18. 【uni-app】模仿微信实现简易发送/取发语音功能
  19. fatal: unable to access 'https://chromium.googlesource.com/webm/libwebp/': Failed to connect to chro
  20. Golang type assertion 类型断言

热门文章

  1. [C#] 等待启动的进程执行完毕
  2. Nero 9 Lite 9.4.12.708 最新最好破解刻录软件下载
  3. python正则表达式——re模块
  4. C++ Primer 5th笔记(chap 16 模板和泛型编程)函数模板显式实参
  5. C++ Primer 5th笔记(chap 13 拷贝控制)实例1
  6. Kubernetes 中创建 Pod 时集群中到底发生了些什么?
  7. 【文字识别小程序】快速识别文字,一款用了就再也离不开的宝藏神器~(出道即巅峰永久免费)
  8. 数据结构课程设计——机票售卖系统(C++)
  9. buu 密码学的心声
  10. 思考:通过MMU/TLB/Cache对安全内存攻击的可能性