本节书摘来自华章计算机《Excel数据可视化:一样的数据不一样的图表》一书中的第2章,第2.3节,作者 恒盛杰资讯,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.3 概率统计中的正态分布和偏态分布

概率可以理解为随机出现的相对数。随机现象是相对于决定性现象而言的。在一定条件下必然发生某一结果的现象称为决定性现象。随机现象则是指在基本条件不变的情况下,每一次试验或观察前,不能肯定会出现哪种结果,呈现出偶然性,如常见的掷骰子试验。事件的概率是衡量该事件发生的可能性的量度。虽然在一次随机试验中某个事件的发生是带有偶然性的,但那些可在相同条件下大量重复的随机试验却往往呈现出明显的数量规律,其中正态分布和偏态分布就是数据有规律出现的两个代表。

左下图是正态分布图,右下图是偏态分布图。在Excel中通过折线图或散点图可以模拟出如下图所示的效果。要理解分布图形时,需要明白峰度与偏度系数,即它们表示的含义。峰度是用来反映频数分布曲线顶端尖峭或扁平程度的指标,而偏度是用来度量分布是否对称。

服从正态分布的随机变量的概率规律为取与μ邻近的值的概率大,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近;σ越大,分布越分散。

在Excel中若要绘制正态分布图,需要了解NORMDIST函数。该函数返回指定平均值和标准偏差的正态分布函数。此函数在统计方面应用范围广泛(包括假设检验),能建立起一定数据频率分布直方与该数据平均值和标准差所确定的正态分布数据的对照关系。

NORMDIST函数的语法:NORMDIST(x,mean,standard_dev,cumulative),x 为需要计算其分布的数值;mean是分布的均值;standard_dev是分布的标准偏差; cumulative 为一逻辑值,指明函数的形式。如果cumulative为TRUE,函数NORMDIST返回积累分布函数;如果为FALSE,返回概率密度函数。

概率密度函数是一个描述随机变量的输出值,在某个确定的取值点附近的可能性的函数,而积累分布函数就是概率密度函数的积分。

在正态分布中,有两个常在经济学中引用的概念:长尾和肥尾。美国人克里斯·安德森提出的长尾理论认为:只要存储和流通的渠道足够大,需求不旺或销量不佳的产品,共同占据的市场份额,就可以和那些数量不多的热卖品所占据的市场份额,相匹敌甚至更大。

实例 3 计算学生考试成绩的正态分布图

一般考试成绩具有正态分布现象。现假设某班有45个学生,在一次英语考试中学生的成绩分布在54~95分,他们的成绩按着学号依次递增,计算该班学生成绩的累积分布函数图和概率密度函数图。

频数分布有正态分布和偏态分布之分,如果频数分布的高峰向左偏移,长尾向右侧延伸称为正偏态分布,也称右偏态分布;同样的,如果频数分布的高峰向右偏移,长尾向左延伸则称为负偏态分布,也称左偏态分布。偏态分布常用于分析排队问题。

若要理解偏态分布,首先需要掌握的是“偏度”这一指标。偏态又称偏斜系数、偏态系数,是用来帮助判断数据序列的分布规律性的指标。在数据序列呈对称分布(正态分布)的状态下,其均值、中位数和众数重合。且在这三个数的两侧,其他所有的数据完全以对称的方式左右分布。如果数据序列的分布不对称,则均值、中位数和众数必定分处不同的位置。这时,若以均值为参照点,则要么位于均值左侧的数据较多,称之为右偏;要么位于均值右侧的数据较多,称之为左偏;除此无他。考虑到所有数据与均值之间的离差之和应为零这一约束,则当均值左侧数据较多的时候,均值的右侧必定存在数值较大的“离群”数据;同理,当均值右侧数据较多的时候,均值的左侧必定存在数值较小的“离群”数据。

实例 4 不均匀的收入分配

个人收入图常用来研究偏态分布。它在贫困水平、经济增长和不平等相关的社会经济学研究中有广泛的应用。

《Excel数据可视化:一样的数据不一样的图表》——2.3 概率统计中的正态分布和偏态分布...相关推荐

  1. 数据可视化分析票房数据报告_票房收入分析和可视化

    数据可视化分析票房数据报告 Welcome back to my 100 Days of Data Science Challenge Journey. On day 4 and 5, I work ...

  2. 数据可视化笔记1 数据可视化简介(简史、分类、功能、目标)

    文章目录 1.什么是数据可视化 2.为什么要数据可视化 3.数据可视化简史 4.数据可视化的分类 5.数据可视化的功能 6.数据可视化的目标 7.数据可视化工具 1.什么是数据可视化 数据可视化: 创 ...

  3. 漏刻有时数据可视化大屏数据可视化动态模拟演示与自动轮播

    在数据可视化开发的过程中,存在着两种动画效果.一种是KPI指标的模拟演示动画数字滚动累加效果,一种是Echarts图表自动轮播实现自动演示的动画效果. 一.KPI指标的模拟演示动画数字滚动累加效果 实 ...

  4. 【数据分析学习笔记day25】实战案例:世界高峰数据可视化+世界高峰数据可视化 (World's Highest Mountains)

    文章目录 实战案例:世界高峰数据可视化 世界高峰数据可视化 (World's Highest Mountains) 实战案例:世界高峰数据可视化 世界高峰数据可视化 (World's Highest ...

  5. 数据可视化学习(数据可视化基本概念)

    本篇文章翻译自数据可视化入门教程 数据可视化(Data Visualization)和信息可视化(Infographics)是两个相近的专业领域名词.狭义上的数据可视化指的是数据用统计图表方式呈现,而 ...

  6. 数据可视化:世界银行数据(1960-2017)

    数据可视化:世界银行数据(1960-2017) 我选择并下载了数据集The World Bank Data by Indicators 1960-2017用于这次的作业,并选择 Jupyter Not ...

  7. 数据可视化系列-04数据大屏基础知识

    文章目录 5.销售数据看板 5.1 了解数据大屏基础知识 1.数据大屏简介: 2.数据大屏使用场景 3.数据大屏分类 5.2 数据大屏的设计: 1.大屏前端设计流程 2.数据大屏设计尺寸解析 3.可视 ...

  8. d3 svg path添加文本_数据可视化——D3展现数据最炫丽的一面

    热情的或--有温度的"1" 大家好,大家肯定很好奇,数据能是什么样子嘛,不就是干巴巴的1.2.3-!哟,这个火热的"1"好像是挺绚丽的啊,但对不起,这只是数字, ...

  9. python数据可视化字段_python数据爬取及数据可视化分析

    电影网站数据分析及可视化研究 本博客是一篇集数据爬取,存储为excel表格,将数据可视化为一体的博文,数据爬取采用request等方法,数据可视化会使用图表进行展示,有改进的地方还请大家多多指教. 数 ...

最新文章

  1. 关于ASP无组件上传在2003下出错
  2. 在 Kubernetes 上弹性深度学习训练利器 -- Elastic Training Operator
  3. qq模板图片asqq_重要更新 电脑编辑规则、快速滚动、富文本图片、规则模板等十多项更新!...
  4. 查找出系统中大于50k 且小于100k 的文件并删除。
  5. C# StreamReader.ReadLine统计行数的问题
  6. 小技巧:如何在 js 中使用 apply 语法执行 new?
  7. IIS的Server Application Error报错解决方法
  8. 关于使用,NI采集卡+labview信号采集,问题交流【第二贴】
  9. android---动画入门(一)
  10. Markdown 数学公式
  11. c语言扩展编译器,TKStudio内置51编译器SDCC对C语言的扩展(2)
  12. 对于程序员的技术发展和职业规划能否给大家一些建议呢?
  13. 某大厂外包员工抢了个红包,被要求退回,太侮辱人了!千万别做外包,狗都不如...
  14. T470P笔记本安装固态以及固态中安装系统_完整步骤
  15. android各个版本的新特性
  16. AI顶级期刊 IEEE T-PAMI 2020最新论文解读 | Deep Partial Multi-View Learning
  17. tensorflow2.0学习经历:建立一个多元函数拟合模型并移植到ESP32(Arduino IDE)
  18. 深度学习06 - LSTM网络-处理可变长序列输入问题
  19. 如何用标签机打印长序列号的条形码
  20. 全局搜索软件Everything,安利一波呀

热门文章

  1. IT经理应该怎样帮助企业建设信息化系统?
  2. vb word html 乱码,VB6中的字体出现乱码怎么办? – 手机爱问
  3. Python 3.6.5 -实现简单的历史记录查询功能
  4. 国际物流中的拖车报关及流程是怎样的?
  5. mysql导入sql抱错1064_mysql导入数据库错误#1064提示解决方法
  6. VMware中linux添加网卡eth1后找不到网卡的问题Linux重启网卡报错:Bringing up interface eth0:1......
  7. Ubuntu命令查看文件大小
  8. 项目经理人如何做好目标管理?
  9. 学习日记02 GEE查询指定范围(时间,云量)的哨兵影像数量
  10. 什么样的产品才是真正的智能硬件?