一、正态分布介绍

这是在统计学中大名鼎鼎的一种分布,最早由德国的天文学家Moivre提出。

后来,德国数学家高斯(Gauss)首先将其应用于天文学研究,故正态分布也叫“高斯分布”。

高斯的这项工作对后世的科学研究影响极大,以至于德国10马克的钞票上印的是高斯头像和正态分布。

二、正态分布怎么来的

现在我们统计一个班级全部人的身高,为了直观把它们画在数轴上:

然后,把身高分为不同区间

看起来数据点太挤,把它们堆叠起来

将条形图趋势绘制为曲线

上面的曲线就是正态分布,正态分布在这个世界很常见,这会在后面的文章中谈到。

三、举个栗子

下图展示了婴儿和成人身高分布曲线。

曲线形状的不同代表,成年人的身高差异的可能性比婴儿更多。

有两种形状:曲线越宽越低(矮胖型),越窄越高(高瘦型)。这种两种形状反映到生活中的话,婴儿的身高一般差不多,主要集中在20英寸。长大成人后,由于基因和后天的影响,不同人的身高差异开始显现,身高分布就较为广泛,主要在60到80英寸间。

可以直观的看到:不管曲线长相如何,正态分布总是集中在平均值区域,也就是数值集中在中间。

有意思的是,正态分布有个特点:95% 的测量值介于均值±两个标准差。比如,婴儿的95%在20±1.2英寸,成人的介于70±8英寸。

也就是说,只要符合正态分布,未来的测量值,极大的概率(95%)会出现在均值±两个标准差这个区间内。

这个值决定着我们常常听到的置信区间和P值,这个在后面会详细来谈。

三、数学表示

现在看下,正态分布的函数表达式:

可以描述为,随机变量X服从一个位置参数μ,尺度参数σ的概率分布,记做

,或X服从正态分布。一般,μ和σ都是常数,μ代表数据的均值,σ代表数据的标准差。

根据这个上面的正态分布形状,在正态曲线的绘制时,需要知道两个值:

  • 告诉曲线的中心在哪:测量值的均值,μ
  • 告诉曲线有多宽:测量值的标准差,σ

四、R语言绘制

我们可以从图中看到,均值μ决定正态分布的峰值位置,标准差σ决定分布的矮胖,σ越大越胖。

R代码:

  set.seed(1)x <- seq(-10,15,length.out = 1000)# 计算N~(-2,1)y1 <- dnorm(x, -2,1)# 计算N~(2,1)y2 <- dnorm(x, 2, 1)# 计算N~(2,4)y3 <- dnorm(x, 2, 2)# 绘图plot(x, y1, type = "l", col="#f0932b", ylab = "Density", lwd=2, xlim = c(-8,10))lines(x, y2, lwd=2, col="#4834d4")lines(x, y3, lwd=2, col="#95afc0")legend("topright", c("X~N(-2,1)", "X~N(2,1)", "X~N(2,4)"), col = c("#f0932b", "#4834d4", "#95afc0"), lty = c(1),text.font = 12)

致谢:

https://www.youtube.com/channel/UCtYLUTtgS3k1Fg4y5tAhLbw

从零开始学统计 01 | 神奇的正态分布相关推荐

  1. 【数学】从零开始学统计

    从零开始学统计 研一在读,因为本科没有什么扎实的数学基础,现在学习专业课时举步维艰.虽然从前学过一些概率论与数理统计,但是掌握得并不到位,约等于没学过.开一个博客记录一下学习统计学时需要补充的一些前置 ...

  2. 如何画正太分布曲线_图解统计学 01 | 神奇的正态分布

    一.正态分布介绍 这是在统计学中大名鼎鼎的一种分布,最早由德国的天文学家Moivre提出. 后来,德国数学家高斯(Gauss)首先将其应用于天文学研究,故正态分布也叫"高斯分布". ...

  3. 从零开始学统计 07 | 标准误差

    一.标准误差 假设测量一个基因的五个表达量: **标准偏差(Standard Deviation)**量化了一组测量值中的变化程度 同样的实验做五次,每次实验用不同的样本: 把五个样本的平均值放在一个 ...

  4. 从零开始学统计 06 | 样本容量和有效样本容量

    一.样本容量 研究不同个体的表达量,样本容量(Sample size):N=3 研究不同个体的表达量,样本容量(Sample size):N=3 技术重复只能告诉我们该测量基因表达的方法准确性,并不会 ...

  5. 从零开始学统计 09 | 对数转换

    一.对数转换 左边是普通数轴,利用log2函数将左边的数据取它的指数,拿到对数轴 同样获取对数轴的负值: 二.什么时候用对数转换 涉及到倍数变化的时候,就应该使用对数比例尺. 在左侧数值虽然是分别大8 ...

  6. 从零开始学python数据分析-【01】从零开始学Python—数据分析与挖掘概述

    马云曾说"中国正迎来从IT时代到DT时代的变革",DT就是大数据时代.数据已成为企业的核心资产和宝贵资源,企业愈加重视和善加利用数据分析与挖掘技术. 1.1什么是数据分析与挖掘 数 ...

  7. 【从零开始学微服务】01.微服务的过去与现在

    大家好,欢迎来到万猫学社,跟我一起学,你也能成为微服务专家. 微服务的历史 再介绍什么是微服务之前,我们先了解一下微服务架构的历史,也就是微服务是如何提出来的. 2011年5月 2011年5月,在威尼 ...

  8. python ai 教学_【Python AI教学】从零开始学Python AI开发系列01

    原标题:[Python AI教学]从零开始学Python AI开发系列01 欢迎开启新的旅程. 从2016年开始,AI人工智能的热潮扑面而来.而在机器学习和深度学习领域,Python位于最受欢迎的编程 ...

  9. 如何从零开始学python_从零开始学Python【4】--numpy

    原标题:从零开始学Python[4]--numpy 前面3期介绍完Python的基础知识后,我们需要进入数据分析领域的Python实现,首先我们从Numpy模块讲起.该模块主要有这几个功能:数学领域的 ...

最新文章

  1. LeetCode OJ - Copy List with Random Pointer
  2. 浏览器加载和渲染html的顺序
  3. Android(3_2)-----模仿微信界面:通讯录页面
  4. css如何各种中文字体如雅黑、黑体、宋体、楷体等等
  5. xubuntu沒有登錄輸入框,左上角出現白色方框,解決方案
  6. 安全终止MFC线程全
  7. Vite+Vue3页面空白、图标不显示问题解决
  8. windows2k服务和进程详解
  9. SAP澄清概念、理清思路、组织机构
  10. 推荐8个很酷很有用的 HTML5 应用程序
  11. 12864 c语言,单片机12864 c程序
  12. 记一次mykings暗云挖矿木马的排查与解决
  13. 4月13日云栖精选夜读:雪佛兰和阿里妈妈撒红包雨!到店率增加20%是如何做到的?...
  14. oc引导windows蓝屏_电脑蓝屏你别怕,黑客教你代码查看问题
  15. 有监督学习-逻辑回归sklearn应用举例
  16. oracle 官网下载api,Oracle官网下载Java的api离线文档
  17. uva1589 Xiangqi
  18. 小米手机小技巧:小米手机心率测试
  19. 掌上题库V1.2.2全开源版本
  20. MJKDZ PS2手柄控制OskarBot小车(一):Arduino串口发送数据

热门文章

  1. 从像素之间谈起:像素游戏的画面增强(下)
  2. 知识整理——消息队列
  3. 17-JavaSocket开发
  4. Matlab绘制虚数和复数数据
  5. 2022-2028全球卡侬连接器行业调研及趋势分析报告
  6. v880+ 手机自用软件介绍
  7. 安装jenkins-中文版-国内源
  8. 【Pygame小游戏】炸裂全场、超级炸弹人“爆炸”登场,这是你的童年嘛?
  9. tinymce--一款非常好用的富文本编辑器 VUE如何集成tinymce编辑器
  10. STC单片机C语言中的数据类型,stc单片机c语言程序设计 第9章 stc单片机c语言数据类型.pdf...