第一节 频数分布表与频数分布图

1、频数分布表

频数分布表

2、频数分布图

频数分布图

3、频数分布特征

  • 集中趋势(一组数据向一个位置聚集)
  • 离散趋势(一组数据的分散性或变异度)

4、频数分布类型

  • 对称型
  • 不对称型(偏数值大的一边,正偏态;反之,负偏态)

第二节、集中位置的描述

(1)均数
a. 均数计算
  • 直接法
  • 加权法( k1p1+k2p2+……knpn)/(k1+k2+......kn )
b. 特征
  • 各观察值与均数之和为0
  • 各观察值离均差平方和最小

两个特征表明均数是单峰对称分布观察值最理想的代表值,特别是正态分布或者近似正态分布,不适用于描述偏态分布资料的集中位置

(2) 几何均数(G)

对于正偏态分布,但经过对数变化后呈对称分布;或者观察值之间呈倍数关系或者近似倍数关系

a. 计算
  • 直接法

  • 加权法 (也需要取对数)

b.应用
  1. 适用于观察值间呈倍数或近似倍数关系的资料
  2. 适用于变量呈正偏态分布,对数变换后呈正态或近似正态
  3. 负偏态资料不宜用几何均数,用中位数

(3)中位数

a.从大到小最中间的数
b.应用

中位数不受极端值的影响,因此用于不对称分布类型的资料、两端无确切值或分布不明确的资料


第三节 离散程度的描述

常用指标:极差、四分位数间值、方差、标准差和变异系数

1、极差

最大减最小

2、四分位数间距

(1)百分位数

将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。可表示为:一组n个观测值按数值大小排列。如,处于p%位置的值称第p百分位数,表示为Px。

3、方差

方差用来计算每一个变量(观察值)与总体均数之间的差异。为避免出现离均差总和为零,离均差平方和受样本含量的影响,统计学采用平均离均差平方和来描述变量的变异程度。总体方差计算公式:

实际工作中,总体均数难以得到时,应用样本统计量代替总体参数,经校正后,样本方差计算公式:

(n-1)为自由度,自由度(degree of freedom, df)指的是计算某一统计量时,取值不受限制的变量个数。通常df=n-k。其中n为样本数量,k为被限制的条件数或变量个数,或计算某一统计量时用到其它独立统计量的个数。采用自由度作为分母为了避免用样本方差估计总体方差时偏小。

4、标准差

总体各单位标准值与其平均数离差平方的算术平均数的平方根。它反映组内个体间的离散程度。

5、变异系数

当需要比较两组数据离散程度大小的时候,如果两组数据的测量尺度相差太大,或者数据量纲的不同,直接使用标准差来进行比较不合适,此时就应当消除测量尺度和量纲的影响,从而引入变异系数(CV)来比较其离散程度。


第四节 正态分布及其应用

正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),就是一种重要的连续随机变量的分布类型。

正态分布图

1、特征

正态分布曲线的密度函数

  • 正态曲线在横轴上方均数处最高
  • 正态分布以均数为中心左右对称
  • 有两个参数,位置参数 μ(均数) 和形态参数 σ (标准差)
    正态曲线下,横轴区间(μ-σ,μ+σ)内的面积为68.268949%。
    P{|X-μ|<σ}=2Φ(1)-1=0.6826
    横轴区间(μ-1.96σ,μ+1.96σ)内的面积为95.449974%。
    P{|X-μ|<2σ}=2Φ(2)-1=0.9544
    横轴区间(μ-2.58σ,μ+2.58σ)内的面积为99.730020%。
    P{|X-μ|<3σ}=2Φ(3)-1=0.9974
    由于“小概率事件”和假设检验的基本思想 “小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。由此可见X落在(μ-3σ,μ+3σ)以外的概率小于千分之三,在实际问题中常认为相应的事件是不会发生的,基本上可以把区间(μ-3σ,μ+3σ)看作是随机变量X实际可能的取值区间,这称之为正态分布的“3σ”原则。

2、标准正态分布

均数为0,标准差为1

标准正态分布

3、应用

  • 估计总体变量值的频率分布
  • 制定参考值范围
  • 质量控制

医学统计学 第四章(定量资料的统计描述)相关推荐

  1. 【医学统计学—第四版-孙/人民卫生出版社】——绪论:01 统计学的几个基本概念

    第一章:绪论 一. 统计学的几个基本概念 总体与样本 变量与资料 统计分类方法的选用,与资料类型密切联系. 误差 频率与概率 二. 医学统计工作的基本步骤 1.设计 2.收集资料 3.整理资料 4.分 ...

  2. R语言定量资料的统计描述

    在统计学中,对定量资料(连续变量或者数值变量)的统计描述主要包括集中趋势和离散趋势两个方面.其中集中趋势包括均数.中位数.众数等指标,离散趋势包括方差.标准差.分位数(以上下四分位数最为常用).最大值 ...

  3. 医学统计学 第五章(定性资料的统计描述)

    第一节 常用相对数指标 1.率 频率指标,常用来说明某现象发生的频率或强度,可用百分率.千分率.万分率或十万分率表示. 2.构成比 构成比又称构成指标,常用来说明一事物内部各组成部分所占的比重或分布, ...

  4. 医学统计学 第七章(假设检验)

    1.基本思想 零假设(无效假设)和备择假设(对立假设) 零假设的内容一般是希望能证明为错误的假设,备择假设与之相反 举个例子-实验中,得到了一个差异基因,想证明其是否真的是差异基因达. H0假设(零假 ...

  5. 医学统计学 第六章(总体均数的估计)

    第一节均数的抽样误差与标准误 1.抽样误差 由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全局指标的绝对离差. 2.样本均数的抽样分布特点 各样本均数未必等于总体 ...

  6. 医学统计学和计算机等级,医学统计学计算机操作教程

    医学统计学计算机操作教程 语音 编辑 锁定 上传视频 <医学统计学计算机操作教程>是2007年科学出版社出版的图书,作者是罗家洪.郭秀花. 作    者 罗家洪//郭秀花 ISBN 978 ...

  7. 7教程统计意义_学渣的医学统计学自救笔记(一)

    作为一名最开始连p<0,05,意味着什么都不知道的学渣,统计学确实让人觉得压力山大,学习困难,一开始也想了些办法补救. 比如这个,b站的统计学视频,看来实在是太长了.感觉看不下去. 后面试着自己 ...

  8. 医学统计学第三版 前三章(绪论、调查研究设计、试验研究设计)

    仅作为个人学习记录,如有缘人看到错误还请不吝赐教 第一章 1.数据统计分析包括两方面: a. 统计描述(统计指标:平均数等 表,图) b. 统计推断(在一定可信度情况下,根据样本信息推断总体特征) 2 ...

  9. 机器学习理论《统计学习方法》学习笔记:第四章 朴素贝叶斯法

    机器学习理论<统计学习方法>学习笔记:第四章 朴素贝叶斯法 4 朴素贝叶斯法 4.1 朴素贝叶斯法的学习与分类 4.1.1 基本方法 4.1.2 后验概率最大化的含义 4.2 朴素贝叶斯法 ...

最新文章

  1. Zabbix 3.0 基础介绍 [一]
  2. 细数英特尔收购McAfee可获得安全产品
  3. Web前端进阶之JavaScript模块化编程知识
  4. PyCairo 中的剪裁和屏蔽
  5. 吃了一辈子大米,你还在相信水稻种水里是因为喜欢水?
  6. sigprocmask()函数实例详解,设置信号规定时间堵塞,取消信号堵塞
  7. CSS基础「五」定位
  8. 前端智勇大闯关-第二季-第三题
  9. Opencv之斑点(Blob)检测--SimpleBlobDetector_create
  10. 设备管理是对计算机什么的系统管理,什么是指对计算机系统所有的外部设备的管理...
  11. Image-Line升级FL Studio21水果DAW音乐工作站
  12. portal服务器认证系统有哪些,portal服务器认证过程问题
  13. 99.扩展.霍尔三维结构方法论 vs 切克兰德方法论
  14. 全面、详细、通俗易懂的C语言语法和标准库
  15. excel VBA 字典与集合(Dictionary与Collection)
  16. 泰坦尼克号生存分析(新手入门)
  17. 《数据库系统概念》学习笔记——恢复系统
  18. 英语口语在线测试软件,4个最实用的英语口语练习软件
  19. unity3d 单选框的实现
  20. 射频(RF)一些参数小记

热门文章

  1. js-cookie设置token过期时间
  2. 模式窗口window.showModalDialog()的用法
  3. 怎么让俩张图片在一行_壁纸文案 | 我们俩不会道别
  4. Learning to Rank 简介
  5. MySQL数据库基础(1)数据库基础
  6. JavaWeb - 小米商城:商品添加到购物车
  7. 人脸识别——FaceBook的DeepFace、Google的FaceNet、DeepID
  8. linux下apache 的安装,php安装过程
  9. rem,em,px,rpx等
  10. 开发小程序需要服务器吗?小程序服务器配置要求