常用计量统计方法(偏医学科研)

一、医学统计资料分类

1.1 计数资料

  • 定义:计数资料是先将观察单位按某种属性或类别分成若干组,再清点各组观察单位个数所得到的资料。
  • 特质:计数资料每个观察单位之间没有量的差别,但各组之间具有质的不同,不同性质的观察单位不能归入一组。
  • 举例
    • 临床某些检验结果用阳性或阴性反应表示,对一批某病患者检验完毕后,清点呈阳性或阴性反应的各有若干例。
    • 要调查某人群的血型分布,先按A、B、AB、O四型分组,再清点各血型组人数。
  • 处理方法:对这类资料通常是先计算 百分比或率 等相对数,需要时做百分比或率之间的相对数比较,也可做两事物之间相关的相关分析

1.2 计量资料

  • 定义:计量资料是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位。
  • 特质:每个观察单位的观测值之间有量的区别,但同一批观察单位必须是同质的。
  • 举例
    • 检查一批应征青年体重,需要磅秤测量,通常以公斤为单位,测得许多大小不一的体重值。
    • 其它如身长(cm)、血压(mmHg)、脉搏(次/分)、红细胞(万/mm 3 )转氨酶(单位)等,都属于计量资料。
  • 处理方法:对这类资料通常先计算 平均数与标准差 等指标,需要时做各均数之间的指标比较或各变量之间的变量分析

1.3 等级资料或半定量资料

  • 定义:等级资料或半定量资料,是将观察单位按某种属性或某个标志分组,然后清点各组观察单位个数得来的,但所分各组之间具有等级顺序。
  • 特质:这些资料既具有计数资料的特点,又兼有半定量的性质。
  • 举例
    • 对一批急/性/病、毒/性/肝/炎患者,作麝香草酚絮状试验,将试验结果按-、+、++、+++、++++分组,显然各组之间既有等级顺序,又有程序与量的差别。
    • 某病住院病人的治疗结果,按治愈、好转、无效、死亡分组,同样各组之间具有顺序与程度之别。
  • 处理方法:分析等级资料常用的统计指标有比和率,常用的统计方法有秩和检验、参照单位分析等。

1.4 相互转换

  • 性质:在医学实践中,根据分析研究的目的,计数资料与计量资料可以互相转化。
  • 举例1
    1. 血压值本是计量资料
    2. 如果将一组20-40岁成年人的血压值分为血压正常与血压异常两组,再清点各组人数,于是这组血压资料就转化成为计数资料了。
    3. 若将这组血压值按低血压(<80/60毫米汞柱)、正常血压(80-130/60-89毫米汞柱)、轻中度 高血压 (>130/90-110毫米汞柱)、重度 高血压 (>130/>110毫米汞柱)的等级顺序分组,清点各组人数,这时这组血压资料又转化为等级资料了。
  • 举例2
    • 在计量诊断中,将某些阳性体征根据确诊病人的概率赋予分数,分数的多少代表量的大小,这样原来的计数资料就转化为计量资料。
  • 处理方法:由于计量资料可以得到较多的信息,所以凡能计量的,尽量采用计量资料

1.5 生存资料

  • 定义:生存资料,是一类既要考虑观察对象结局是否发生,又要考虑结局发生的时间的资料。
  • 举例
    • (1)某种癌症手术治疗后复发的时间;(2)不同特征的HIV-1感染者病程进展至AIDS期的快慢;(3)同一疾病的患者接受不同治疗方案康复情况的差异;(4)小鼠在注射不同细菌后的不同时间点的存活率;(5)机器连续运行多久后会崩溃等等。
    • 研究异地是否会加快情侣分手,对多对异地和非异地情侣展开观察和记录,在观察的时间里,收集他们从在一起(起点事件)到分手(终点事件)的天数(生存时间,即起点事件到终点事件所经历的时间,时间尺度为天),并收集与分手相关的其它基本信息(性别、年龄、宗教信仰等)

二、计量统计方法

2.1 常用分析维度

  1. 组间比较
  2. 因素分析
  3. 相关性分析
  4. 诊断性分析

2.2 统计地图

见下图



三、补充

3.1 生存分析

3.1.1 基本背景与定义

  • 生存分析背景

    • 生存时间的分布一般不服从正态分布,且不易确定分布类型;
    • 因此,传统的数据分析方法如t检验、线性回归等并不能满足生存资料的分析,需要生存分析
  • 什么是生存分析

    • 将事件的结果(终点事件),和出现这一结果所经历的时间(生存时间)结合起来分析的一种统计分析方法。
  • 生存分析主要特点

    • (1) 生存分析的结局变量为二分类变量,且考虑了每个个体出现某一结局的时间长短;
    • (2) 生存分析可处理生存时间非正态分布的问题。
    • (3) 生存分析可以处理删失数据。
  • 主要研究内容

    • (1)描述生存过程

      • 癌症治疗后的5年存活率;
      • 估计出异地和非异地情侣在一起一个月、两个月等时间点的分手概率
    • (2)比较两组/多组的生存时间
      • 接受不同治疗方案存活时间的长短比较;
    • (3)因素分析,评价各因素对生存时间的影响
      • 患者的存活时间是否受到其性别、年龄、接受的治疗方案等因素的影响。
      • 比较异地情侣分手概率是否受到异地等因素的影响
  • 领域泛化

    • 尽管“生存分析”一名似乎把这个统计方法限定于医学、生物学领域,但是研究涉及 终点事件发生所需时间的资料(time-to-event data) 中的终点事件并不仅限于“每个个体的存活”
    • 举例:用户流失、保险索赔、粉丝退坑等等。

3.1.2 相关概念啊与分析方法

  • 基本概念

    • 生存时间(survival time)或失效时间(failure time)

      • 从某个起始事件开始到某个终点事件的发生所经历的时间,常用符号t。
    • 完全数据(complete data)
      • 观察对象在观察期内出现反应(终点事件),此时记录到的时间信息完整,称为完全数据。
    • 删失数据(censored data)
      • 尚未观察到研究对象出现反应(终点事件)时,即由于某种原因(失访、退出、其它与研究无关的原因、研究终止)停止了随访,记录到的时间信息时不完整的,这种生存时间数据称为不完全数据或截尾值,常用符号+。
  • 选择生存分析的方法: 根据不同研究的目的和资料类型,采用不同的生存分析方法:

    • (1)估计某一生存时间的生存率(exp 五年生存率),可用寿命表法
    • (2)估计中位生存时间,可用寿命表法Kaplan-Meier法
    • (3)研究某因素不同水平的生存时间,可用Kaplan-Meier法
    • (4)研究多种因素对生存时间的影响,可用Cox回归模型
      ​ * Cox回归模型的前提:协变量对生存率的影响不随时间的改变而改变。
  • 生存分析的评价指标:

    • (1)生存率是观察对象经历t个单位时段后仍存活的可能,随时间而变化,是关于时间t的函数,估计生存率时需考虑删失数据。
    • (2)中位生存时间表示恰好有50%的个体尚存活的时间,是最常用的概括性统计量。
    • (3)相对危险度RR解释为暴露组的死亡风险是非暴露组的倍数。
    • (4)Cox回归模型中的参数部分可用于预测一个个体的预后,预后指数越大,表示风险越大,预后越差。

鸣谢/引用:

  1. https://www.home-for-researchers.com/static/index.html#/
  2. https://www.biomart.cn/experiment/430/586/588/53940.htm
  3. https://zhuanlan.zhihu.com/p/165944244
  4. https://zhuanlan.zhihu.com/p/165648309

常用计量统计方法(偏医学科研)相关推荐

  1. 生物群落数据分析最常用的统计方法:回归和混合效应模型、多元统计分析技术及结构方程等数量分析方法

    原文>>>R语言生物群落数据统计分析应用 R 语言作的开源.自由.免费等特点使其广泛应用于生物群落数据统计分析.生物群落数据多样而复杂,涉及众多统计分析方法.本内容以生物群落数据分析 ...

  2. python缺失值与异常值处理_pandas学习(常用数学统计方法总结、读取或保存数据、缺省值和异常值处理)...

    pandas学习(常用数学统计方法总结.读取或保存数据.缺省值和异常值处理) 目录 常用数学统计方法总结 读取或保存数据 缺省值和异常值处理 常用数学统计方法总结 count 计算非NA值的数量 de ...

  3. 统计方法选择思维导图(医学科研)

    统计方法选择思维导图-医学科研 一.统计方法的选择 1.1 单变量 1.2 双变量 1.3 多变量 二.建模思路 2.1 举例-多因素回归模型-建立 2.1.1变量整理和分类 2.1.2 单因素回归分 ...

  4. 统计计量 | 统计学中常用的数据分析方法汇总

    来源:数据Seminar本文约10500字,建议阅读15+分钟 统计学中常用的数据分析方法汇总. Part1描述统计 描述统计是通过图表或数学方法,对数据资料进行整理.分析,并对数据的分布状态.数字特 ...

  5. 中国医科大学2021年12月《医学科研方法》作业考核试题

    中国医科大学2021年12月<医学科研方法>作业考核试题 试卷总分:100 得分:100 一.单选题 (共 20 道试题,共 20 分) 1.下列属于研究主体主动变革研究客体的一种科学活动 ...

  6. R语言统计方法-我常用的

    R语言统计方法-我常用的 文章目录 R语言统计方法-我常用的 一.数据与R 二.数据的描述统计量 三.方差分析 一.数据与R ①直接录入数据 names<-c(列名) data<-c() ...

  7. pandas的基本功能与常用的数学统计方法

    python高级应用与数据分析学习笔记 13 1.pandas的基本功能 1)数据文件读取 文本数据读取 2)索引.选取和数据过滤 3)算术运算和数据对齐 4)函数的应用和映射 5)重置索引 2.数据 ...

  8. pandas 常用的数学统计方法 mad()

    pandas 常用的数学统计方法 mad() 1.定义:根据平均值计算平均绝对距离差. 2.示例: import pandas as pdstudent_info = pd.read_csv(&quo ...

  9. 100天精通Python(数据分析篇)——第62天:pandas常用统计方法大全(含案例)

    文章目录 一.常用统计方法与案例 1. 求和(sum) 2. 求平均值(mean) 3. 求最小值(min) 4. 求最大值(max) 5. 求中位数(median) 6. 求众数(mode) 7. ...

最新文章

  1. LAMP部署搭建————重要文件备份
  2. 半导体基础知识(2):PN结二极管和二极管特性
  3. 洛谷 1303——A*B Problem
  4. java继承关键字super_java学习笔记-继承中super关键字
  5. SQL Server 创建存储过程
  6. 共享内存 传一个类指针_共享内存介绍:Shared Memory
  7. input python_python input 详解
  8. python 判断线程状态_Python线程指南
  9. Python中的高阶函数map
  10. python导入模块以及类_python—模块导入和类
  11. python如何写一个图片进去_python写个图片爬虫
  12. String与StringBuilder区别总结
  13. 转场动画UINavigationControllerDelegate
  14. ASP.NET 推荐书籍
  15. ng-class使用
  16. 解决 Win 10 输入法(仅桌面)的问题
  17. DiffPDF(pdf文件比较工具)官方正式版V6.0.0 | diffpdf如何使用 | 含diffpdf的软件安装教程
  18. 莱维特LEWITT声卡驱动安装设置方法
  19. 警惕食源性疾病——食源性病原菌介绍
  20. 新浪微博共享登录后无法退出切换账号问题解决

热门文章

  1. 数据库sql课后总结
  2. word对齐表格不在一行的文字
  3. 《零基础学C语言》前言
  4. Quartz 任务调度全攻略
  5. 高德地图SDK在API 31以上崩溃的问题
  6. java unpark_Java多线程学习:(wait,notify)--(await,signal)--(park,unpark)
  7. python实现指纹识别毕业论文_(完整版)指纹识别系统本科毕业论文
  8. 2021年CSS 实用手册
  9. 如何只用与非门、或非门构成或门、与门、非门?
  10. 你想要的宏基因组-微生物组知识全在这(180901)