常用计量统计方法(偏医学科研)
常用计量统计方法(偏医学科研)
一、医学统计资料分类
1.1 计数资料
- 定义:计数资料是先将观察单位按某种属性或类别分成若干组,再清点各组观察单位个数所得到的资料。
- 特质:计数资料每个观察单位之间没有量的差别,但各组之间具有质的不同,不同性质的观察单位不能归入一组。
- 举例:
- 临床某些检验结果用阳性或阴性反应表示,对一批某病患者检验完毕后,清点呈阳性或阴性反应的各有若干例。
- 要调查某人群的血型分布,先按A、B、AB、O四型分组,再清点各血型组人数。
- 处理方法:对这类资料通常是先计算 百分比或率 等相对数,需要时做百分比或率之间的相对数比较,也可做两事物之间相关的相关分析。
1.2 计量资料
- 定义:计量资料是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位。
- 特质:每个观察单位的观测值之间有量的区别,但同一批观察单位必须是同质的。
- 举例:
- 检查一批应征青年体重,需要磅秤测量,通常以公斤为单位,测得许多大小不一的体重值。
- 其它如身长(cm)、血压(mmHg)、脉搏(次/分)、红细胞(万/mm 3 )转氨酶(单位)等,都属于计量资料。
- 处理方法:对这类资料通常先计算 平均数与标准差 等指标,需要时做各均数之间的指标比较或各变量之间的变量分析。
1.3 等级资料或半定量资料
- 定义:等级资料或半定量资料,是将观察单位按某种属性或某个标志分组,然后清点各组观察单位个数得来的,但所分各组之间具有等级顺序。
- 特质:这些资料既具有计数资料的特点,又兼有半定量的性质。
- 举例:
- 对一批急/性/病、毒/性/肝/炎患者,作麝香草酚絮状试验,将试验结果按-、+、++、+++、++++分组,显然各组之间既有等级顺序,又有程序与量的差别。
- 某病住院病人的治疗结果,按治愈、好转、无效、死亡分组,同样各组之间具有顺序与程度之别。
- 处理方法:分析等级资料常用的统计指标有比和率,常用的统计方法有秩和检验、参照单位分析等。
1.4 相互转换
- 性质:在医学实践中,根据分析研究的目的,计数资料与计量资料可以互相转化。
- 举例1:
- 血压值本是计量资料
- 如果将一组20-40岁成年人的血压值分为血压正常与血压异常两组,再清点各组人数,于是这组血压资料就转化成为计数资料了。
- 若将这组血压值按低血压(<80/60毫米汞柱)、正常血压(80-130/60-89毫米汞柱)、轻中度 高血压 (>130/90-110毫米汞柱)、重度 高血压 (>130/>110毫米汞柱)的等级顺序分组,清点各组人数,这时这组血压资料又转化为等级资料了。
- 举例2:
- 在计量诊断中,将某些阳性体征根据确诊病人的概率赋予分数,分数的多少代表量的大小,这样原来的计数资料就转化为计量资料。
- 处理方法:由于计量资料可以得到较多的信息,所以凡能计量的,尽量采用计量资料。
1.5 生存资料
- 定义:生存资料,是一类既要考虑观察对象结局是否发生,又要考虑结局发生的时间的资料。
- 举例:
- (1)某种癌症手术治疗后复发的时间;(2)不同特征的HIV-1感染者病程进展至AIDS期的快慢;(3)同一疾病的患者接受不同治疗方案康复情况的差异;(4)小鼠在注射不同细菌后的不同时间点的存活率;(5)机器连续运行多久后会崩溃等等。
- 研究异地是否会加快情侣分手,对多对异地和非异地情侣展开观察和记录,在观察的时间里,收集他们从在一起(起点事件)到分手(终点事件)的天数(生存时间,即起点事件到终点事件所经历的时间,时间尺度为天),并收集与分手相关的其它基本信息(性别、年龄、宗教信仰等)
二、计量统计方法
2.1 常用分析维度
- 组间比较
- 因素分析
- 相关性分析
- 诊断性分析
2.2 统计地图
见下图
三、补充
3.1 生存分析
3.1.1 基本背景与定义
生存分析背景:
- 生存时间的分布一般不服从正态分布,且不易确定分布类型;
- 因此,传统的数据分析方法如t检验、线性回归等并不能满足生存资料的分析,需要生存分析
什么是生存分析:
- 将事件的结果(终点事件),和出现这一结果所经历的时间(生存时间)结合起来分析的一种统计分析方法。
生存分析主要特点:
- (1) 生存分析的结局变量为二分类变量,且考虑了每个个体出现某一结局的时间长短;
- (2) 生存分析可处理生存时间非正态分布的问题。
- (3) 生存分析可以处理删失数据。
主要研究内容:
- (1)描述生存过程
- 癌症治疗后的5年存活率;
- 估计出异地和非异地情侣在一起一个月、两个月等时间点的分手概率
- (2)比较两组/多组的生存时间
- 接受不同治疗方案存活时间的长短比较;
- (3)因素分析,评价各因素对生存时间的影响
- 患者的存活时间是否受到其性别、年龄、接受的治疗方案等因素的影响。
- 比较异地情侣分手概率是否受到异地等因素的影响
- (1)描述生存过程
领域泛化:
- 尽管“生存分析”一名似乎把这个统计方法限定于医学、生物学领域,但是研究涉及 终点事件发生所需时间的资料(time-to-event data) 中的终点事件并不仅限于“每个个体的存活”
- 举例:用户流失、保险索赔、粉丝退坑等等。
3.1.2 相关概念啊与分析方法
基本概念:
- 生存时间(survival time)或失效时间(failure time)
- 从某个起始事件开始到某个终点事件的发生所经历的时间,常用符号t。
- 完全数据(complete data)
- 观察对象在观察期内出现反应(终点事件),此时记录到的时间信息完整,称为完全数据。
- 删失数据(censored data)
- 尚未观察到研究对象出现反应(终点事件)时,即由于某种原因(失访、退出、其它与研究无关的原因、研究终止)停止了随访,记录到的时间信息时不完整的,这种生存时间数据称为不完全数据或截尾值,常用符号+。
- 生存时间(survival time)或失效时间(failure time)
选择生存分析的方法: 根据不同研究的目的和资料类型,采用不同的生存分析方法:
- (1)估计某一生存时间的生存率(exp 五年生存率),可用寿命表法;
- (2)估计中位生存时间,可用寿命表法和Kaplan-Meier法;
- (3)研究某因素不同水平的生存时间,可用Kaplan-Meier法;
- (4)研究多种因素对生存时间的影响,可用Cox回归模型。
* Cox回归模型的前提:协变量对生存率的影响不随时间的改变而改变。
生存分析的评价指标:
- (1)生存率是观察对象经历t个单位时段后仍存活的可能,随时间而变化,是关于时间t的函数,估计生存率时需考虑删失数据。
- (2)中位生存时间表示恰好有50%的个体尚存活的时间,是最常用的概括性统计量。
- (3)相对危险度RR解释为暴露组的死亡风险是非暴露组的倍数。
- (4)Cox回归模型中的参数部分可用于预测一个个体的预后,预后指数越大,表示风险越大,预后越差。
鸣谢/引用:
- https://www.home-for-researchers.com/static/index.html#/
- https://www.biomart.cn/experiment/430/586/588/53940.htm
- https://zhuanlan.zhihu.com/p/165944244
- https://zhuanlan.zhihu.com/p/165648309
常用计量统计方法(偏医学科研)相关推荐
- 生物群落数据分析最常用的统计方法:回归和混合效应模型、多元统计分析技术及结构方程等数量分析方法
原文>>>R语言生物群落数据统计分析应用 R 语言作的开源.自由.免费等特点使其广泛应用于生物群落数据统计分析.生物群落数据多样而复杂,涉及众多统计分析方法.本内容以生物群落数据分析 ...
- python缺失值与异常值处理_pandas学习(常用数学统计方法总结、读取或保存数据、缺省值和异常值处理)...
pandas学习(常用数学统计方法总结.读取或保存数据.缺省值和异常值处理) 目录 常用数学统计方法总结 读取或保存数据 缺省值和异常值处理 常用数学统计方法总结 count 计算非NA值的数量 de ...
- 统计方法选择思维导图(医学科研)
统计方法选择思维导图-医学科研 一.统计方法的选择 1.1 单变量 1.2 双变量 1.3 多变量 二.建模思路 2.1 举例-多因素回归模型-建立 2.1.1变量整理和分类 2.1.2 单因素回归分 ...
- 统计计量 | 统计学中常用的数据分析方法汇总
来源:数据Seminar本文约10500字,建议阅读15+分钟 统计学中常用的数据分析方法汇总. Part1描述统计 描述统计是通过图表或数学方法,对数据资料进行整理.分析,并对数据的分布状态.数字特 ...
- 中国医科大学2021年12月《医学科研方法》作业考核试题
中国医科大学2021年12月<医学科研方法>作业考核试题 试卷总分:100 得分:100 一.单选题 (共 20 道试题,共 20 分) 1.下列属于研究主体主动变革研究客体的一种科学活动 ...
- R语言统计方法-我常用的
R语言统计方法-我常用的 文章目录 R语言统计方法-我常用的 一.数据与R 二.数据的描述统计量 三.方差分析 一.数据与R ①直接录入数据 names<-c(列名) data<-c() ...
- pandas的基本功能与常用的数学统计方法
python高级应用与数据分析学习笔记 13 1.pandas的基本功能 1)数据文件读取 文本数据读取 2)索引.选取和数据过滤 3)算术运算和数据对齐 4)函数的应用和映射 5)重置索引 2.数据 ...
- pandas 常用的数学统计方法 mad()
pandas 常用的数学统计方法 mad() 1.定义:根据平均值计算平均绝对距离差. 2.示例: import pandas as pdstudent_info = pd.read_csv(&quo ...
- 100天精通Python(数据分析篇)——第62天:pandas常用统计方法大全(含案例)
文章目录 一.常用统计方法与案例 1. 求和(sum) 2. 求平均值(mean) 3. 求最小值(min) 4. 求最大值(max) 5. 求中位数(median) 6. 求众数(mode) 7. ...
最新文章
- LAMP部署搭建————重要文件备份
- 半导体基础知识(2):PN结二极管和二极管特性
- 洛谷 1303——A*B Problem
- java继承关键字super_java学习笔记-继承中super关键字
- SQL Server 创建存储过程
- 共享内存 传一个类指针_共享内存介绍:Shared Memory
- input python_python input 详解
- python 判断线程状态_Python线程指南
- Python中的高阶函数map
- python导入模块以及类_python—模块导入和类
- python如何写一个图片进去_python写个图片爬虫
- String与StringBuilder区别总结
- 转场动画UINavigationControllerDelegate
- ASP.NET 推荐书籍
- ng-class使用
- 解决 Win 10 输入法(仅桌面)的问题
- DiffPDF(pdf文件比较工具)官方正式版V6.0.0 | diffpdf如何使用 | 含diffpdf的软件安装教程
- 莱维特LEWITT声卡驱动安装设置方法
- 警惕食源性疾病——食源性病原菌介绍
- 新浪微博共享登录后无法退出切换账号问题解决
热门文章
- 数据库sql课后总结
- word对齐表格不在一行的文字
- 《零基础学C语言》前言
- Quartz 任务调度全攻略
- 高德地图SDK在API 31以上崩溃的问题
- java unpark_Java多线程学习:(wait,notify)--(await,signal)--(park,unpark)
- python实现指纹识别毕业论文_(完整版)指纹识别系统本科毕业论文
- 2021年CSS 实用手册
- 如何只用与非门、或非门构成或门、与门、非门?
- 你想要的宏基因组-微生物组知识全在这(180901)