【医学信息学】研究和统计——队列研究和数据分析
以下仅为笔者在学习过程中的个人总结,如有错误,敬请指正 :)
什么是队列研究
队列研究是一种临床研究方法,属于观察性研究。
定义:
特定的人群按照暴露、未暴露于某种因素分为两组,然后追踪一定的时间,比较两组发病或死亡的结局,从而研究暴露因素与结局的关联。
目的:检验病因假设、评价预防的效果、研究疾病的自然史
分类:固定队列、动态队列
类型:前瞻性队列研究(所研究的疾病发病率或者死亡率一般不低于千分之5)、回顾性队列研究、双向队列研究
队列研究的关键指标
危险因素
主要危险因素
可能危险因素
研究结局
发病、死亡、分子标志(血清学指标、分子标志物)
结局的测量应客观、明确、严格;采用国际或国内通用的标准
研究现场
研究人群
样本含量
暴露资料收集与随访
1.基线资料的收集
2.随访
1)随访期:根据疾病的潜伏期(病因作用到临床发现)和暴露与疾病的联系强度做出
2)随访间隔时间:根据具体情况而定,慢性病间隔时间一般为1-2年
3)失访的处理:如果暴露组与为暴露组的失访率相似,失访者和未失访者的结局发生率也相似,则失访将不会产生偏移。所以应尽可能取得失访者结局的信息,或从失访者中抽取样本调查其结局。
比较现实可行的方法:把失访者与未失访者的基线资料中的一些特征加以比较,如果差别不大,则可嘉定结局发生率的差别可能也不大。否则,对选择偏移可能产生的影响应有充分估计。
数据分析/统计
暴露和疾病关联强度指标的计算
相对危险度((Risk Ratio,RR)=率比
定义:暴露组某发病率与非暴露组该病的发病率之比。
RR=暴露组的发病或死亡率 /非暴露组的发病或死亡率
意义:RR说明暴露组发病(死亡)的危险性是非暴露组的多少倍
估计总体的范围,应考虑抽样误差的存在,需要计算其可信区间,通常用95%可信区间:
风险比((Hazard Ratio,HR)
定义:暴露组某发病率与非暴露组该病的风险函数之比。
HR=暴露组的风险函数 h1(t)/非暴露组的风险函数 h2(t) (t 指在相同的时间点上,风险函数指危险率函数、条件死亡率、瞬时死亡率)
*HR主要通过 COX 回归分析得出,需要用软件来算。
意义:RR说明暴露组发病(死亡)的危险性是非暴露组的多少倍
HR 与 RR的区别
1)两者均用于前瞻性研究,HR与RR 意思差不多,但HR 还考虑了时间因素,包含了时间效应的 RR 就是 HR;
2)从终点时间的角度来看, RR 考虑了终点事件的差异,HR 不仅考虑了终点事件的有无,还考虑了到达终点所用的时间及截尾数据。
模型校正
为什么要进行模型矫正
混杂因素
在现实中,疾病的发生往往不是单一因素作用的结果。比如:假定吸烟的人都不太喜欢吃水果,而水果摄入过少也可以导致肺癌。因此很有可能出现一种极端的情况,其实吸烟与肺癌无关,我们之所以在队列研究或病例对照研究中观察到了吸烟与肺癌的关系,完全是“吃水果”作怪。此时,我们将“吃水果”称为“混杂因素”,即表示他们可能会干扰暴露因素与结局变量之间的关系。
怎么进行模型校正
为了排除混杂因素的干扰,需要在统计学上做一些校正,比较常用的方法就是 Cox 风险比例模型和 logistic 回归模型。
在多因素回归分析中,不管是多重线性回归、logistic回归、还是Cox回归,通常的做法是,将我们在研究中关注的暴露/处理因素,以及可能的混杂因素一同放入到回归模型中进行拟合,如果模型显示暴露/处理因素对结局事件的效应值有统计学显著性,则可认为在“调整了”(Adjusted)其他混杂因素的影响后,该暴露/处理因素对于结局事件是一个“独立”(Independent)的影响因素。
参考
小白临床研究的进击之路——队列研究
统计和Meta分析中OR/RR/HR的区别和选择
医学统计学中RR、OR和HR三个关于比值的概念
如何理解回归模型中的"调整"和"独立作用"
【医学信息学】研究和统计——队列研究和数据分析相关推荐
- 【医学信息学】《统计学习导论-基于r应用》的学习总结
以下仅为笔者在学习<统计学习导论-基于r应用>过程中的理解总结,如有错误,敬请指正 统计学习导论概述 什么是统计学习? 对一系列观测值(自变量/预测变量/X,因变量/响应变量/Y)之间的关 ...
- 博后招募 | 哈佛大学医学院招募医学信息学和NLP方向博士后
合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 哈佛大学 哈佛医学院和BWH医院的Division of Pharmaco ...
- 热点综述 | 纵向微生物组研究的统计方法总结
纵向微生物组研究可以捕捉微生物组内的时间变化,以获得对微生物系统的机理认识.近日,<Briefings in Bioinformatics>发表综述文章,回顾了纵向微生物组研究的现有统计方 ...
- axure9数据统计插件_数据分析太棘手?常用8大统计软件解决难题!
在数据分析工作中我们常常需要处理大量的统计问题,这个时候就迫切的需要一个适合统计分析工具,今天小编就给大家介绍八个我们常用的统计分析软件,并且详细介绍各自的特点以及适用的专业,方面大家从中选择一个切合 ...
- [18调剂]南通大学医学信息学系接受调剂,欢迎咨询
点击文末的阅读原文或者公众号界面左下角的调剂信息是计算机/软件等专业的所有调剂信息集合,会一直更新的. 南通医学院是国内最早开设面向临床信息学本科教学的高校,董建成是较早耕耘在医学信息学领域的教授之一 ...
- 医学信息学、标准化、分类和编码
目录 医学信息学定义: 医学信息学标准化: 医学信息分类及编码: ICD-10: 医学信息学定义: 医学信息学是一门以医学信息为主要研究对象,以医学信息的运动规律及应用方法为主要研究内容,以现代化计算 ...
- 作者:那旭(1990-),女,中国医学科学院医学信息研究所研究实习员。
那旭(1990-),女,中国医学科学院医学信息研究所研究实习员,主要研究方向为居民电子健康档案共享.健康数据挖掘.
- 统计软件与数据分析—Lesson2
jupyter Note环境配置,安装及使用以及python数据的读取操作 统计软件与数据分析-Lesson2 1.Jupyter Note环境配置,安装及使用 1.1 Jupyter Note 基本 ...
- matlab在超声成像的应用,MatLab声场仿真软件工具FieldII在医学超声仪器研究中的应用....ppt...
MatLab声场仿真软件工具Field II在医学超声仪器研究中的应用?? Field II是一个基于线性声学,能仿真超声探头所发出的声场以及探头接收声场转化电信号成为图像的过程的一款工具包.开发者为 ...
最新文章
- SiteMapPath基本用法
- MySQL索引管理及执行计划
- js判断是否在iframe和禁止网页在iframe中显示
- 语言4位bcd码怎么加加_S7300400如何使用SCL语言调用SFC1(READ_CLK)读取日期和时间?...
- php+js 表单过期
- java深入学习2多线程(面试必备)
- 安装中文VS2008 SP1 和.NETFRAMEWORK 3.5SP1后智能提示是英文的解决办法
- .NET性能优化方面的总结(转)
- 手机号 验证函数 C++
- IE浏览器打开闪退,崩溃的场景重置
- xampp mysql3306_xmapp_mysql端口冲突解决---Port 3306 in use by......
- Java开发从零开始!java游戏服务器开发教程
- 4.名词性从句的起源与本质
- 百度~网盘下载速度慢怎么办?完美解决,此账号被限速的完美解决,快100倍
- php单页菜单,CSS3单页切换导航菜单界面设计的实现详解
- 新媒体运营:23种免费获取流量的运营套路 ,你知道几种? 黎想
- photoshop cs5 安装过程及序列号
- 基于TIA博途SCL语言的设备累计运行时间FB函数库_具体方法及程序示例
- Surfer绘制等值线图
- 21.VIVO: Visual Vocabulary Pre-Training for Novel Object Captioning
热门文章
- 如何从视频中分离音频/提取音频/提取视频
- 一份新媒体营销推广策划方案 助你升级主管路
- 基本排序算法 【转载】
- 一种针对工控系统攻击的远程检测方案(工控系统安全)
- 使用kms导致Windows defender安全中心空白还原方法(windows defender被关闭仍然显示病毒)
- 2010 ACR/EULAR 类风湿关节炎分类标准的应用:针对非常早期的滑膜炎患者与1987年ACR标准的比较...
- php 接收复杂json,php解析复杂json的实例 - 火车api的应用
- 学会提问的BERT:端到端地从篇章中构建问答对
- 【珍藏版】⼤数据中台架构及解决⽅案
- 海康威视视频对接--rtsp测试地址--vlc测试地址