研究生课程笔记:软件包在流行病学中的应用(三)——STATA软件
关键词:STATA软件基本操作、STATA对于流行病学研究的实现、STATA对复杂抽样设计样本量计算的实现
一、STATA软件基本操作
- 这部分网上教程有很多,也可以直接根据stata自带的help功能进行自学,在此只记录课程中提及的功能项。
1. 变量编辑
1.1
赋值:label
type(按精度区分)
1) 整型:int(32), short(16), long(32)
2) 实型:float(32), double(64) [运算精度要求高,因此占内存也多]
3) 字符型:char, byte
具体区别可输入help data type进行理解
format 位数
1.2 变量编码原则
1)因变量:1结局,0无结局
2)自变量:数字大的默认为暴露
2.编程语言(部分)
1)赋值:
recode sex (1=1 “男”) (2=0 “女”), gen(sex1) label(sex1)
gen bmi=round(weight/(height/100)^2*10)/10
recode bmi (min/23.9=1 “正常或消瘦”) (24.0/27.9=2 “超重”) (28.0/max=3 “肥胖”), gen(bmig) label(bmig)
gen hyp=1 if sbp>=140 | dbp>=90 | hmed1
replace hyp=0 if sbp<140 & dbp<90 & hmed2
svyset CLUSTER, vce(linearized) singleunit(missing)
抽样
#描述性分布,统计效应
svy linearized : tabulate sex, cell ci obs percent
svy linearized : tabulate hyp, cell deff obs percent
#poisson回归和logistic回归分析
svy linearized : poisson bmig sex1, irr
svy linearized : logistic bmig sex1
tab 和sum:数据呈现
‘tab’即‘tabulate’是将所选数据表格化,感觉多用于分类变量
'sum’即‘summarize’是你所选数据variable的简单分析包括平均数mean,标准差standard deviation,最小值min和最大值max。感觉多用于数值变量。
注意:①好习惯是不要在原变量上修改,需创建新变量
②若不想取整数,把round换成trunc
③在if语句中,等于是“== ",and是”&“
④变量名大小写要区分
⑤!missing(sbp),限制不为缺失值(因为stata会把缺失值默认为无限大值,易纳入条件变量中)
二、流行病学应用
1.概述
本段内容基于STATA中的以下功能模块进行,结合病例对照、队列研究的流行病学知识进行探讨。
2.队列研究
1/ 发病率( 发病率( incidence incidence incidence rate rate ),或者 称为 发病密度, 发病密度, 分母为人时;一般是慢性病或者病程/观察期长时使用
累积发病率( incidence incidence incidence ratio ratio ratio),分母为人数。 可以在急性事件如心肌梗死中使用。
2/ 可计算的
频率指标:暴露组/对照组发病率(病例对照中为病例/对照组暴露率,后不赘述)
常以10万人年为单位
关联效应指标:率比(相对危险度,RR)
率差(归因危险度,AD/RD)
归因危险度百分比(病因分值,AR%)
保护率(预防分值,prev.frac…ex):(对照组发病率-实验组发病率)/对照组发病率*100%
但是不可以有人群相对危险度百分比(PAR,因为这里是人年)
3/ STATA中可通过输入数据库 / calculator 计算
代码:input exposure case cell
1 1 20
0 1 40
1 0 24
0 0 23
end
or input exposure case pt
1 20 2321
0 40 2142
1 24 1255
0 23 1236
end
注意:一定要进行cell的设置!不然后期做分层分析/加权时没法做下去
4/ 分层分析:
Mantel-Haenszel法,控制混杂后结果,以及判断是否为混杂因素
5/ 剂量反应关系研究
Tabulate odds of failure by category --case exposed variable 结局变量/ control exposed variable 暴露变量;
注意加权问题
3.抽样设计
1)菜单栏目:survey data analysis – setup and utilities – declare survey design for settings
2) fpc(finite population correction):有限人口校正
①抽样比例很高时需要使用fpc进行校正(50%√,1%×)
②svyset模块:不允许1-nh范围内,≤1系统自动理解为抽样率
3)直接标准化法
已知:样本分层人口总数,分层死亡人数/死亡率
总体数,死亡人数,死亡率
求解:粗死亡率:样本死亡人数/总人口数
标化死亡率:加权(样本每层死亡率*每层总人口数)/总人口数
研究生课程笔记:软件包在流行病学中的应用(三)——STATA软件相关推荐
- 大数据算法课程笔记1:寻找中值算法之随机选取,中值的中值,One Pass算法
大数据算法的课程笔记,包括四种中值搜索算法.包括最简单的先搜索后检索,平均算法复杂度为O(N)的简单随机选取算法,确定性的中值的中值算法,大概率返回中值的one pass算法. 1. 最简单的方法:先 ...
- selenium课程笔记3-使用selenium中的webdriver对浏览器操作-页面元素定位及操作
1.打开浏览器,打开网页 1 from selenium import webdriver 2 dr=webdriver.Chrome() 3 dr.get('http://www.baidu.com ...
- 【积累】《国产操作系统(麒麟)运维师》课程笔记-第6章-中
文章目录 第6章:麒麟操作系统管理-中 6.15 文件与目录管理 6.16 文件与目录操作(1) 6.17 文件与目录操作(2) 6.18 文件处理 6.19 文件权限 6.20 ACL权限 6.21 ...
- 分享下近两个月美帝MBA研究生课程学习总结以及心得体会(PS.又可以开始软件开源分享了!)...
由于国内外疫情十分严重,故当下上课方式改为线上进行,为此我为了抽出更多的时间专心学习向公司领导提了辞职,希望以后有机会的话还可以再回去吧.在世界上的一个开源平台Canvas进行学习,时间过得很快,为期 ...
- 黑马毕向东Java课程笔记(day07):面向对象(第三部分)继承+抽象类+模板方法设计模式+接口+final+继承补充(就业班)
在这一部分中,我们将讲解有关继承的相关内容,包括继承的概述.继承的特点.super关键字.函数覆盖.子类的实例化过程.final关键字这几个部分的内容. 1.继承的概述以及特点 1.1.概述 ...
- Coursera吴恩达《神经网络与深度学习》课程笔记(3)-- 神经网络基础之Python与向量化
红色石头的个人网站:redstonewill.com 上节课我们主要介绍了逻辑回归,以输出概率的形式来处理二分类问题.我们介绍了逻辑回归的Cost function表达式,并使用梯度下降算法来计算最小 ...
- 【笔记3-7】CS224N课程笔记 - 神经网络机器翻译seq2seq注意力机制
CS224N(七)Neural Machine Translation, Seq2seq and Attention seq2seq神经网络机器翻译 历史方法 seq2seq基础 seq2seq - ...
- 《高级计算机网络》之无线传感网——大连理工大学研究生课程整理笔记(非常详细,通俗易懂)
注:本文是根据大连理工大学研究生课程<高级计算机网络>整理的笔记,非常全面和详细,通俗易懂,对于您考试或者面试都会有很大的帮助,如果对您有用,请点个赞吧!! <高级计算机网络> ...
- 《高级计算机网络》之物联网——大连理工大学研究生课程整理笔记(非常详细,通俗易懂)
注:本文是根据大连理工大学高级计算机网络课程整理的笔记,非常详细,如果对你有帮助,请点个赞吧! <高级计算机网络>之移动自组网--大连理工大学研究生课程整理笔记(非常详细,通俗易懂) &l ...
最新文章
- 获取运行中的TeamViewer的账号和密码--中文版
- docx.opc.exceptions.PackageNotFoundError: Package not found at ‘文件名.docx‘ 问题解决
- 读写锁ReadWriteLock和缓存实例
- T端音乐盒子-NPC脚本
- Qt Creator 快捷键
- LeetCode 217 存在重复元素
- webform计算某几列结果_WebForm获取checkbox选中的值(几个简单的示例)
- Maven 依赖-镜像仓库替换为 -- 阿里云镜像仓库(飞快实现 pom 引入)
- Java中List和Map接口之间的区别
- oracle 更新数据更新不进去_关于微软及Oracle安全更新汇总的通知
- java io重定向,java中的标准重定向标准IO_java标准IO_java构建器_课课家
- 第五章 创建高性能的索引
- Mysql基于Linux上的安装
- 电信网通南北分治 学者呼吁应查处
- Layui 表格table自定义每一列的样式
- Jsp与Servlet面试题
- 生活小窍门——》馒头又白又大
- linux 防火墙reject,CentOS 防火墙配置与REJECT导致没有生效问题
- SharePoint2016 - How to create App Catalog site?
- CentOS-Linux操作系统镜像文件下载