GBD数据库相关文献中的EAPC怎么算?
发现近年来好多人利用GBD数据库发了很多文章。
GBD数据库(http://ghdx.healthdata.org/gbdresults-tool)中关于疾病的发生率、死亡率、DALY等数据都是现成的,所以主要的工作量包括:
- 下载数据并整理成表格:用R比较方便,用Excel也行;
- 数据的可视化(画图):用R的ggplot包比较方便,推荐参考书籍:
Winston Chang. R数据可视化手册(异步图书)人民邮电出版社 - 相关变化趋势的计算:常用方法的是Estimated annual percentage change (EAPC),其原理推荐参考文献:
Hankey BF, et al. Partitioning linear trends in age-adjusted rates. Cancer Causes Control CCC 2000; 11(1):31-5. - 变化趋势的预测:见我的另一篇博文 《利用GBD数据库做未来疾病负担预测》
下面要讲的是EAPC的计算:
1. 数据的整理
以某病的年龄标准化发病率(ASIR)为例:
rm(list = ls())
library(data.table) #个人习惯,喜欢用这个包
library(tidyverse) #个人习惯,为了用管道符years <- fread('I:/years_locations.csv')
regions_years_ASIR <- years[measure_name == 'Incidence' & #发病率age_name == 'Age-standardized' & #年龄标准化的metric_name == 'Rate' & #率(每10万人)location_id %in% c(1,44637,44636,44639,44634,44635,32,42,56,70,65,100,96,73,120,104,124,134,138,159,5,21,9,167,174,192,199) & #关注的地理区域sex_name == 'Both',] #所有性别
2. 计算EAPC
EAPC_ASIR <- data.table() #搞个空表格
for (i in unique(regions_years_ASIR$location_id)) {#因为要算每个区域的变化趋势,所以按地理区域编号,一个个拎出来计算temp <- regions_years_ASIR[location_id == i, ]#进行Log变化是因为这个方法基于一个假设:发病率经log变换后其逐年的变化呈线性temp$lograte <- log(temp$val)#线性回归fit <- lm(lograte ~ year, temp)b <- coefficients(fit)CI <- confint(fit)#斜率以及置信区间EAPC0.5 <- format(round(100 * (exp(b[2]) - 1), digits = 2), nsmall = 2)EAPC0.975 <- format(round(100 * (exp(CI[4]) - 1), digits = 2), nsmall = 2)EAPC0.025 <- format(round(100 * (exp(CI[2]) - 1), digits = 2), nsmall = 2)#顺手整理一下数据location_id <- regions_years_ASIR$location_id[regions_years_ASIR$location_id == i] %>% unique()EAPC <- cbind(location_id, EAPC0.025, EAPC0.5, EAPC0.975)EAPC_ASIR <- rbind(EAPC_ASIR,EAPC)
}
3. 整理结果
用R进行数据整理可以避免很多重复劳动
EAPC_ASIR <- EAPC_ASIR[,.(location_id, EAPC_ASIR = paste(EAPC_ASIR$EAPC0.5,' (', EAPC_ASIR$EAPC0.025, ' to ', EAPC_ASIR$EAPC0.975, ')', sep = ''))]write.csv(EAPC_ASIR, 'I:/EAPC_ASIR.csv')
GBD数据库相关文献中的EAPC怎么算?相关推荐
- [书籍翻译]12周撰写期刊文章 学术出版成功指南——第 5 周:回顾相关文献
第 5 周:回顾相关文献 每日任务 第 5 周每日写作任务 预计任务时间 第 1 天(星期一?) 通读第 163 页并填写这些页面上的方框:开始记录您的时间(第 169 页) 60 分钟 第 2 天( ...
- Worthington毒液中核酸外切酶的特征及相关文献
毒液核酸外切酶(磷酸二酯酶 I)连续水解来自 3'-羟基末端的核糖和脱氧核糖寡核苷酸的 5'-单核苷酸.Laskowski, Sr. (1971) 对其进行了审查. 该酶已被广泛用作核酸结构和序列研究 ...
- Joomla!开发中数据库相关知识和应用 【转】
数据是Joomla!开发中重要的一环,可以说,网站终归是将数据有效的展示给用户,因而与数据库连接,有效的返回数据是Joomla!开发基础环节.在Joomla! 1.5中,数据库开发是相当简单的,因为最 ...
- 写综述前应如何快速、高效地阅读相关文献?
[写在前面] 综述一般会引用大量的相关文献,然而这些文献量大.内容多,应如何快速.高效地把相关文献浏览完毕,完美地完成一篇综述? 来源:https://www.zhihu.com/question/3 ...
- Oracle数据库相关命令
从cmd窗口进入SQL命令行 sqlplus / as sysdba; 查询所有用户 (1)使用具有DBA权限的账号登录数据库. (2)执行如下命令. SQL> select username ...
- 关于文献中二代测序数据下载(NCBI)的问题
关于文献中二代测序数据下载(NCBI)的问题 现在二代测序用于生物学研究非常广泛,大部分文章的序列会上传到Sequence Read Archive(SRA)上,这东西也属于NCBI数据库中的吧,我理 ...
- 数据库相关中间件介绍
详见:http://blog.yemou.net/article/query/info/tytfjhfascvhzxcyt412 这里主要介绍互联网行业内有关数据库的相关中间件.数据库相关平台主要解决 ...
- 数据库相关的论文笔记
db-readings 数据库相关的论文笔记 分布式理论-自问自答 GFS阅读问题 为什么存储三个副本?而不是两个或者四个? Chunk的大小为何选择64MB?这个选择主要基于哪些考虑? GFS主要支 ...
- 数据库相关中间件收录集
欢迎支持笔者新作:<深入理解Kafka:核心设计与实践原理>和<RabbitMQ实战指南>,同时欢迎关注笔者的微信公众号:朱小厮的博客. 欢迎跳转到本文的原文链接:https: ...
最新文章
- Pycharm中导入requests模块详解
- emwin读取sd图片_262.3MB/S读取速率,雷克沙1667X这回谁还敢吐槽
- Vivado中Block Memory Generator v8.3的使用
- Kali Linux 2017中Scapy运行bug解决
- Java数据结构和算法(二)——数组
- opengl加载显示3D模型FBX类型文件)
- WiFi攻击中的“核武器”长啥样?来,今天咱们开开眼...
- 当猪飞起来:也谈创业初期商业模式问题
- 基于matlab的pcb焊盘,EDA复习题
- 关于SEL的简单总结
- 判断类型是否继承_【Java学习 | Javase】继承与多态
- 第十四:Pytest进阶之html测试报告
- 纯粹经济学 —— 基本概念
- 如何使用GoldWave软件将文字转换为语音
- Android Binder机制简单了解
- oracle添加两个约束,Oracle添加表约束的2种方法
- Opencv摄像头相关参数
- 【听课笔记】复旦大学遗传学_03基因与基因突变
- 每日一问 --什么是信道编码和交织?
- 尚硅谷python部分学习笔记
热门文章
- 利用js完成根据excel填充网页表单
- OpenRisc-27-wishbone接口的vga ipcore的分析与仿真
- 点云八个方向极值点获取
- html视频标签video旋转播放方向,video视频文件有方向怎么处理?
- 利用sqlmap注入获取网址管理员账号密码
- 高通处理器规格表(全2022)--转载
- OpenHarmony LiteOS C-SKY指令集移植指北
- 用sympy库解常微分方程
- [CVPR2021]Birds of a Feather: Capturing Avian Shape Models from Images
- 第九周项目三:星星图案(一)