GBD数据库相关文献中的EAPC怎么算？

发现近年来好多人利用GBD数据库发了很多文章。
GBD数据库（http://ghdx.healthdata.org/gbdresults-tool）中关于疾病的发生率、死亡率、DALY等数据都是现成的，所以主要的工作量包括：

下载数据并整理成表格：用R比较方便，用Excel也行；
数据的可视化（画图）：用R的ggplot包比较方便，推荐参考书籍：
Winston Chang. R数据可视化手册（异步图书）人民邮电出版社
相关变化趋势的计算：常用方法的是Estimated annual percentage change (EAPC)，其原理推荐参考文献：
Hankey BF, et al. Partitioning linear trends in age-adjusted rates. Cancer Causes Control CCC 2000; 11(1):31-5.
变化趋势的预测：见我的另一篇博文 《利用GBD数据库做未来疾病负担预测》

下面要讲的是EAPC的计算：

1. 数据的整理

以某病的年龄标准化发病率（ASIR）为例：

rm(list = ls())
library(data.table) #个人习惯，喜欢用这个包
library(tidyverse) #个人习惯，为了用管道符years <- fread('I:/years_locations.csv')
regions_years_ASIR <- years[measure_name == 'Incidence' &  #发病率age_name == 'Age-standardized' &  #年龄标准化的metric_name == 'Rate' & #率（每10万人）location_id %in% c(1,44637,44636,44639,44634,44635,32,42,56,70,65,100,96,73,120,104,124,134,138,159,5,21,9,167,174,192,199) & #关注的地理区域sex_name == 'Both',] #所有性别

2. 计算EAPC

EAPC_ASIR <- data.table() #搞个空表格
for (i in unique(regions_years_ASIR$location_id)) {#因为要算每个区域的变化趋势，所以按地理区域编号，一个个拎出来计算temp <- regions_years_ASIR[location_id == i, ]#进行Log变化是因为这个方法基于一个假设：发病率经log变换后其逐年的变化呈线性temp$lograte <- log(temp$val)#线性回归fit <- lm(lograte ~ year, temp)b <- coefficients(fit)CI <- confint(fit)#斜率以及置信区间EAPC0.5 <- format(round(100 * (exp(b[2]) - 1), digits = 2), nsmall = 2)EAPC0.975 <- format(round(100 * (exp(CI[4]) - 1), digits = 2), nsmall = 2)EAPC0.025 <- format(round(100 * (exp(CI[2]) - 1), digits = 2), nsmall = 2)#顺手整理一下数据location_id <- regions_years_ASIR$location_id[regions_years_ASIR$location_id == i] %>% unique()EAPC <- cbind(location_id, EAPC0.025, EAPC0.5, EAPC0.975)EAPC_ASIR <- rbind(EAPC_ASIR,EAPC)
}

3. 整理结果

用R进行数据整理可以避免很多重复劳动

EAPC_ASIR <- EAPC_ASIR[,.(location_id, EAPC_ASIR = paste(EAPC_ASIR$EAPC0.5,' (', EAPC_ASIR$EAPC0.025, ' to ', EAPC_ASIR$EAPC0.975, ')', sep = ''))]write.csv(EAPC_ASIR, 'I:/EAPC_ASIR.csv')

GBD数据库相关文献中的EAPC怎么算？相关推荐

[书籍翻译]12周撰写期刊文章学术出版成功指南——第 5 周：回顾相关文献
第 5 周:回顾相关文献每日任务第 5 周每日写作任务预计任务时间第 1 天(星期一?) 通读第 163 页并填写这些页面上的方框:开始记录您的时间(第 169 页) 60 分钟第 2 天( ...
Worthington毒液中核酸外切酶的特征及相关文献
毒液核酸外切酶(磷酸二酯酶 I)连续水解来自 3'-羟基末端的核糖和脱氧核糖寡核苷酸的 5'-单核苷酸.Laskowski, Sr. (1971) 对其进行了审查. 该酶已被广泛用作核酸结构和序列研究 ...
Joomla!开发中数据库相关知识和应用【转】
数据是Joomla!开发中重要的一环,可以说,网站终归是将数据有效的展示给用户,因而与数据库连接,有效的返回数据是Joomla!开发基础环节.在Joomla! 1.5中,数据库开发是相当简单的,因为最 ...
写综述前应如何快速、高效地阅读相关文献？
[写在前面] 综述一般会引用大量的相关文献,然而这些文献量大.内容多,应如何快速.高效地把相关文献浏览完毕,完美地完成一篇综述? 来源:https://www.zhihu.com/question/3 ...
Oracle数据库相关命令
从cmd窗口进入SQL命令行 sqlplus / as sysdba; 查询所有用户 (1)使用具有DBA权限的账号登录数据库. (2)执行如下命令. SQL> select username ...
关于文献中二代测序数据下载（NCBI）的问题
关于文献中二代测序数据下载(NCBI)的问题现在二代测序用于生物学研究非常广泛,大部分文章的序列会上传到Sequence Read Archive(SRA)上,这东西也属于NCBI数据库中的吧,我理 ...
数据库相关中间件介绍
详见:http://blog.yemou.net/article/query/info/tytfjhfascvhzxcyt412 这里主要介绍互联网行业内有关数据库的相关中间件.数据库相关平台主要解决 ...
数据库相关的论文笔记
db-readings 数据库相关的论文笔记分布式理论-自问自答 GFS阅读问题为什么存储三个副本?而不是两个或者四个? Chunk的大小为何选择64MB?这个选择主要基于哪些考虑? GFS主要支 ...
数据库相关中间件收录集
欢迎支持笔者新作:<深入理解Kafka:核心设计与实践原理>和<RabbitMQ实战指南>,同时欢迎关注笔者的微信公众号:朱小厮的博客. 欢迎跳转到本文的原文链接:https: ...

GBD数据库相关文献中的EAPC怎么算？

1. 数据的整理

2. 计算EAPC

3. 整理结果

GBD数据库相关文献中的EAPC怎么算？相关推荐

最新文章

热门文章