发现近年来好多人利用GBD数据库发了很多文章。
GBD数据库(http://ghdx.healthdata.org/gbdresults-tool)中关于疾病的发生率、死亡率、DALY等数据都是现成的,所以主要的工作量包括:

  1. 下载数据并整理成表格:用R比较方便,用Excel也行;
  2. 数据的可视化(画图):用R的ggplot包比较方便,推荐参考书籍:
    Winston Chang. R数据可视化手册(异步图书)人民邮电出版社
  3. 相关变化趋势的计算:常用方法的是Estimated annual percentage change (EAPC),其原理推荐参考文献:
    Hankey BF, et al. Partitioning linear trends in age-adjusted rates. Cancer Causes Control CCC 2000; 11(1):31-5.
  4. 变化趋势的预测:见我的另一篇博文 《利用GBD数据库做未来疾病负担预测》

下面要讲的是EAPC的计算:

1. 数据的整理

以某病的年龄标准化发病率(ASIR)为例:

rm(list = ls())
library(data.table) #个人习惯,喜欢用这个包
library(tidyverse) #个人习惯,为了用管道符years <- fread('I:/years_locations.csv')
regions_years_ASIR <- years[measure_name == 'Incidence' &  #发病率age_name == 'Age-standardized' &  #年龄标准化的metric_name == 'Rate' & #率(每10万人)location_id %in% c(1,44637,44636,44639,44634,44635,32,42,56,70,65,100,96,73,120,104,124,134,138,159,5,21,9,167,174,192,199) & #关注的地理区域sex_name == 'Both',] #所有性别

2. 计算EAPC

EAPC_ASIR <- data.table() #搞个空表格
for (i in unique(regions_years_ASIR$location_id)) {#因为要算每个区域的变化趋势,所以按地理区域编号,一个个拎出来计算temp <- regions_years_ASIR[location_id == i, ]#进行Log变化是因为这个方法基于一个假设:发病率经log变换后其逐年的变化呈线性temp$lograte <- log(temp$val)#线性回归fit <- lm(lograte ~ year, temp)b <- coefficients(fit)CI <- confint(fit)#斜率以及置信区间EAPC0.5 <- format(round(100 * (exp(b[2]) - 1), digits = 2), nsmall = 2)EAPC0.975 <- format(round(100 * (exp(CI[4]) - 1), digits = 2), nsmall = 2)EAPC0.025 <- format(round(100 * (exp(CI[2]) - 1), digits = 2), nsmall = 2)#顺手整理一下数据location_id <- regions_years_ASIR$location_id[regions_years_ASIR$location_id == i] %>% unique()EAPC <- cbind(location_id, EAPC0.025, EAPC0.5, EAPC0.975)EAPC_ASIR <- rbind(EAPC_ASIR,EAPC)
}

3. 整理结果

用R进行数据整理可以避免很多重复劳动

EAPC_ASIR <- EAPC_ASIR[,.(location_id, EAPC_ASIR = paste(EAPC_ASIR$EAPC0.5,' (', EAPC_ASIR$EAPC0.025, ' to ', EAPC_ASIR$EAPC0.975, ')', sep = ''))]write.csv(EAPC_ASIR, 'I:/EAPC_ASIR.csv')

GBD数据库相关文献中的EAPC怎么算?相关推荐

  1. [书籍翻译]12周撰写期刊文章 学术出版成功指南——第 5 周:回顾相关文献

    第 5 周:回顾相关文献 每日任务 第 5 周每日写作任务 预计任务时间 第 1 天(星期一?) 通读第 163 页并填写这些页面上的方框:开始记录您的时间(第 169 页) 60 分钟 第 2 天( ...

  2. Worthington毒液中核酸外切酶的特征及相关文献

    毒液核酸外切酶(磷酸二酯酶 I)连续水解来自 3'-羟基末端的核糖和脱氧核糖寡核苷酸的 5'-单核苷酸.Laskowski, Sr. (1971) 对其进行了审查. 该酶已被广泛用作核酸结构和序列研究 ...

  3. Joomla!开发中数据库相关知识和应用 【转】

    数据是Joomla!开发中重要的一环,可以说,网站终归是将数据有效的展示给用户,因而与数据库连接,有效的返回数据是Joomla!开发基础环节.在Joomla! 1.5中,数据库开发是相当简单的,因为最 ...

  4. 写综述前应如何快速、高效地阅读相关文献?

    [写在前面] 综述一般会引用大量的相关文献,然而这些文献量大.内容多,应如何快速.高效地把相关文献浏览完毕,完美地完成一篇综述? 来源:https://www.zhihu.com/question/3 ...

  5. Oracle数据库相关命令

    从cmd窗口进入SQL命令行 sqlplus / as sysdba; 查询所有用户 (1)使用具有DBA权限的账号登录数据库. (2)执行如下命令. SQL> select username ...

  6. 关于文献中二代测序数据下载(NCBI)的问题

    关于文献中二代测序数据下载(NCBI)的问题 现在二代测序用于生物学研究非常广泛,大部分文章的序列会上传到Sequence Read Archive(SRA)上,这东西也属于NCBI数据库中的吧,我理 ...

  7. 数据库相关中间件介绍

    详见:http://blog.yemou.net/article/query/info/tytfjhfascvhzxcyt412 这里主要介绍互联网行业内有关数据库的相关中间件.数据库相关平台主要解决 ...

  8. 数据库相关的论文笔记

    db-readings 数据库相关的论文笔记 分布式理论-自问自答 GFS阅读问题 为什么存储三个副本?而不是两个或者四个? Chunk的大小为何选择64MB?这个选择主要基于哪些考虑? GFS主要支 ...

  9. 数据库相关中间件收录集

    欢迎支持笔者新作:<深入理解Kafka:核心设计与实践原理>和<RabbitMQ实战指南>,同时欢迎关注笔者的微信公众号:朱小厮的博客. 欢迎跳转到本文的原文链接:https: ...

最新文章

  1. Pycharm中导入requests模块详解
  2. emwin读取sd图片_262.3MB/S读取速率,雷克沙1667X这回谁还敢吐槽
  3. Vivado中Block Memory Generator v8.3的使用
  4. Kali Linux 2017中Scapy运行bug解决
  5. Java数据结构和算法(二)——数组
  6. opengl加载显示3D模型FBX类型文件)
  7. WiFi攻击中的“核武器”长啥样?来,今天咱们开开眼...
  8. 当猪飞起来:也谈创业初期商业模式问题
  9. 基于matlab的pcb焊盘,EDA复习题
  10. 关于SEL的简单总结
  11. 判断类型是否继承_【Java学习 | Javase】继承与多态
  12. 第十四:Pytest进阶之html测试报告
  13. 纯粹经济学 —— 基本概念
  14. 如何使用GoldWave软件将文字转换为语音
  15. Android Binder机制简单了解
  16. oracle添加两个约束,Oracle添加表约束的2种方法
  17. Opencv摄像头相关参数
  18. 【听课笔记】复旦大学遗传学_03基因与基因突变
  19. 每日一问 --什么是信道编码和交织?
  20. 尚硅谷python部分学习笔记

热门文章

  1. 利用js完成根据excel填充网页表单
  2. OpenRisc-27-wishbone接口的vga ipcore的分析与仿真
  3. 点云八个方向极值点获取
  4. html视频标签video旋转播放方向,video视频文件有方向怎么处理?
  5. 利用sqlmap注入获取网址管理员账号密码
  6. 高通处理器规格表(全2022)--转载
  7. OpenHarmony LiteOS C-SKY指令集移植指北
  8. 用sympy库解常微分方程
  9. [CVPR2021]Birds of a Feather: Capturing Avian Shape Models from Images
  10. 第九周项目三:星星图案(一)