全文共3162字,预计学习时长10分钟

来源:gucheng

冠状病毒或“2019新型冠状病毒肺炎”(COVID-19)是一种引起呼吸道疾病的新型病毒,目前正在世界肆虐。

尽管媒体对于新型冠状病毒做了似乎无穷无尽的报道,许多问题仍未得到解答。确诊病例真的只有目前这么多吗,还是这个数字缩水了?是否还有未报道的死亡人数?病毒每天的传播速度有多快?它有多危险?为了精准评估它所带来的危险,计算死亡率是很有必要的。虽然病毒传播速度很快,但是如果人们感染病毒后没有死亡,这就不算是一个大威胁。

目前,死亡率的计算方法是不正确且具有误导性的。截至目前,死亡率是由死亡人数除以感染人数计算得到的。下图显示了自1月22日以来湖北省具有一定“误导性”的死亡率。基于这种计算,目前的死亡率被确定在2.5%左右。然而,这种计算方法是不正确的,因其没有考虑到一个非常重要的因素:滞后效应。

什么是滞后效应?

假设2020年1月10日有100人感觉不适。对该群体进行一段时间的跟踪。其中一些人在几天后病情加重。一些人康复了,而另一些人仍然患病。如果从现在开始把时间快进一年,就能精确地知道这个群体的死亡人数。其中大多数患者已经康复,其余人则已经死亡。此时,可以按照死亡人数除以最初感染人数来计算该群体的死亡率。例如,可使用这种方法来计算2002年中国爆发SARS病毒时的死亡率,因为当初感染SARS病毒的人要么已经康复要么已经死亡。但COVID-19目前还在流行,因此使用这种算法是不对的。

在不同感染阶段有不同的感染群体。例如,昨天刚刚感染的几千人不会在今天死亡;而今天的死亡人数来自更早感染的群体。因此,用死亡人数除以感染人数的算法是完全错误的。正确方式应该是分别跟踪每个群体,计算每个群体的死亡率。当然,当疫情完全结束后,两种方法便殊途同归了。然而,目前疫情仍在继续,因此这种方法并不适用。相比之下,这种方法适用于在当前计算SARS病毒的死亡率。

下面是描述此次疫情的图表:

X轴是群体成员的感染天数(他们在同一天被感染),Y轴是该群体成员的累计死亡率(死亡人数/感染人数)。

据报道,出现症状之前会有2-14天的潜伏期,而从出现症状距死亡可能还有大约几周时间。因此,不论群体人员是否被感染,感染程度如何,在最初几天的死亡率可能为零。

为了阐释清楚,来看两组不同的群体。一组是来自武汉的25岁男性(以2%的死亡率且在14天内达到顶峰为模型),另一组是80岁男性(以5%的死亡率且在7天内达到顶峰为模型)。可以假定后者疫情发展更为迅速,比前者更早达到更高的高度,且更早进入平原期。这意味着,80岁群体由于其普遍更低的免疫力和更差的健康状况,死亡人数更多,速度更快。这同样适用于心脏病、糖尿病等疾病患者以及长期吸烟者。除了此类因素(老年人和年轻人已经被证明更易患病),群体曲线还会随着国家、财富等因素差异而变化。

所以,为什么不能按照群体计算死亡率呢?

这个想法在理论上似乎很简单:找到每天的感染人数,按照群体级别进行跟踪即可得到死亡率。但实际操作起来有一定的困难。这里列举一些挑战。

1、感染日期:由于潜伏期不同且不定,很难确定感染日期。此外,不同人群的发病症状不同,对每个出现如发烧或咳嗽等症状的人进行统计是非常耗时的。因为感染COVID-19后的症状不明确,模棱两可的症状如咳嗽等很可能只是流感或一般感冒的症状。

2、#/感染人数:可能有很多人没有接受过检测,但携带有不明病毒。更有甚者,在感染后没有发病症状。现在,由于武汉正在隔离,统计稍微容易了一些。

3、死亡时间:因为人们出现发病症状的时间不同,即使在同一天感染的人群,其报告日期也可能不同,因此不能确定人群从感染到死亡要经历多长时间。

4、死亡风险因年龄和健康状况等而异:病人和老年人比健康人的身体脆弱得多。如果每个感染人群中不同风险组的比例改变,那么死亡率也会发生变化。

5、死亡风险因地而异:对于任何快速传播的传染病,由于病毒传播迅速,感染了不同地区的不同人群,决定死亡率的样本选取会存在偏差。迄今为止,死亡率主要来自1月份在武汉感染冠状病毒的患者。当病毒传播到不同地方,死亡率本质上是不同的,因此对地方所构成的威胁必须具有代表性,以便采取充分的预防措施。例如,由于人们的免疫力/健康、公共卫生、医疗服务等因素,冠状病毒对索马里所构成的威胁将远高于瑞士。因此,为对威胁做出精准的评估,死亡率应该以群体为单位表示。

理想情况下,应该如何解决该问题?

我们需要更多群体级别上的细分数据以建立死亡率模型。不幸的是,这些数据似乎并不能得到。

三角图是按群体计算死亡率的正确方式。需要为尽可能同质的群体构建三角图,以确保某些成员不会影响死亡率的准确性。需要关注的正确的细分领域包括年龄、高危医疗群体和国家。通过这些,可以最精准地估算出每个群体的死亡率。

以下是死亡率的三角图示例。

图中,最顶行指较年老的群体,最底行指较年轻的群体。每一列代表感染天数,方块里的数字指该群体的累计死亡人数。从右到左浏览对角的方块,可得到同一天每个群体的死亡人数。

为建立死亡人数模型,做出以下两个假设:

1)所有群体都是5%的死亡率。

2)若感染者死亡,死亡时间将在7天之内。所有数据只来自湖北省。

可以立即看到最高处和最低处之间从冷到暖的变化。这意味着,年老群体最初感染规模较小,而年轻群体较大,表明了COVID-19的传播。(见上图)

尽管这些信息能够描绘出疫情的大致面貌,阐明COVID-19传播的基本性质,但该模型依然有几个缺点。首先,不是所有信息都能被获取,因此整行没有数据。可能有不明的死亡人数,尤其是在疫情中心的武汉。很大程度上可能低估了被感染人数。从感染到死亡的时间长短不明。老人和年轻人、健康人和病人等的混合情况不明。尽管有这些缺陷,这个模型仍具有一定说明性。

以下是表明数据严重错误的一些初步分析。

接下来,使用模型(5%的死亡率和7天的感染-死亡时间)来比较湖北省的预测死亡人数和实际死亡人数。

上图对假定死亡率和死亡时间的模型所得出的累计死亡人数与北京报道的死亡人数进行比较。可以看出,该模型与当前的数字十分接近。然而,考虑到除了死亡时间和死亡率之外还有大量影响因素,并不能完全确定真实的数字是多少。这里是一些重要看法:

如果感染人数如实,那么死亡率很可能远高于2.5%,并接近5%甚至更高。

如果死亡时间超过7天,那么死亡率将远超过5%,并接近10%甚至更高。

如果感染人数大幅增加,那么死亡率可能大幅减小(甚至跌至1%)。

应该注意,通过改变一些参数,可以有多种方式来得到相同的死亡人数。不管怎样,数据很可能存在严重错误(即存在更多的被感染者),或者我们可能面临着严重的危机(死亡率>5%)。

小结:

目前计算COVID-19死亡率的方法是有本质缺陷的,因为它没有考虑滞后效应。

文中展示了一种新的(基于群体的)死亡率计算方法。

使用特定参数(5%的死亡率和7天的死亡天数)的模型与实际数据高度吻合。

要么死亡率高于预期,要么感染者数量远高于报道人数。

图源:约翰霍普金斯医学院

希望世界疫情能得到有效治理。

推荐阅读专题

留言点赞发个朋友圈

我们一起分享AI学习与发展的干货

编译组:贺宇、胡家瑞

相关链接:

https://towardsdatascience.com/why-the-coronavirus-mortality-rate-is-misleading-cc63f571b6a6

如转载,请后台留言,遵守转载规范

推荐文章阅读

ACL2018论文集50篇解读

EMNLP2017论文集28篇论文解读

2018年AI三大顶会中国学术成果全链接

ACL2017论文集:34篇解读干货全在这里

10篇AAAI2017经典论文回顾

长按识别二维码可添加关注

读芯君爱你

​为什么冠状病毒的死亡率具有误导性?相关推荐

  1. 新冠状病毒死亡率问题

    新冠状病毒死亡率问题 用python三种对于格式的控制方法输出 a = 81/2844 b = 100*a c = '%' print(f'{b:.2f}%') print('{:.2f}%'.for ...

  2. 详解医学顶刊《柳叶刀》最新发表新型冠状病毒研究论文

    自微信订阅号<夕小瑶的卖萌屋> 前言 新型冠状病毒(2019-nCoV)的突发恰逢春节,千家万户都对疫情十分关注.令人心痛的是,病毒带来的不止有病痛,还有来自各路媒体的大量谣言和不实解读. ...

  3. medRxiv | 基于网络的人类冠状病毒的药物重定位

    随着新型冠状病毒(2019-nCoV)感染肺炎疫情持续发展,武汉.全国各地以及全球的疫情牵动着每一个人的心.2020年2月5日medRxiv发表了研究工作"Network-based Dru ...

  4. 数据分析如何揭示冠状病毒的真相?

    来源 | hackernoon 编译 | 火火酱,责编 | Carol 出品 | CSDN云计算(ID:CSDNcloud) 最近几天,似乎所有人都陷入了对新型冠状病毒(2019-nCoV)深深的恐惧 ...

  5. 新冠死亡率居高不下,为什么偏偏是意大利?

    全文共3160字,预计学习时长10分钟 图源:unsplash 意大利的封城措施已经过去了一个月,虽然比起最初疫情爆发时期时情况已有所好转,但超过12%的死亡率依然无法让人不揪心.在研究新冠状病毒确诊 ...

  6. 从新型冠状病毒想到清单革命

    清单是日常生活和工作中俯首皆拾的,看起来不起眼,却又透出简单直接的哲学和逻辑. 如何预防新型冠状病毒的清单 <新型冠状病毒感染防护>对于如何预防新型冠状病毒就有这样一个清单: 对于去医院的 ...

  7. 论文翻译——中国武汉市2019年新型冠状病毒感染患者的临床特征

    作者 Chaolin Huang*, Yeming Wang*, Xingwang Li*, Lili Ren*, Jianping Zhao*, Yi Hu*, Li Zhang, Guohui F ...

  8. 利用LDA和主题模型发现9种冠状病毒研究趋势

    作者|Adrian Raudaschl 编译|VK 来源|Towards Data Science 尽管目前正在蔓延的冠状病毒疫情已经很可怕,但观察世界各地的学术界和研究界是多么迅速地开始了解这种病毒 ...

  9. 一个与战争、瘟疫、感染、死亡率有关的图形——南丁格尔玫瑰图

    众所周知,世界上第一个护士便是弗洛伦斯·南丁格尔,她是护理事业的创始人和现代护理教育的奠基人.但也许大家不知道,她也是个伟大的统计学家. 19世纪50年代,在克里米亚战争中,南丁格尔主动申请,自愿担任 ...

最新文章

  1. slot没有毁灭的问题_解析flink之perjob模式下yn参数不生效问题
  2. 为什么阿里强制 boolean 类型变量不能使用 is 开头?
  3. 优雅地处理重复请求(并发请求)
  4. GitHub超3万星最全面试题库:计算机面试题一网打尽
  5. NewSQL——优化的SQL存储引擎(TokuDB, MemSQL)+?
  6. tcpip运输层不同的两个协议_TCP/IP-运输层-你需要知道的运输层概念
  7. 从Proxy到Vue3数据绑定
  8. NoNode for /hbase/hbaseid解决方案
  9. python打印不同颜色的字_Python 根据日志级别打印不同颜色的日志的方法示例
  10. java控制台输入输出
  11. lpb.wifi index.php,lpb(法国lpb是什么品牌)
  12. 用C++编写一个走迷宫游戏(1.0版)
  13. 寒江独钓前辈的第一个例子的部分分析
  14. 【论文泛读】Leveraging Distribution Alignment via Stein Path for Cross-Domain Cold-Start Recommendation
  15. 【android】Android Studio创建模拟手机虚拟机
  16. openwrt配置内核驱动_OpenWrt添加驱动模块
  17. python海龟教程_Python 零基础 快速入门 趣味教程 (咪博士 海龟绘图 turtle) 7. 条件循环...
  18. Android基于环信SDK开发IM即时聊天(一)
  19. 微信小程序:小秋工具箱开发总结
  20. 利用opencv-python对绿色植物的颜色进行提取

热门文章

  1. WinRAR突现骇人漏洞,官方:没必要修复
  2. 【教程】应用侧连接华为云IoT平台
  3. 微信小程序:云开发开通
  4. JetBrains Rider想创建新工程一直显示Syncing Project Templates...
  5. 游戏计算机电源,吃鸡一族看过来,游戏PC应配什么电源?
  6. android 辅助功能 模拟点击,Android模拟点击的四种方式
  7. 怎么处理微信web页面字体自动变大
  8. i7台式电脑配置推荐_专业设计师电脑配置推荐 i7-7700配K2200组装台式电脑配置及报价...
  9. openstack ovs-vswitch收包流程
  10. python列表里含有字典的排序