基于SAS对美国新冠数据的分析
数据来源于kagglehttps://www.kaggle.com/datasets/antgoldbloom/covid19-data-from-john-hopkins-university https://www.kaggle.com/datasets/eisgandar/covid19-vaccination-age-and-sex-trends-in-usa,主要使用了非齐次方差分析和非参数统计等方法,对新冠疫情在不同变种和不同的疫苗接种情况下的变化情况,分析人类对抗新冠的成果与目前全球防疫策略的评估。
首先是原始数据的可视化:
从图中可以得知,目前为止,除了0至5岁/5至11岁两组的儿童因为身体客观原因接种率较低以外,美国其他年龄群体(包括老年人群体)的疫苗前两针接种率是比较高的。但随着德尔塔毒株和奥密克戎毒株的流行,病毒毒性减弱而传染性增强,美国青年人群的加强针接种率并不很高,可见美国的加强针接种策略是保证高危人群即老年人的接种率,而青年人群接种率不高,凭借自身免疫力和前两针疫苗的免疫效果抵抗新毒株。这或许也是美国感染人数居高不下,但死亡率显著下降的原因。这个假设将在下文结合美国具体的疫情数据深入研究。
单因素方差分析:各年龄组之间的第三针接种率是否有显著差异?
数据选取2021年12月,2022年2月及2022年5月的第三针疫苗接种率,对各组接种率进行单因素方差分析,结果如下图所示:
统计量F的p值<0.0001,可以认为各组的第三针接种率均值有显著区别。由下图也可以看出老年组(F,G),的均值显著高于其他组。
美国的疫苗接种政策是否有效降低了整体死亡率?
接下来将通过分析第三针接种前后死亡率的差异来检验该假设。第三针在美国的接种大约开始于2021年9月,考虑到广泛接种仍需一段时间,将2021年12月作为第三针大量接种完毕的时间节点,检验该时间点前后的死亡率是否有显著差异。考虑到2020年疫苗仍未广泛接种,故死亡率数据仅选择2021年1月后的。
对死亡率数据进行单因素非均衡方差分析,结果如下图所示:
F统计量p值<0.0001,可以拒绝原假设,认为第三针加强针接种前后死亡率有显著差异。
该数据包含2020年至2022年每日的确诊与死亡数字,故先画出时间序列图进行观察。
在确诊情况时间序列图中,可以发现都有两个明显的高峰期,分别在2021年1月至5月,2022年1月至3月,初步假设为德尔塔毒株和奥密克戎毒株的大规模流行时期导致感染人数剧增,而美印两国的疫苗接种率有显著差异,可以据此分析疫苗对于抗病死的有效性。
数据的时间范围选择了2022年1月1日至最近,理由是近期数据更有现实指导意义:短短两年多,新冠病毒已经出现了多种变种毒株,而最新的奥密克戎变种,即是2022年初开始在世界范围内流行的,其极高的传染性甚至让我国的防疫政策也出现了措手不及的情况。
先对两国病死率数据进行正态检验,发现p值<0.05,可以拒绝符合正态分布的假设,故使用非参数检验方法。
对两国病死率的非参数检验结果如下图所示:
K-S检验的p值为0.0178,可以认为两组数据有显著差异。
以下为部分源代码:
proc sql;
create table US_whole as
(select Demographic_Category,sum(census) as census,sum(Administered_Dose1) as Dose1,sum(Series_Complete_Yes) as Dose2,sum(Booster_Doses) as Dose3,100*sum(Administered_Dose1)/sum(census) as pct_1,100*sum(Series_Complete_Yes)/sum(census) as pct_2,100*sum(Booster_Doses)/sum(census) as pct_3from US_vacwhere Demographic_Category like 'Ages%' and Date='27MAY22:00:00:00'dtgroup by demographic_category);
quit;
proc sql;
create table US_dr as
(select Date,US_death_ratefrom Covidwhere Date >= '01JAN2021'd and Date <='01JUN2022'd);
quit;proc sql;
alter table Us_dr add label char(5);
quit;
proc sql;
update Us_dr set label='A'
where Date >= '01JAN2021'd and Date <='01DEC2021'd;
quit;
proc sql;
update Us_dr set label='B'
where Date >= '01DEC2021'd;
quit;
data Us_dr;
set Us_dr(rename=(US_death_rate=C_US_death_rate));
US_death_rate=input(C_US_death_rate,8.);
drop C_US_death_rate;
run;
总结
在感染力迅速变强的变种新冠毒株的侵袭下,疫苗接种仍能发挥其降低死亡率的显著作用,对我国的疫苗接种策略提供了坚定的推进方向:提高老年群体三针疫苗接种率,尽快上市针对新变种的新型疫苗。世卫组织也应加强对发展中国家的医疗援助,更少的感染意味着新变种出现的频数会更低,尽可能避免再次出现德尔塔与奥密克戎这样的反复大流行。
笔者第一次使用SAS软件进行数据分析,但因为该软件支持sql语言,并未遇到使用上的太大困难,但对原生语法的掌握就显得生疏了,在统计分析代码部分花了较多的时间。
基于SAS对美国新冠数据的分析相关推荐
- 【大数据平台】基于Spark的美国新冠肺炎疫情数据分析及预测
(本实验系中国地质大学(武汉)2022年秋期大数据平台及应用课程设计) 一.选题背景 新型冠状病毒疫情是由严重急性呼吸系统综合征冠状病毒2(SARS-CoV-2)导致的2019冠状病毒病(COVID- ...
- 软件工程毕业设计课题(36)基于JAVA毕业设计JAVA新冠疫苗预约系统毕设作品项目
项目背景和意义 目的:本课题主要目标是设计并能够实现一个基于web网页的新冠疫苗预约系统,整个网站项目使用了B/S架构,基于java的springboot框架下开发::通过后台设置医院信息.录入医院科 ...
- 【Python】2020年美国新冠肺炎疫情数据分析
2020年美国新冠肺炎疫情数据分析 一. 需求描述 二. 环境介绍 三. 数据来源描述 四. 数据上传及上传结果查看 五.数据处理过程描述 1.数据集下载 2.格式转换 3.启动Hadoop集群 4. ...
- R语言dplyr包使用case_when函数和mutate函数生成新的数据列实战:基于单列生成新的数据列、基于多列生成新的数据列
R语言dplyr包使用case_when函数和mutate函数生成新的数据列实战:基于单列生成新的数据列.基于多列生成新的数据列 目录
- Python基于改进Unet的新冠肺炎等级分割系统(源码&教程)
1.研究背景 新冠肺炎给人类带来极大威胁,自动精确分割新冠肺炎CT图像感染区域可以辅助医生进行诊断治疗,但新冠肺炎的弥漫性感染.感染区域形状多变.与其他肺部组织极易混淆等给CT图像分割带来挑战.为此, ...
- Python数据分析实战,,美国总统大选数据可视化分析[基于pandas]
目录 前言 一.任务详情 二.数据集来源 三.实现过程 四.运行代码 前言 在学习Python数据分析的过程中,是离不开实战的. 今天跟大家带来数据分析可视化经典项目,美国总统大选数据可视化分析,希望 ...
- 基于微信小程序新冠疫苗预约系统(微信小程序)
基于微信小程序新冠疫苗预约系统 基于微信小程序新冠疫苗预约系统,后端是基于java编程语言,ssm框架,mysql数据库,前端是微信小程序制作:本系统分为用户和管理员两个角色,其中用户注册和登陆系统, ...
- Python新冠疫情可视化分析系统 计算机专业毕业设计源码08504
摘 要 文中首先对新冠疫情可视化分析的项目需求进行了背景分析,接着介绍了项目的总体设计思路,然后具体阐述了疫情数据库的设计.疫情数据的查询.疫情数据的展示,并分析了核心代码.文中利用MySQL数据库存 ...
- 【php毕业设计】基于php+mysql+apache的网络数据包分析工具设计与实现(毕业论文+程序源码)——网络数据包分析工具
基于php+mysql+apache的网络数据包分析工具设计与实现(毕业论文+程序源码) 大家好,今天给大家介绍基于php+mysql+apache的网络数据包分析工具设计与实现,文章末尾附有本毕业设 ...
最新文章
- 10 个最值得 Python 新人练手的有趣项目 | 赠书
- UPDATE ORACLE(9i OR 10G) USER'S PASSWORD AND GET ORACLE VERSION MESSAGE
- WampServer详解
- 百练OJ:2746:约瑟夫问题
- java函数式编程_Java 函数式编程和 lambda 表达式详解
- 微服务深入浅出(7)-- 网关路由Zuul
- base包中自定义activity
- 趣谈网络协议栈,以太网基础MAC和PHY
- DBC2000数据库,DBC2000怎么设置?DBC2000架设传奇教程
- Pytorch 多GPU数据并行(DataParallel)
- Linux基础知识练习题
- Linux as AirPrint server
- mysql 从大到小排序
- Java幸运盒子代码_幸运盒子扭蛋机小程序app开发
- daliu_IT学习Android笔记第一篇--Android是什么?安卓的logo来源?安卓的发展过程?
- 黑苹果安装教程 (Mojave 10.14.5) ThinkPad T450
- 9-25模拟赛 By cellur925
- 如何让网站在360搜索结果中显示“官网”标志?
- kendo UI viewModel的灵活运用
- 开普勒三大定律和万有引力定律随笔
热门文章
- Lind.DDD.Utils.HttpHelper关于对HttpClient的正确使用
- 微信的这些功能超级实用
- Linux下部署tomcat,启动时8005端口无法启动
- 4.2 Python 实例5-身体质量指数BMI
- 如何15天之内发表一篇ei会议英文论文?
- 综述类_网络入侵检测技术综述
- win10系统作为文件服务器,win10作为云服务器吗
- 重置Google云服务器密码
- Android Studio 安装和配置genymotion模拟器过程中所遇到的问题
- func() takes 0 positional arguments but 1 was given