新冠肺炎的可视化和预测分析(附代码)
新冠肺炎现在情况怎么样了?推荐一份Jupyter notebook代码进行了分析,把数据可视化,并对感染人数进行了预测。
来源:https://www.kaggle.com/corochann/covid-19-eda-with-recent-update-on-april?scriptVersionId=32149572
本文的可视化通过ployly实现。
本文数据更新到4月14日,最新数据下载:
https://www.kaggle.com/corochann/covid-19-eda-with-recent-update-on-april/data?scriptVersionId=32149572
(下载train.csv、test.csv、usa_states2.csv) 到input的convid19目录即可,数据更新到2020-4-14。
原始数据是这里下载修改的:
https://github.com/CSSEGISandData/COVID-19
完整代码放在github下载:
https://github.com/fengdu78/machine_learning_beginner/tree/master/covid19
代码内容
这份分析代码主要分为以下几个部分:
全球趋势
国家(地区)增长
省份情况
放大美国:现在美国正在发生什么?
欧洲
亚洲
现在哪个国家正在复苏?
什么时候会收敛?通过S型拟合进行预测
全球趋势
fig = px.line(ww_melt_df, x="date", y="value", color='variable', title="Worldwide Confirmed/Death Cases Over Time")
fig.show()
世界确诊和死亡数
fig = px.line(ww_melt_df, x="date", y="value", color='variable',title="Worldwide Confirmed/Death Cases Over Time (Log scale)",log_y=True)
fig.show()
世界确诊和死亡数(取对数)
国家(地区)增长
fig = px.bar(top_country_melt_df.iloc[::-1],x='value',y='country',color='variable',barmode='group',title=f'Confirmed Cases/Deaths on {target_date}',text='value',height=1500,orientation='h')
fig.show()
确诊数和死亡数
top30_countries = top_country_df.sort_values('confirmed', ascending=False).iloc[:30]['country'].unique()
top30_countries_df = country_df[country_df['country'].isin(top30_countries)]
fig = px.line(top30_countries_df,x='date',y='confirmed',color='country',title=f'Confirmed Cases for top 30 country as of {target_date}')
fig.show()
死亡最多的国家
fig = px.bar(top_country_df[:30].iloc[::-1],x='mortality_rate',y='country',title=f'Mortality rate HIGH: top 30 countries on {target_date}',text='mortality_rate',height=800,orientation='h')
fig.show()
死亡率最高的国家
省份情况
出现新冠肺炎的主要国家的各省(州)的清单
放大美国:现在美国正在发生什么?
fig = px.choropleth(train_us_latest,locations='province_code',locationmode="USA-states",color='confirmed',scope="usa",hover_data=['province', 'fatalities', 'mortality_rate'],title=f'Confirmed cases in US on {target_date}')
fig.show()
美国的死亡率情况
train_us_march = train_us.query('date > "2020-03-01"')
fig = px.line(train_us_march,x='date', y='confirmed', color='province',title=f'Confirmed cases by state in US, as of {target_date}')
fig.show()
美国各州的确诊数
欧洲
fig = px.choropleth(train_europe_latest,locations="country",locationmode='country names',color="confirmed",hover_name="country",range_color=[1, train_europe_latest['confirmed'].max()],color_continuous_scale='portland',title=f'European Countries with Confirmed Cases as of {target_date}',scope='europe',height=800)
fig.show()
欧洲确诊数
亚洲
country_latest = country_df.query('date == @target_date')fig = px.choropleth(country_latest,locations="country",locationmode='country names',color="confirmed",hover_name="country",range_color=[1, 50000],color_continuous_scale='portland',title=f'Asian Countries with Confirmed Cases as of {target_date}',scope='asia',height=800)
fig.show()
亚洲确诊数
top_asian_country_df = country_df[country_df['country'].isin(['China', 'Indonesia', 'Iran', 'Japan', 'Korea, South', 'Malaysia','Philippines'
])]fig = px.line(top_asian_country_df,x='date',y='new_case',color='country',title=f'DAILY NEW Confirmed cases world wide')
fig.show()
亚洲每日确诊数量
现在哪个国家正在复苏?
fig = px.choropleth(country_latest,locations="country",locationmode='country names',color="new_case_peak_to_now_ratio",hover_name="country",range_color=[0, 1],# color_continuous_scale="peach",hover_data=['confirmed', 'fatalities', 'new_case', 'max_new_case'],title='Countries with new_case_peak_to_now_ratio')
fig.show()
可以看到中国是最安全的国家了
什么时候会收敛?通过Sigmoid拟合进行预测
plot_sigmoid_fitting(target_country_df_list,pred_df_list,title='Sigmoid fitting with all latest data')
确诊数预测,美国将会达到70万以上确诊
总结
本文推荐一份Jupyter notebook代码进行了分析,把数据可视化,并对感染人数进行了预测。
完整代码放在github下载:
https://github.com/fengdu78/machine_learning_beginner/tree/master/covid19
往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习在线手册深度学习在线手册AI基础下载(pdf更新到25集)本站qq群1003271085,加入微信群请回复“加群”获取一折本站知识星球优惠券,复制链接直接打开:https://t.zsxq.com/yFQV7am喜欢文章,点个在看
新冠肺炎的可视化和预测分析(附代码)相关推荐
- 【实战篇】39 # 如何实现世界地图的新冠肺炎疫情可视化?
说明 [跟月影学可视化]学习笔记. 世界地图新冠肺炎疫情可视化 下面将实现世界地图新冠肺炎疫情可视化.数据用的是从 2020 年 1 月 22 日到 3 月 19 日这些天的新冠肺炎疫情进展.效果类似 ...
- 【第十一届泰迪杯数据挖掘挑战赛】A 题:新冠疫情防控数据的分析 思路+代码(持续更新)
[第十一届泰迪杯数据挖掘挑战赛]A 题:新冠疫情防控数据的分析 思路+代码(持续更新) 问题背景 解决问题 代码下载 数据分析 Task1 Task2 Task 3 问题背景 自 2019 年底至今, ...
- 【大数据平台】基于Spark的美国新冠肺炎疫情数据分析及预测
(本实验系中国地质大学(武汉)2022年秋期大数据平台及应用课程设计) 一.选题背景 新型冠状病毒疫情是由严重急性呼吸系统综合征冠状病毒2(SARS-CoV-2)导致的2019冠状病毒病(COVID- ...
- 阿里云高效基因序列检索助力新冠肺炎病毒序列快速分析
简介: 阿里云高效基因序列检索助力新冠肺炎病毒序列快速分析 AnalyticDB for MySQL是云端托管的PB级高并发低延时数据仓库,通过AnalyticDB for MySQL向量检索功能构建 ...
- 【推荐】新冠肺炎的最新数据集和可视化和预测分析(附代码)
新冠肺炎现在情况怎么样了?推荐Github标星24.7K+的新冠肺炎公开数据集,利用这个数据集,可以用代码进行简单地可视化及预测. 推荐新冠肺炎的公开数据集: https://github.com/C ...
- Matlab基于SEIRD模型,NSIR预测模型,AHP层次分析法新冠肺炎预测与评估分析
全文链接:http://tecdat.cn/?p=32175 分析师:Jiahui Zhao 新型冠状病毒肺炎COVID-19 给中国乃至全世界都带来了深重的灾难,对世界经济也造成了不可逆的影响(点击 ...
- 新冠肺炎疫情数据可视化分析-FineBI
目录 一.实验(实训)目的 二.实验(实训)原理或方法 三.仪器设备.材料 四.实验(实训)步骤 五.实训记录及结果 <------------------------------------- ...
- 使用SAP Analytics Cloud显示全球新冠肺炎确诊人数和发展趋势的预测
注:本文只是借用新冠肺炎全球确诊人数作为历史数据,来介绍SAP Analytics Cloud基于机器学习的Time Series Forecasting功能,并没有对现实世界中新冠肺炎的发展趋势做出 ...
- 最新!兰州大学发布对上海市的新冠肺炎疫情预测!
这段时间,上海市疫情牵动着所有人的心.据数据显示,自 2022 年 3 月 1 日上海市报告新冠肺炎本土确诊病例和本土无症状感染者以来,截至 2022 年 4 月 10 日 24 时,上海市已累计报告 ...
最新文章
- make报错:/usr/bin/ld: cannot find -lXXX
- 为啥程序员下班后只关显示器从不关电脑?看看各大网站的答案~
- Control.Invoke和Control.BeginInvoke
- NGINX + TOMCAT7 + MEMCACHED 实现SESSION 共享
- 编译人脸识别的时候出现问题
- NFS挂载及写入故障
- NUC1131 Triangle【DP】
- C++中的萃取机制(traits)
- 强制 Google.com 域名使用 HTTPS(SSL)
- 珍大户《认知世界的经济学》学习笔记 -- 第17课 影响消费者的因素 -- 色彩、冷暖、秩序
- 计算机分磁盘,磁盘分区怎么分
- 更好地保护眼睛从现在做起!
- 《圣经》中最让人感动的十句话(转)
- 【2018-2019】咖啡般的生活,我们互相羡慕着彼此
- web3.0能够实现吗?
- windows 环境 ngrok内网穿透外网
- 电脑不稳定? 可能系统已被病毒渗透:怎样判断是否遭受入侵
- 腾讯视频怎么录屏,腾讯视频怎么截长视频
- 中标麒麟系统安装teamviewer流程
- 奶茶杯上贴的标签是如何制作出来的
热门文章
- 性能测试中批量数据制作实例的多种方法讨论
- OpenMP 线程化(Threading)基础(1)--并行计算简介
- DefaultSingletonBeanRegistry源码解析
- EntityFreamWork 项目总结
- 推荐系统依据近期浏览进行推荐
- 使用java spring开发ckeditor的文件上传功能(转)
- Zen Coding css,html缩写替换大观 快速写出html,css
- 如何读取FoxPro(dbf)打删除标记的记录
- 解决 QT 发送 HTTP 请求时遇到 qt.network.ssl: QSslSocket::connectToHostEncrypted: TLS initialization failed 问题
- C语言makefile文件