拓端tecdat|在R语言中使用航空公司复杂网络对疫情进行建模
原文链接:http://tecdat.cn/?p=12537
原文出处:拓端数据部落公众号
在2014年的埃博拉疫情爆发期间,人们对该疾病蔓延的情况非常关注。我们决定使用航空公司的航班数据探讨这个问题。
该疾病起源于利比里亚,因此想探讨该疾病如何通过航空网络传播的问题。
可以在下面看到网络的可视化。每个节点都是一个国家,每个边代表从一个国家到另一个国家的现有航线。忽略同一国家起飞和降落的航班,避免混乱。
plot(g,vertex.size=5,edge.arrow.size=.1,edge.arrow.width=.1,vertex.label=ifelse(V(g)$name %in% c('Liberia','United States'),V(g)$name,''),vertex.label.color='black')bty='n')
每个节点都是一个国家,每个边代表两个国家之间的现有航线。为了清楚起见,未显示在同一国家/地区开始和结束的航班。
社区
我使用了算法来检测国家/地区的“社区”,即彼此之间有很多航班的国家/地区集,但是与集内的国家/地区之间的航班很少。粗略地讲,该算法倾向于将同一大陆上的国家/地区分组在一起。然而,这并非总是如此。例如,由于与前殖民地的密切关系,法国与几个非洲国家被置于同一社区。该网络似乎表现得很同质-同一大陆上的国家之间相互联系的趋势往往大于与该大陆以外国家的联系。
分布
国家的程度(与一个给定国家连接的国家数量)差异很大。美国与其他186个国家有联系,而利比里亚仅与12个国家有联系。完整的分布如下所示。它大致遵循幂定律。请注意,逼近是渐近的,这可能就是为什么此有限样本不可用的原因。根据程度分布,所有国家中有一半与其他27个国家相连。利比里亚远低于中位数,美国远低于中位数。
plot(dplot,type='l',xlab='Degree',ylab='Frequency',main='Degree Distribution of Airline Network',lty=1)
lines((1:length(dplot))^(-.7),type='l',lty=2)
legend('topright',lty=c(1,2),c('Degree Distribution','Power Law with x^(-.7)'),bty='n')
如果网络的分布大致遵循幂定律,则我们说它是“无标度”网络。
小世界
让我们放大并查看利比里亚的二级关系:
利比里亚的航空公司联系。塞拉利昂和科特迪瓦与美国没有直接联系,因此未显示它们的联系。
尽管他们位于两个不同的社区,但利比里亚和美国之间只有两个度的距离。所有国家通常都是这种情况。如果对于每个节点,我们计算出它与每个其他节点之间的最短路径,则平均最短距离将约为2(这被称为小世界现象。平均而言,每个国家/地区与每个其他国家/地区相距2。)。例如,可以想象法国的戴高乐机场是连接美国,东欧,亚洲和非洲国家的枢纽。这些枢纽的存在使得通过很少的转移就可以从一个国家到达另一个国家。
传染性
上面的特写网络显示,如果将病毒传播到美国,可能会通过尼日利亚,加纳,摩洛哥和比利时传播。如果我们知道从利比里亚到这些国家以及从每个国家到美国的航班的比例,我们可以估计埃博拉病毒在每条航线上扩散的可能性。
当然,由于许多原因,这是一个简化案例。例如,即使塞拉利昂(Sierra Leon)与美国没有直接联系,它也可以与美国有联系的其他国家/地区联系。这条航线可能有很大一部分航班降落在美国。
还有一些流行病学参数可以改变疾病传播的速度。例如,从感染到可检测到的症状的时间很重要。如果被感染者直到感染一周后才出现症状,那么就不能轻易地对其进行筛选和控制。在出现症状之前,他们可以感染许多其他人。
疾病的最后期限也很重要。如果患者在被感染的几个小时内死亡,那么这种疾病就不会传播到很远。极端地说,考虑患者在感染后一秒钟内死亡。然后,他几乎没有时间感染他人。
最受欢迎的见解
1.采用SPSS Modeler的Web复杂网络对所有腧穴进行分析
2.python对网络图networkx进行社区检测和彩色绘图
3.使用Python和SAS Viya分析社交网络
4.通过SAS网络分析对人口迁移进行可视化分析
5.用R语言和python进行社交网络中的社区检测
6.python隶属关系图模型:基于模型的网络中密集重叠社区检测方法
7.从网络图看数字媒体对传统媒体的影响
8.R语言如何找到患者数据中具有差异的指标?(PLS—DA分析)
9.R语言中的生存分析Survival analysis晚期肺癌患者
拓端tecdat|在R语言中使用航空公司复杂网络对疫情进行建模相关推荐
- R语言中的广义线性模型(GLM)和广义相加模型(GAM):多元(平滑)回归分析保险资金投资组合信用风险敞口
最近我们被客户要求撰写关于信用风险敞口的研究报告,包括一些图形和统计输出. 在之前的课堂上,我们已经看到了如何可视化多元回归模型(带有两个连续的解释变量).在此,目标是使用一些协变量(例如,驾驶员的年 ...
- 在r语言中使用GAM(广义相加模型)进行电力负荷时间序列分析
广义相加模型(GAM:Generalized Additive Model),它模型公式如下:有p个自变量,其中X1与y是线性关系,其他变量与y是非线性关系,我们可以对每个变量与y拟合不同关系,对X2 ...
- 二次拟合r方_拟合R语言中的多项式回归
原标题:拟合R语言中的多项式回归 让我们看一个经济学的例子:假设你想购买一定数量q的特定产品.如果单价是p,那么你会支付总金额y.这是一个线性关系的典型例子.总价格和数量成正比. 如下所示: 但购买和 ...
- 拓端tecdat|bilibili视频流量数据潜望镜
最近我们被客户要求撰写关于bilibili视频流量的研究报告,包括一些图形和统计输出. 最新研究表明,中国有超过7亿人在观看在线视频内容.Bilibili,被称为哔哩哔哩或简称为B站,是中国大陆第二个 ...
- 技巧 | 在R语言中使用高德地图的API进行地理/逆地理编码(地址与经纬度的相互转换)...
高德地图和百度地图都提供了坐标拾取系统,通过坐标查询或坐标反查操作可以查询一个地址对应的经纬度或经纬度对应的地址名称.但是,手动查询的方式效率很低,也不能进行批量查询. 本篇就来介绍在R语言中调用高德 ...
- r语言中检测异常值_R中的异常值检测
r语言中检测异常值 介绍 (Introduction) An outlier is a value or an observation that is distant from other obser ...
- R语言中的多项式回归、局部回归、核平滑和平滑样条回归模型
全文下载链接:http://tecdat.cn/?p=20531 当线性假设无法满足时,可以考虑使用其他方法(点击文末"阅读原文"获取完整代码数据). 相关视频 多项式回归 扩展可 ...
- 用计算机怎么计算r角度,R语言中的数学计算
原标题:R语言中的数学计算 前言 R是作为统计语言,生来就对数学有良好的支持,一个函数就能实现一种数学计算,所以用R语言做数学计算题特别方便.如果计算器中能嵌入R的计算函数,那么绝对是一种高科技产品. ...
- R语言中的数学计算(转载)
R语言中的数学计算 关于作者: 张丹(Conan), 程序员Java,R,PHP,Javascript weibo:@Conan_Z blog: http://blog.fens.me email: ...
- 如何在R语言中建立六边形矩阵热图heatmap可视化
原文链接:http://tecdat.cn/?p=18879 这是一个六边形热图可视化程序,主要用到的知识RColorBrewer,fields,也就是R中的可视化绘图库(点击文末"阅读原文 ...
最新文章
- Python学习之路基础篇--10Python基础,函数进阶
- hadoop streaming部分问题总结
- 什么情况下需要搭建大数据平台
- QT Creator 环境使用 remote debug 调试 arm 程序
- Oracle手工创建数据库
- LINUX下载编译wabt(反编译wasm)
- 通过jsp实现省市区县四级联动菜单
- 你还在用Rational Rose画图吗?来来来给你介绍一款开源免费上手容易的 BOUML UML画图工具。
- Vue router 默认加载 views 文件夹下全部vue文件
- kernel编译错误R_ARM_THM_JUMP19
- BZOJ 1208: [HNOI2004]宠物收养所 (Treap)
- 56个有效且健康的减肥小绝招
- 台式电脑共享笔记本电脑的无线网络
- wtc java 代码 tpcall(servicename_wtc经验心得以及相关代码
- Alpha阶段敏捷冲刺①Scrum 冲刺博客
- Chromium安装flash插件
- 参考文献的数字,字母
- 消息中间件原理及JMS简介之一
- 1000篇干货好文!量子技术——进阶篇
- java freemarker word_Java 用Freemarker完美导出word文档(带图片)(示例代码)