【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码

相关链接

(1)建模方案

【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 建模方案及python代码详解

(2)相关赛题论文

【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码

【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 23页论文及实现代码

【2023年第十一届泰迪杯数据挖掘挑战赛】C题:泰迪内推平台招聘与求职双向推荐系统构建 27页论文及实现代码

1 题目

一、背景

自2019年底至今,全国各地陆续出现不同程度的新冠病毒感染疫情,如何控制疫情蔓 延、维持社会生活及经济秩序的正常运行是疫情防控的重要课题。大数据分析为疫情的精准 防控提供了高效处置、方便快捷的工具,特别是在人员的分类管理、传播途径追踪、疫情研 判等工作中起到了重要作用,为卫生防疫部门的管理决策提供了可靠依据。疫情数据主要包 括人员信息.csv、场所信息.csv、个人自查上报信息.csv、场所码扫码信息.csv、核酸采样检测信息.csv、疫苗接种信息.csv。本赛题提供了某市新冠疫情防疫系统的相关数据信息,请根据这些数据信息进行综合分 析,主要任务包括数据仓库设计、疫情传播途径追踪、传播指数估计及疫情趋势研判等。

(1)人员信息表:附件2.csv

序号 字段名 字段说明 字段类型 默认值
1 user_id 人员id:人员的唯一标识 bigint(20)
2 openid 微信OpenID varchar(64) null
3. gender 性别:男、女 varchar(2) null
4 nation 民族 varchar(20) null
5 age 年龄 int null
6 birthdate 出生日期 varchar(20) null
7 create_time 创建时间 timestamp null

(2)场地信息表:附件3.csv

序号 字段名 字段说明 字段类型 默认值
1 grid_point_id 场所id:场所的唯一标识 bigint(20)
2 name 场所名 varchar (255) null
3. point_type 场所类型 varchar (50) nnulnulll
4 x_coordinate X坐标(单位:米) decimal(12,2) null
5 y_coordinate Y坐标(单位:米) decimal(12,2) null
6 create_time 创建时间 timestamp null

(3)个人自查上报信息表:附件4.csv

NO. 字段名 字段说明 字段类型 默认值
1 sno 序列号:自查记录的唯一标 识 bigint(20)
2 user_id 人员ID:对应于"人员信息表"中的user_id . ID 长整型数字(20)
3. x_coordinate 上报地点的x坐标 小数(12,2) null
4 y_coordinate 上报地点的y坐标 小数(12,2) null
5 symptom 症状:1 发热、2 乏力、3 干 咳、4 鼻塞、5 流涕、6 腹泻、 7 呼吸困难、8 无症状 varchar (100) null
6 nucleic_acid_result 核酸检测结果:0 阴性、1 阳 性、2 未知(非必填) varchar (10) null
7 resident_flag 是否常住居民:0未知,1是,2否 int null
8 dump_time 上报时间 timestamp null

(4)场所码扫码信息表:附件5.csv

序号 字段名 字段说明 字段类型 默认值
1 sno 序列号:扫码记录的唯一标 识 bigint(20)
2 grid_point_id 场所ID:对应于"场所信息表"中的grid_point_id bigint(20)
3 user_id 人员ID:对应于"人员信息表"中的user_id . ID bigint(20)
4 temperature 体温 double null
5 create_time 扫码记录时间 timestamp null

(5)核酸采样检测信息表:附件6.csv

序号 字段名 字段说明 字段类型 默认值
1 sno 序列号:核酸采样记录的唯 一标识 bigint(20)
2 user_id 人员ID:对应于"人员信息表"中的user_id . ID bigint(20) null
3 cysj 采样日期和时间 timestamp null
4 jcsj 检测日期和时间 timestamp null
5 jg 检测结果:阴性、阳性、未 知 varchar (50) null
6 grid_point_id 场所ID:对应于"场所信息表"中的grid_point_id bigint(20)

(6)疫苗接种信息表:附件7.csv

序号 字段名 字段说明 字段类型 默认值
1 sno 序列号:疫苗接种记录的唯 一标识 bigint(20)
2 inject_sn 接种流水号 varchar(50)
3 user_id 人员ID:对应于"人员信息表"中的user_id . ID varchar(50)
4 age 接种者年龄 int null
5 gender 性别:1 男、2 女 varchar(10) null
6 birthdate 出生日期 varchar(50) null
7 inject_date 接种日期 timestamp null
8 inject_times 针次:1 第一针、2 第二针、 3 加强针 varchar(30) null
9 vaccine_type 疫苗类型:1 灭活疫苗、2 重 组蛋白疫苗、3 病毒载体疫 苗、4 核酸疫苗、5 减毒疫苗 varchar(30) null

二、问题

  1. 根据核酸检测中阳性人员的出行时间与场所追踪密接者,将结果保存到“result1.csv”文件中,文件模板格式如下
序号 密接者ID 密接日期 密接场所ID 阳性人员ID
  1. 由问题1的结果,根据密接者的出行时间与场所追踪相应的次密接者,将结果保存到“result2.csv”文件中,文件模板如下。
序号 次密接者ID 次密接日期 次密接场所ID 密接者ID
  1. 建立模型,分析接种疫苗对病毒传播指数的影响。

  2. 根据阳性人员的数量及辐射范围,分析确定需要重点管控的场所。

  3. 为了更精准地进行疫情防控和人员管理,你认为还需要收集哪些相关数据。基于这些数据构建模型,分析其精准防控的效果。

注在解决上述问题时,要求结合赛题提供的数据信息表建立数据仓库,实现数据治理的内容,请在论文中明确阐述做了哪些数据治理工作,具体是如何实现的。

2 论文一介绍

新冠疫情防控数据的分析 --基于机器学习算法的大数据分析

摘要

自新冠疫情发生以来,这一感染性极强的病毒在全球呈现爆发式的蔓延和增长,对全球的社会经济和人类的日常生活都造成了极大的影响。因此,对于疫情的防控和治疗措施对于全球而言都是及其重要的一个课题。

本文主要是基于题目所给的自疫情发生以来所记录的部分数据,运用Python对数据进行清洗和处理,确定密接者和次密接者的信息,结果导出在result1.csv和result2.csv文件中,使疫情防控更为精确而有效;其次,根据人员接种疫苗前后的感染情况,运用SEIR传染病模型求解病毒传播指数,运用卡方检验和皮尔逊、斯皮尔曼等级相关系数进行相关性检验,以此求解不同人群在不同场合感染、传播病毒的速率,结果表明,接种疫苗能够减缓病毒传播速度;最后,再根据阳性人员的密集程度将重点防控区域落于公共交通场所,社区住所,以及学校和各大娱乐场所,以便达到更好的疫情防控效果。此外,根据分析我们还发现如果将成年人视为重点防控人员,可以在一定程度上减缓病毒传播的速度,从而达到一定的防控效果。

基于此次数据调查与分析,希望可以给疫情防控带来一定的可行措施,使疫情防控更为精确化,减缓病毒的传播速率;此外,对于机器学习算法在解决现实问题中的运用,可以大大降低人力资源的浪费,更高效的解决实际问题。

**关键字:**机器学习算法, SEIR传染病模型,卡方检验, 皮尔逊、斯皮尔曼等级相关系数

3 论文二介绍

基于机器学习新冠疫情防控趋势研判

摘要

由于各地陆续出现不同程度的新冠病毒感染疫情,如何控制疫情蔓延、维持社会生活及经济秩序的正常运行是疫情防控的重要课题。基于该背景下,大数据分析为疫情情况的预测和峰值提高重要参照,提高治理效率,降低人员伤亡,出台符合中国国情的疫情应对措施。大数据特别是在人员的分类管理、传播途径追踪、疫情研判等工作中起到了重要作用,为卫生防疫部门的管理决策提供了可靠依据。

本文就新冠疫情防控情趋势研判,提出了创新性的解决方法:使用K-近邻(KNN)机器学习算法来找到与阳性人员有过密切接触的其他人员,且使用 KNN算法来实现次密接者追踪,还引用了机器学习线性回归模型进行分析探究接种疫苗和病毒指数的影响,再根据热力图和机器学习K-Means聚类算法找出阳性人员的数量及辐射范围,分析确定需要重点管控的场所,最后使用时空分析方法分析人员流动的有向图和使用聚类分析算法将地点划分为不同的聚类,再结合数据治理的知识,对疫情防控和人员管理提供更加精准的决策参考。

关键字:

k-近邻(KNN) 线性回归 机器学习 K-Means聚类

4 获取方式

【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码相关推荐

  1. 【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 23页论文及实现代码

    [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 23页论文及实现代码 相关链接 (1)建模方案 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预 ...

  2. 【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 建模及python代码详解 问题一

    相关链接 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 建模及python代码详解 问题一 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 ...

  3. 【2023年第十一届泰迪杯数据挖掘挑战赛】C题:泰迪内推平台招聘与求职双向推荐系统构建 建模及python代码详解 问题一

    相关链接 [2023年第十一届泰迪杯数据挖掘挑战赛]C题泰迪内推平台招聘与求职双向推荐系统构建 建模及python代码详解 问题一 [2023年第十一届泰迪杯数据挖掘挑战赛]C题泰迪内推平台招聘与求职 ...

  4. 【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 建模及python代码详解 问题二

    相关链接 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 建模及python代码详解 问题一 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 ...

  5. 【第十一届泰迪杯数据挖掘挑战赛】A 题:新冠疫情防控数据的分析 思路+代码(持续更新)

    [第十一届泰迪杯数据挖掘挑战赛]A 题:新冠疫情防控数据的分析 思路+代码(持续更新) 问题背景 解决问题 代码下载 数据分析 Task1 Task2 Task 3 问题背景 自 2019 年底至今, ...

  6. 【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 建模方案及python代码详解

    更新时间:2023-3-30 1 题目 一.背景 自2019年底至今,全国各地陆续出现不同程度的新冠病毒感染疫情,如何控制疫情蔓 延.维持社会生活及经济秩序的正常运行是疫情防控的重要课题.大数据分析为 ...

  7. 【第十一届“泰迪杯”数据挖掘挑战赛】泰迪杯c题爬虫采集数据(源码+数据)

    ["第十一届"泰迪杯"数据挖掘挑战赛-- C 题:泰迪内推平台招聘与求职双向推荐系统构建(采集数据)] 问题: 数据详情: 根据工作id获取详细数据(1571条).csv ...

  8. 第十一届“泰迪杯” 数据挖掘挑战赛 火热报名中!

         距离第十一届"泰迪杯"数据挖掘挑战赛报名结束仅剩下两周时间,为能让各位参赛小伙伴对"泰迪杯"竞赛进一步了解,今天小编为大家整理了详细的竞赛介绍,想要了 ...

  9. 第十一届“泰迪杯”数据挖掘挑战赛携“十万”大奖火热来袭

    第十一届"泰迪杯"数据挖掘挑战赛 竞赛组织 主办单位: 泰迪杯数据挖掘挑战赛组织委员会 承办单位: 广东泰迪智能科技股份有限公司 人民邮电出版社 协办单位: 重庆市工业与应用数学学 ...

最新文章

  1. Python 实现整数线性规划:分枝定界法(Branch and Bound)
  2. ubuntu下小键盘不能用
  3. 多媒体技术是指以计算机为手段来获取,计算机应用基础win7课件第八章.ppt
  4. the computational graph needed to compute the outputs报错解决
  5. oracle存档模式,Oracle的备份和存档模式
  6. ai背景合成_智能合成AI主播很危险,应立即取消!
  7. 恋舞服务器维修,2144《梦幻恋舞》关闭充值及关服公告
  8. zip分卷压缩的步骤_rar分卷压缩的步骤详解【图文步骤】
  9. H3CSE路由-配置OSPF高级
  10. 联想计算机怎么设置硬盘,bios设置修改硬盘模式|联想笔记本BIOS设置硬盘模式教程...
  11. C# 基础 (3) 垃圾回收机制(Garbage Collector)
  12. 网站首页的轮播新闻flash效果实现
  13. URAL 1389 Roadworks 贪心
  14. android开机卡logo,logcat怎么抓log
  15. Delphi中多库关联查询
  16. ESP32 HTTP 使用入门
  17. 职场邮件的十大忌讳,你犯了吗?
  18. 没有基础学UI设计真有那么难吗?
  19. 集体所有制的企业是属于国企吗
  20. AndroidStudo格式化快捷键(Ctrl+alt+L)失效·解决方法

热门文章

  1. 我佛了,居然有人用古代皇帝与臣子的关系讲清了JDK动态代理
  2. Unity 引入maven https链接的报错问题
  3. 快速部署私有云笔记,免费享受多端同步
  4. Unity开发Gear VR app走过的弯路VR开发心得
  5. 10 Deployment:让应用永不宕机
  6. 阿里云Linux热扩容云盘(growpart和resize2fs工具)
  7. 盈连科技:机器人打磨抛光“领头羊”
  8. k8s添加promethues-operater作为监控后无法监控kube-proxy的解决方法
  9. 软件测试的指标成功率靠谱吗,【图】怎么样才能测试公式的成功率?_股票公式,股票,炒股,股票软件,炒股软件_指标编写互助答疑论坛_理想论坛 - 股票论坛...
  10. linux下import包中的模块,关于python:在Linux下将pyw文件导入为模块