基于2022高考数学全国卷I概率题解题思路初步分析新冠病毒疫苗
基于2022高考数学全国卷I概率题解题思路初步分析新冠病毒疫苗
- 1. 2022高考数学全国卷I概率题
- 2. 卡方(χ2\chi^2χ2)检验原理回顾
- 3. 解答2022高考数学全国卷I概率题
- 4. 上海疫情分析
- 5. 总结
1. 2022高考数学全国卷I概率题
一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好 | 良好 | |
---|---|---|
病例组 | 40 | 60 |
对照组 | 10 | 90 |
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生惯不够良好”?B表示事件“选到的人有该疾病”,P(B∣A)P(Bˉ∣A)\frac{P(B|A)}{P(\bar{B}|A)}P(Bˉ∣A)P(B∣A)与P(B∣Aˉ)P(Bˉ∣Aˉ)\frac{P(B|\bar{A})}{P(\bar{B}|\bar{A})}P(Bˉ∣Aˉ)P(B∣Aˉ)的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为RRR.
(I)证明: R=P(A∣B)P(Aˉ∣B)⋅P(Aˉ∣Bˉ)P(A∣Bˉ)R=\frac{P(A|B)}{P(\bar{A}|B)}·\frac{P(\bar{A}|\bar{B})}{P(A|\bar{B})}R=P(Aˉ∣B)P(A∣B)⋅P(A∣Bˉ)P(Aˉ∣Bˉ);
(II)利用该调查数据,给出P(A∣B)P(A|B)P(A∣B), P(A∣Bˉ)P(A|\bar{B})P(A∣Bˉ)的估计值,并利用(I)的结果给出RRR的估计值.
附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),附:K^2=\frac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)}, 附:K2=(a+b)(c+d)(a+c)(b+d)n(ad−bc)2,
P(K2>k)P(K^2>k)P(K2>k) | 0.05 | 0.010 | 0.001 |
---|---|---|---|
kkk | 3.841 | 6.635 | 10.828 |
2. 卡方(χ2\chi^2χ2)检验原理回顾
通过抽样统计得到如下数据:
是否患肺病 | 抽烟 | 不抽烟 | 合计 | 抽烟比例 |
---|---|---|---|---|
是 | 158 | 169 | 327 | 48% |
否 | 82 | 311 | 393 | 20% |
合计 | 240 | 480 | 720 | 33% |
现在想知道是否患肺病与是否抽烟之间是否存在必然联系。
首先我们假设没有必然联系,即不管是患肺病的群体,还是未患肺病的群体,抽烟者的比例都是一样,为33%。
根据该假设,理论上的数值情况应该为下表:
是否患肺病 | 抽烟 | 不抽烟 | 合计 | 抽烟比例 |
---|---|---|---|---|
是 | 109≈327∗33.33\approx 327 * 33.33≈327∗33.33% | 218≈327∗66.67\approx 327 * 66.67≈327∗66.67% | 327 | 33.33% |
否 | 131≈393∗33.33\approx 393*33.33≈393∗33.33% | 262≈393∗66.67\approx 393 *66.67≈393∗66.67% | 393 | 33.33% |
合计 | 240 | 480 | 720 | 33.33% |
统计抽样的数值为实际频数,记为Ai,jA_{i,j}Ai,j,理论数值记为Ti,jT_{i,j}Ti,j,统计量χ2=∑(Ai,j−Ti,j)2Ti,j\chi^2=\sum\frac{(A_{i,j}-T_{i,j})^2}{T_{i,j}}χ2=∑Ti,j(Ai,j−Ti,j)2服从自由度为DF=(card(I)−1)(card(J)−1)DF=(card(I)-1)(card(J)-1)DF=(card(I)−1)(card(J)−1)的χ2\chi^2χ2分布,χ2\chi^2χ2值的大小衡量了理论值与实际频数的差异。
注解:i∈I={行序号}i\in I=\{行序号\}i∈I={行序号},j∈J={列序号}j\in J=\{列序号\}j∈J={列序号},card(X)表示集合中元素的个数
根据χ2\chi^2χ2分布的临界χ2\chi^2χ2值表,可知道P(χ2>k)P(\chi^2>k)P(χ2>k)的概率值。
一般PPP的临界值取小于0.05,对应的χ2\chi^2χ2值为3.84。
根据以上分析,本假设的χ2=60.53\chi^2=60.53χ2=60.53,远远大于3.84,其P(χ2>60.53)P(\chi^2>60.53)P(χ2>60.53)的概率值非常小,所以可以认为假设不成立,即认为是否患肺病与是否抽烟存在关系。
特别地,当card(I)=2card(I)=2card(I)=2,card(J)=2card(J)=2card(J)=2时,χ2\chi^2χ2的自由度DF=1DF=1DF=1,χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)\chi^2=\frac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)}χ2=(a+b)(c+d)(a+c)(b+d)n(ad−bc)2,其中n=a+b+c+dn=a+b+c+dn=a+b+c+d, a,b,c,da,b,c,da,b,c,d为实际采样值,见下表。
是否患肺病 | 抽烟 | 不抽烟 |
---|---|---|
是 | a | b |
否 | c | d |
3. 解答2022高考数学全国卷I概率题
解:
(1)设原命题不存在显著性差异。
K2=200(40∗90−60∗10)2(40+60)(10+90)(40+10)(60+90)=24.0>10.828K^2=\frac{200(40*90 - 60*10)^2}{(40+60)(10+90)(40+10)(60+90)}=24.0>10.828K2=(40+60)(10+90)(40+10)(60+90)200(40∗90−60∗10)2=24.0>10.828
⇒\Rightarrow⇒原命题存在显著性差异。
(2)(I)∵P(A∣B)=P(AB)P(B),PB>0\because P(A|B)=\frac{P(AB)}{P(B)}, P{B}>0∵P(A∣B)=P(B)P(AB),PB>0
∴R=P(B∣A)P(Bˉ∣A)/P(B∣Aˉ)P(Bˉ∣Aˉ)\therefore R=\frac{P(B|A)}{P(\bar{B}|A)} /\frac{P(B|\bar{A})}{P(\bar{B}|\bar{A})}∴R=P(Bˉ∣A)P(B∣A)/P(Bˉ∣Aˉ)P(B∣Aˉ)
=P(AB)P(A)P(ABˉ)P(A)⋅P(AˉBˉ)P(Aˉ)P(AˉB)P(Aˉ)=\frac{\frac{P(AB)}{P(A)}}{\frac{P(A\bar{B})}{P(A)}}\cdot\frac{\frac{P(\bar{A}\bar{B})}{P(\bar{A})}}{\frac{P(\bar{A}B)}{P(\bar{A})}}=P(A)P(ABˉ)P(A)P(AB)⋅P(Aˉ)P(AˉB)P(Aˉ)P(AˉBˉ)
=P(AB)P(ABˉ)⋅P(AˉBˉ)P(AˉB)=\frac{P(AB)}{P(A\bar{B})}\cdot \frac{P(\bar{A}\bar{B})}{P(\bar{A}B)}=P(ABˉ)P(AB)⋅P(AˉB)P(AˉBˉ)
=P(AB)P(AˉB)⋅P(AˉBˉ)P(ABˉ)=\frac{P(AB)}{P(\bar{A}B)}\cdot \frac{P(\bar{A}\bar{B})}{P(A\bar{B})}=P(AˉB)P(AB)⋅P(ABˉ)P(AˉBˉ)
=P(AB)P(B)P(AˉB)P(B)⋅P(AˉBˉ)P(Bˉ)P(ABˉ)P(Bˉ)=\frac{\frac{P(AB)}{P(B)}}{\frac{P(\bar{A}B)}{P(B)}}\cdot \frac{\frac{P(\bar{A}\bar{B})}{P(\bar{B})}}{\frac{P(A\bar{B})}{P(\bar{B})}}=P(B)P(AˉB)P(B)P(AB)⋅P(Bˉ)P(ABˉ)P(Bˉ)P(AˉBˉ)
=P(A∣B)P(Aˉ∣B)⋅P(Aˉ∣Bˉ)P(A∣Bˉ)=\frac{P(A|B)}{P(\bar{A}|B)}\cdot\frac{P(\bar{A}|\bar{B})}{P(A|\bar{B})}=P(Aˉ∣B)P(A∣B)⋅P(A∣Bˉ)P(Aˉ∣Bˉ)
(II) P(A∣B)=4040+60=0.4P(A|B)=\frac{40}{40+60}=0.4P(A∣B)=40+6040=0.4
P(A∣Bˉ)=1010+90=0.1P(A|\bar{B})=\frac{10}{10+90}=0.1P(A∣Bˉ)=10+9010=0.1
R=P(A∣B)P(Aˉ∣B)⋅P(Aˉ∣Bˉ)P(A∣Bˉ)=0.41−0.4⋅1−0.10.1=6.0R=\frac{P(A|B)}{P(\bar{A}|B)}\cdot\frac{P(\bar{A}|\bar{B})}{P(A|\bar{B})}=\frac{0.4}{1-0.4}\cdot\frac{1-0.1}{0.1}=6.0R=P(Aˉ∣B)P(A∣B)⋅P(A∣Bˉ)P(Aˉ∣Bˉ)=1−0.40.4⋅0.11−0.1=6.0
4. 上海疫情分析
数据来源于Dynamic Disease Manifestations Among Non-Severe COVID-19
Patients Without Unstable Medical Conditions: A Follow-Up
Study — Shanghai Municipality, China, March 22–May 03, 2022
图B中,非风险组患者未接种或未全程接种疫苗的比例为约19.4%,全程接种或接种了加强针的比例为80.6%。乐观地估计,未感染新冠病毒的非风险人群全程接种或接种了加强针的比例为87.0%。按照2022高考数学全国卷I概率题解题思路,可以得知,全程接种或接种了加强针的非风险全体与未接种或部分接种疫苗的非风险群体的差异性。
未接种或部分接种疫苗 | 全程接种或接种了加强针 | |
---|---|---|
感染新冠病毒 | 19.4 | 80.6 |
未感染新冠病毒 | 13.0 | 87.0 |
(1) K2=200(19.4∗87.0−80.6∗13.0)2(19.4+80.6)(13.0+87.0)(19.4+13.0)(80.6+87.0)=1.509<3.841K^2=\frac{200(19.4*87.0 - 80.6*13.0)^2}{(19.4+80.6)(13.0+87.0)(19.4+13.0)(80.6+87.0)}=1.509<3.841K2=(19.4+80.6)(13.0+87.0)(19.4+13.0)(80.6+87.0)200(19.4∗87.0−80.6∗13.0)2=1.509<3.841,差异性不显著。
(2) 未接种或未全程接种疫苗为事件A;感染新冠病毒为事件B;
R=P(A∣B)P(Aˉ∣B)⋅P(Aˉ∣Bˉ)P(A∣Bˉ)=0.1940.806⋅0.8700.130=1.6R=\frac{P(A|B)}{P(\bar{A}|B)}\cdot\frac{P(\bar{A}|\bar{B})}{P(A|\bar{B})}=\frac{0.194}{0.806}\cdot\frac{0.870}{0.130}=1.6R=P(Aˉ∣B)P(A∣B)⋅P(A∣Bˉ)P(Aˉ∣Bˉ)=0.8060.194⋅0.1300.870=1.6
即未接种疫苗或未全程接种疫苗的人感染新冠病毒的风险指标R=1.6R=1.6R=1.6
(3) 现有疫苗抗病毒能力下,未患病的非风险群体,全程接种或接种了加强针的人数比例、K2K^2K2, P(K2)P(K^2)P(K2), RRR如下表。
序号 | 未接种或未全程接种的比率(%) | 全程接种或接种加强针的比率(%) | K2K^2K2 | P(K2)P(K^2)P(K2) | 1−P(K2)1-P(K^2)1−P(K2) | RRR |
---|---|---|---|---|---|---|
1 | 13 | 87 | 1.509 | 0.219 | 0.781 | 1.61 |
2 | 12 | 88 | 2.069 | 0.15 | 0.85 | 1.77 |
3 | 11 | 89 | 2.737 | 0.098 | 0.902 | 1.95 |
4 | 10 | 90 | 3.523 | 0.061 | 0.939 | 2.17 |
5 | 9 | 91 | 4.439 | 0.035 | 0.965 | 2.43 |
6 | 8 | 92 | 5.496 | 0.019 | 0.981 | 2.77 |
7 | 7 | 93 | 6.71 | 0.01 | 0.99 | 3.2 |
8 | 6 | 94 | 8.098 | 0.004 | 0.996 | 3.77 |
9 | 5 | 95 | 9.679 | 0.002 | 0.998 | 4.57 |
10 | 4 | 96 | 11.478 | 0.001 | 0.999 | 5.78 |
11 | 3 | 97 | 13.522 | 0.0 | 1.0 | 7.78 |
12 | 2 | 98 | 15.843 | 0.0 | 1.0 | 11.79 |
13 | 1 | 99 | 18.481 | 0.0 | 1.0 | 23.83 |
(4)生成上面表格数据的程序
from scipy.stats import chi2_contingencyimport numpy as npprint('|序号|未接种或未全程接种的比率(%)|全程接种或接种加强针的比率(%)|$K^2$|$P(K^2)$|$1-P(K^2)$|$R$|')print('|--|--|--|--|--|--|--|')for i in range(1, 14):h1 = 14 - idata = [[19.4, 80.6], [h1, 100 - h1]]df = pd.DataFrame(data, index=['低风险病例组', '低风险对照组'], columns=['未接种疫苗', '接种疫苗'])kt = chi2_contingency(df, correction=False)r = np.round(0.194 / 0.806 * (100-h1) / h1, 2)print(f'|{i}|{h1}|{100-h1}|{np.round(kt[0], 3)}|{np.round(kt[1], 3)}|{np.round(1-kt[1], 3)}|{r}|')
5. 总结
现有新冠疫苗的抗病毒能力,若感染新冠病毒群体与未感染新冠病毒群体的疫苗接种情况有显著性(p<0.05p<0.05p<0.05),疫苗接种率需达到90.5%以上。
基于2022高考数学全国卷I概率题解题思路初步分析新冠病毒疫苗相关推荐
- 2018四川高考数学(全国卷3)理科21题以泰勒公式为命题背景(同时深挖去年高考题)和它的另类解法的瞎谈...
已知\(f(x)=(2+x+ax^2)\ln(1+x)-2x\) (2)若\(x=0\)是\(f(x)\)的极大值点,求实数\(a\)的值. 其实该问可以写的更简洁一点,那个"大" ...
- 2018年高考数学全国卷1第16题的18般武艺
2018年高考已经结束,从全国卷1理科卷来看,出题中规中矩,覆盖知识点比较全面,难度并不是很大.若平时复习不是打酱油的话,很多基础题是没有问题的. 填空题第16题以三角函数为载体,考查求最值问题,考生 ...
- 2022年数学建模国赛C题完整思路
目录 一.古代玻璃制品的成分分析与鉴别 二.整体思路 1.问题一 2.问题二 3.问题三 4.问题四 三.模型建立 1.问题一 (1)预处理 (2)建立 2.问题二 (1)预处理 (2)建立 3.问题 ...
- 2020年数学建模国赛B题解题思路
2020年数学建模国赛B题题目: 考虑如下的小游戏:玩家凭借一张地图,利用初始资金购买一定数量的水和食物(包括食品和其他日常用品),从起点出发,在沙漠中行走.途中会遇到不同的天气,也可在矿山.村庄补充 ...
- 首发!2022高考数学压轴题解析!
早点关注我,精彩不迷路! 昨天和大伙一样,从新闻里得知了今年的高考题,并听说难度极大,区分度极高.于是我便来了兴趣,拿起压轴题就做了起来.想看看12年一个轮回过去,那些年做过的题是否还是当年的模样,我 ...
- c++ 判断数学表达式有效性_2009年高考数学上海卷难度如何?独特的题型设计,让你耳目一新...
在目前实行的数学高考制度中,全国卷是12道选择题,4道填空题:江苏卷是14道填空题,没有选择题:浙江卷是10道选择题,7道填空题:北京卷和天津卷则是8道选择题,6道填空题.我们可以发现,有选择题的试卷 ...
- 文治者必有武备不然长大了挨欺负_2017届高考语文全国卷文言文专题阅读15篇(附答案)...
2017届高考语文全国卷文言文专题阅读15篇(附答案) 1.阅读下面这篇文言文,完成问题. 高永能,字君举,世为绥州人.初,伯祖文呸举州来归,即拜团练使,已而弃之北迁,其祖文玉独留居延州,至永能始家青 ...
- 2021高考物理成绩查询,教育部考试中心:2021年高考物理全国卷试题评析
2021年高考物理全国卷命题贯彻落实<深化新时代教育评价改革总体方案>要求,依托高考评价体系,强化基础性考查,优化情境设计,增强试题灵活性,深化关键能力考查,充分发挥高考命题的育人功能和积 ...
- 【Python爬虫】2022年数学建模美赛B题数据爬取
2022年数学建模美赛B题数据爬取 背景 2022年的美赛刚刚落下帷幕,该题的一个主要难点在于数据的获取.很多人无法找到有效的数据,或者是无法获取数据. 比如找到了如下米德湖的水文数据,但是发现并没有 ...
最新文章
- hybrid开发调试记录
- 别名、浅复制与深复制
- 【机器视觉】 import算子
- JAVA实现telnet代理,对输入命令拦截
- Redis的七种武器及其适合的应用场景
- 装箱问题(信息学奥赛一本通-T1295)
- 使用Express开发小说API接口服务1.0(二)
- abb伺服电机如何进行挑选_PLC是怎么控制伺服电机的?如何设计一个伺服系统?...
- 【刷题】LOJ 6007 「网络流 24 题」方格取数
- 计算机教务管理系统ER图,医院病房管理系统ER图
- 一种基于主板BIOS的身份认证方案及实现
- Warez 入门指南
- 各种材料衣服的保养 全面知识分享
- Python实战之12306抢票
- java 毫秒转分钟和秒_Java程序将毫秒转换为分钟和秒
- JDBC(powernode CD2206)详尽版(内含教学视频、源代码、SQL文件)
- mysql是串行还是并行的_sql执行的作业是串行还是并行的?
- 浅谈 Node.js 热更新,了解几点常见的内存泄漏
- Ubuntu中文语言包下载失败解决方法
- stm32关定时器_STM32定时器中断设置方法