【统计学习】细节笔记 [ 3 ] ：贝叶斯角和两类错误角度理解混淆矩阵（为什么不能每个人都做核酸检测）

贝叶斯与两类错误

1. 两类错误
- 1.1 假设检验的基本思想——从女士品茶说起
- 1.2 两类错误与p值
2. 贝叶斯学派的基本思想

参考：贝叶斯与病检

1. 两类错误

1.1 假设检验的基本思想——从女士品茶说起

20世纪20年代后期，英国剑桥夏日的午后，绅士和他们的夫人们正围坐在户外的桌旁，享用着下午茶。在品茶过程中，一位女士坚称：把茶加进奶里，或把奶加进茶里，不同的做法，会使茶的味道品起来不同。
在场的科学精英们，对这位女士的“胡言乱语”嗤之以鼻。这怎么可能呢？他们并不相信仅仅因为加茶加奶的先后顺序不同，茶就会发生不同的化学反应。

事实上，如果她知道两杯茶分别以不同的方式调制，她可能一下子全部猜对（或全部猜错）。同样，即便这位女士能做出区分，她仍然有猜错的可能。或者是其中的一杯与奶没有充分地混合，或者是泡制时茶水不够热（AB-test)。即便这位女士能做出区分，也很有可能是奉上了10杯茶，她却只是猜对了其中的9 杯。
他调配出了八杯其他条件一模一样而仅仅是倒茶倒奶顺序相反的茶，其中两类各四个（为了少打几个字，在下文中称其为“奶”或者“茶”）。然后他让女士品尝之后告诉他哪四杯是“奶”。当然，剩下的就都是“茶”了。

1.2 两类错误与p值

首先假设女士没有这个能力（这个假设被称为原假设），然后如果女士很好的鉴别了这八杯茶，那就说明在原假设成立的情况下，发生了非常反常的现象，以至于说明原假设是令人怀疑的。从统计上来说，如果在原假设成立的前提下，发生了非常小概率的事件，那我们就有理由怀疑原假设的真实性。

H0:这位女士没有这样的能力，纯属瞎猜。H_0:这位女士没有这样的能力，纯属瞎猜。H0:这位女士没有这样的能力，纯属瞎猜。

设女士选对了XXX杯奶，那么蒙对XXX杯奶的概率如下所示
P(X=0)=C40∗C44C84=1/70P(X=0) ={{C_4^0* C_4^4}\over{C_8^4}}=1/70P(X=0)=C84C40∗C44=1/70
P(X=1)=C41∗C43C84=16/70P(X=1) ={{C_4^1* C_4^3}\over{C_8^4}}=16/70P(X=1)=C84C41∗C43=16/70
P(X=2)=C42∗C42C84=36/70P(X=2) ={{C_4^2* C_4^2}\over{C_8^4}}=36/70P(X=2)=C84C42∗C42=36/70
P(X=3)=C43∗C41C84=16/70P(X=3) ={{C_4^3* C_4^1}\over{C_8^4}}=16/70P(X=3)=C84C43∗C41=16/70
P(X=4)=C44∗C40C84=1/70P(X=4) ={{C_4^4* C_4^0}\over{C_8^4}}=1/70P(X=4)=C84C44∗C40=1/70

如果判定猜对3杯奶及以上，说明这位女士有鉴茶能力。那么从上面的共识可以看出，女士靠瞎猜通关的概率可以达到
P(X=3)+P(X=4)=17/70P(X=3)+P(X=4)=17/70P(X=3)+P(X=4)=17/70
如果判定四杯全部猜对，才可以说明这位女士有鉴茶能力。那么女士蒙混过关的概率就大大降低，变成
P(X=4)=C44∗C40C84=1/70P(X=4) ={{C_4^4* C_4^0}\over{C_8^4}}=1/70P(X=4)=C84C44∗C40=1/70

这种错误被称为第一类错误，即在原假设H0H_0H0为真的情况下拒绝原假设的概率，一般控制在5%以下：
P(rejectH0∣H0为真)=αP(reject \;H_0|H_0为真)=\alphaP(rejectH0∣H0为真)=α

相应地，第二类错误指的是在原假设H0H_0H0为伪的情况下接受原假设的概率：
P(acceptH0∣H0为伪)=βP(accept \;H_0|H_0为伪)=\betaP(acceptH0∣H0为伪)=β

回顾一下混淆矩阵，这里的原假设指的是：it is negative (-)，相应地，拒真 = it is actually negative, but predicted positive.

		预	测
		1	0
实	1	True Positive(TP)	False Negative(FN: type II error)
际	0	False Positive(FP: type I error)	True Negative(TN)

p-value则指的是，在原假设为真的前提下，出现该样本或比该样本更极端的结果的概率之和。应用到上述场景中，如果观察到女士准确地品出了四杯奶（即样本），那么其p-value为1/70.
如下图所示，蓝色表示在原假设为真的情况下总体的分布，我们认为位于尾部两端的数据出现的概率较小，通常将显著性水平设置为5%或1%(黑色虚线之外)，当我们观察的数据(墨绿色点)位于极端区域时(以小概率事件)，我们可以有充足证据拒绝原假设。
再举一个简单的例子，我们认为某年级一班的学生身高是呈正态分布的，但是看到了班里出来的好几个学生身高都是2米多，那么我们有充分信心觉得这不是小概率事件，从而拒绝原假设。

2. 贝叶斯学派的基本思想

P(Bi∣A)=P(A∣Bi)∗P(Bi)P(A)=P(A∣Bi)∗P(Bi)∑j=1nP(A∣Bj)∗P(Bj)P(B_i|A)={{P(A|B_i)*P(B_i)}\over{P(A)}}={{P(A|B_i)*P(B_i)}\over{\sum _{j=1}^n} {P(A|B_j)*P(B_j)} }P(Bi∣A)=P(A)P(A∣Bi)∗P(Bi)=∑j=1nP(A∣Bj)∗P(Bj)P(A∣Bi)∗P(Bi)
记事件AAA患某病，事件BBB为检测结果患某病；在研究血液检查是否能够正确诊断HIV的学术论文中，研究者发现，血液检查的灵敏度为81%（假阴性率为19%），特异度为74%（假阳性率为26%）。这里相当于给出了两类错误的数值。
简单解释一下，根据既往研究，在确实感染HIV的人群中，血液检查诊断阳性的概率P(检验阳性|患病)=81%，在未患病的人群中，错误诊断为阳性的概率P(检验阳性|未患病)=26%.根据全国范围的流行病学调查，HIV的感染率为5%，也就是在人群大众中P(患病)=5%，P(未患病)=95%.即
Recall=P(B∣A)=0.81,Specificity=P(B‾∣A‾)=0.74Recall=P(B|A)=0.81, Specificity=P(\overline{B}|\overline{A})=0.74Recall=P(B∣A)=0.81,Specificity=P(B∣A)=0.74

如果eivind 诊断结果为阳性(检测有病)，那么实际上eivind真的感染了该病的概率是多大呢？

P(A∣B)=P(B∣A)∗P(A)P(B∣A)∗P(A)+P(B∣A‾)∗P(A‾)=0.81∗0.050.81∗0.05+0.26∗0.95=0.1409P(A|B)={P(B|A)*P(A)\over P(B|A)*P(A)+P(B|\overline A)*P(\overline A)}={0.81*0.05\over{0.81*0.05+0.26*0.95}}=0.1409P(A∣B)=P(B∣A)∗P(A)+P(B∣A)∗P(A)P(B∣A)∗P(A)=0.81∗0.05+0.26∗0.950.81∗0.05=0.1409
所以即便检测结果为阳性，也不必过于惊慌，拿到通知书的我们只有14%中招的概率，或许这也可以解释为什么有的时候需要接受两次核酸检测了。
如果每个人都接受核酸检测(完全不考虑病史和接触史)，在检测的灵敏度和特异度有限的情况下，会造成大批量误诊。也就是说，检查结果显示有病的人中，只有14%是真的感染病患，在传染病排查中，这会引发相当严重的事故。