理解 假阳性(false positive)和假阴性(false negative)概念
2018-11-22:理解假阳性(false positive)和假阴性(false negative)这两个概念
- 假阴性false negative和假阳性false positive
- 概念理解
- 举个例子
- 解法(1):列数字讲道理法
- 解法(2):画树状图法,简称画图法哈哈哈
- 解法(3):贝叶斯公式(Bayes大法好)
- 参考文献
假阴性false negative和假阳性false positive
概念理解
当你真的没有的时候,别人却说你有—假阳性(false positive)
当你真的有的时候,别人却说你没有—假阴性(false negative)
下面表格列出了四种情况,另外两张判断正确的情况分别是:
你真的有,别人也说你有—真阳性(true positive)
你真的没有,别人也说你没有—真阴性(true negative)
所以,我们可以看到true和false其实是:实际情况和判断的是否一致,如果一致的话,就是true;如果不一致的话,就是false;而positive和negative则是针对判断的情况:如果判断是“有”、“存在”等肯定意义的情况,则是positive;如果判断是“没有”、“不存在”等否定意义的情况,则是negative。
举个例子
下面举一个经典的例子:假设美国只有1%的人有过敏这种病,现在进行国民大体检,当检查一个过敏病人时,他有80%的几率被检测出过敏,有20%的几率检测不出过敏。当检查一个正常的人的时候,他有10%的几率被误诊为过敏,有90%的几率检测不出过敏。其实就是下面的这个表:
所以
当一个过敏病人被检测成“不过敏”,这就是假阴性。
当一个正常人被检测成“过敏”,这就是假阳性。
有了上面的概率之后,我们来考虑一下这样的情况,翠花感觉身体不舒服发痒,然后她去做了检测,她被检测成“过敏”,但是我们已经知道了检测是会出现误诊的。所以,我们想知道,在翠花被检测出“过敏”之后,她真的是一个过敏病人的概率是多少?
解法(1):列数字讲道理法
首先最简单的:列数字讲道理法(哈哈哈)
假设美国一共有1000个人,10001%=10个人是真的过敏,1000-10=990个人是不过敏的。过敏的10个人中,有1080%=8个人会被检测出“过敏”,有1020%=2个人被检测成“不过敏”。不过敏的990个人中,有99010%=99个人会被误诊出“过敏”,有891个人被检测出“不过敏”。所以,我们有了下面的表格:
所以,我们可以看到被检测成“过敏”的总数是107个人,但其中真正是过敏病人的只有8人,所以(8/107)=7%左右, 也就是说,在被检测成是“过敏”的人中,只有7%的人是真的有过敏,剩余的93%都是被误诊的。
所以,我们得出结论,当翠花被检测出“过敏”后,她真的是一个过敏病人的概率是7%,震惊!
解法(2):画树状图法,简称画图法哈哈哈
我们把例子中提到的所有信息整理成一张图:
最后一列,总的概率0.8%+0.2%+9.9%+89.1%=100%
两个“有”的概率是0.8%和9.9%,0.8+9.9=10.7%
但只有0.8%是真的有,所以概率是0.8/10.7=7%。和第一种解法的答案是一样的。
解法(3):贝叶斯公式(Bayes大法好)
首先祭出贝叶斯公式:
再加上全概率公式:(事件A和事件¬A相加为1,且互斥)
我们得到融合全概率公式的贝叶斯公式:
带入我们这道题中,我们要求的是,翠花在被检测成“过敏”的条件下,她真的是过敏病人的概率。
我们让:
事件A表示:真的是过敏病人
事件B表示:被检测成“过敏”
1、一堆人中,真的是过敏病人的概率是P(A)=1%
2、 一堆人中,是正常人的概率是P(¬A)=99%。
3、真的是过敏病人的条件下,被检测成“过敏”的概率P(B│A)是80%。
4、是正常人的情况下,被检测成被检测成“过敏”的概率P(B│¬A)是10%。
我们要解决的问题转换成求P(A│B),根据上面的贝叶斯公式,我们得到:
可以看到,贝叶斯公式非常简洁明了,还是牛逼。下次我们有时间再写一写贝叶斯公式背后的一些东西。
参考文献
【1】https://www.shuxuele.com/data/probability-false-negatives-positives.html
【2】https://www.shuxuele.com/data/bayes-theorem.html
理解 假阳性(false positive)和假阴性(false negative)概念相关推荐
- True/False Positive True/False Negative (真/假阳性, 真/假阴性)
真阳性 (True Positive) - 本身是对的,你当成对的了 假阳性 (False Positive) - 本身是错的,你当成对的了 真阴性 (True Negative) - 本身是错的,你 ...
- 【笔记】 Hard negative:区域建议框中得分较高的False Positive(假阳性)
eg1: 对于目标检测中我们会事先标记处ground truth,然后再算法中会生成一系列proposal,这些proposal有跟标记的ground truth重合的也有没重合的,那么重合度(IOU ...
- Type Ⅰ error(false positive) Type Ⅱ error(false negative)
特异性低=误诊率高 敏感性高=漏诊率低 prediction position=TP+FP 正确率(precision) PPV= ...
- 敏感性、特异性、假阳性、假阴性(sensitivity and specificity)
医学.机器学习等等,在统计结果时时长会用到这两个指标来说明数据的特性. 定义 敏感性:在金标准判断有病(阳性)人群中,检测出阳性的几率.真阳性.(检测出确实有病的能力) 特异性:在金标准判断无病(阴性 ...
- 【论文阅读】Consistent Instance False Positive Improves Fairness in Face Recognition(CVPR2021)
论文题目:Consistent Instance False Positive Improves Fairness in Face Recognition 论文地址:https://arxiv.org ...
- 统计学中的真阳性(TP),假阴性(FN),假阳性(FP),真阴性(TN)怎么理解?
举个例子,假如要在一个地区进行1000人的疾病检测,我们站在上帝视角,知道这1000人中,有10人是疾病感染者,占比1%. 但实际的检测结果可能存在误差,误差包括两种情况 疾病感染者,被错误诊断为健康 ...
- 真阳率(true positive rate)、假阳率(false positive rate),AUC,ROC
很早以前就知道这些概念了,不过由于跟自己的认知习惯不一样,所以碰到了还是经常会忘.于是索性把这些概念总结一下,以后再忘了也好找(其他的文章太啰嗦了,计算方法也写的不清不楚-.) 另外我也会陆续更新一 ...
- TPR FPR 真阳率(true positive rate)、假阳率(false positive rate),AUC,ROC
很早以前就知道这些概念了,不过由于跟自己的认知习惯不一样,所以碰到了还是经常会忘.于是索性把这些概念总结一下,以后再忘了也好找(其他的文章太啰嗦了,计算方法也写的不清不楚-.) 另外我也会陆续更新一 ...
- R语言plotly可视化:使用plotly可视化模型预测真阳性率(True positive)TPR和假阳性率(False positive)FPR在不同阈值(threshold)下的曲线
R语言plotly可视化:使用plotly可视化模型预测真阳性率(True positive)TPR和假阳性率(False positive)FPR在不同阈值下的曲线(TPR and FPR at e ...
最新文章
- SAMBA服务器应用
- stand up meeting 1/14/2016
- 如何新增或修改ns2的核心模組--queue management
- 「从源码中学习」面试官都不知道的Vue题目答案
- otc机器人氩弧焊机_轻松搞定砂光机前后连线翻转!【富全智能】全自动180度圆筒式翻板机...
- 常见.Net 英文专业词汇收集
- boost::hana::zip用法的测试程序
- Dijkstra 算法——计算有权最短路径(边有权值)
- java的内存模型--jmm
- netapp脚本保存日志_Shell脚本实战:日志关键字监控+自动告警
- 网页中竖的目录怎么改成横的_一点基础也没有,想快速练漂亮硬笔字,先练什么?怎么练进步明显?...
- 机器学习 - 支持向量机
- Binary Tree Zigzag Level Order Traversal
- Windwos8.1下配置PHP环境
- keytool错误: java.lang.RuntimeException: 用法错误,and 不是合法的命令【转】
- 软考信息系统监理师 2016年3月18日作业
- 专访ThoughtWorks王磊:从单块架构到微服务架构
- 网站流量日志分析系统笔记(Hadoop大数据技术原理与应用)
- 图像识别的原理、过程、应用前景,精华篇!
- Assimp库代码存档