贝叶斯定理的通俗理解
朴素贝叶斯是一种基于贝叶斯定理的简单概率分类器(分类又被称为监督式学习,所谓监督式学习即从已知样本数据中的特征信息去推测可能出现的输出以完成分类,反之聚类问题被称为非监督式学习),朴素贝叶斯在处理文本数据时可以得到较好的分类结果,所以它被广泛应用于文本分类/垃圾邮件过滤/自然语言处理等场景。
了解贝叶斯定理前,我们需要先了解条件概率与全概率公式。
条件概率
条件概率(Conditional Probability)是指在事件B发生的情况下,事件A发生的概率,用P(A|B)表示,读作在B条件下的A的概率。
我们可以很清楚看到,在事件B发生的概率下,事件A发生的概率为:
同样地,在事件A发生的条件下事件B发生的概率
将两个式子合并,得到:
两边同时除以非0的P(B),得到贝叶斯定理
在贝叶斯定理中,每个名词都有约定俗成的名称:
P(A|B)是已知B发生后,A的条件概率,也由于得自B的取值而被称作A的后验概率。
P(A)是A的先验概率(或边缘概率)。之所以称为"先验"是因为它不考虑任何B方面的因素。
P(B|A)是已知A发生后,B的条件概率。也由于得自A的取值而被称作B的后验概率。
P(B)是B的先验概率。
P(B|A) / P(B)也有时被称作标准似然度(standardised likelihood),贝叶斯定理可表述为:
后验概率 = 标准似然度*先验概率
全概率公式
假定样本空间S,是两个事件A与A'的和。
蓝色部分为A,绿色为A',即A的补集,他们共同构成了样本空间S。
那么,对于事件B,可以看成2部分,P(AB)与P(A'B)。
即
由条件概率可知,
那么,有全概率公式。
一道计算题
一所学校里面有 60% 的男生,40% 的女生。男生总是穿长裤,女生则一半穿长裤一半穿裙子。有了这些信息之后我们可以容易地计算“随机选取一个学生,他(她)穿长裤的概率和穿裙子的概率是多大”,这个就是前面说的“正向概率”的计算。然而,假设你走在校园中,迎面走来一个穿长裤的学生(很不幸的是你高度近似,你只看得见他(她)穿的是否长裤,而无法确定他(她)的性别),你能够推断出他(她)是男生的概率是多大吗?
记长裤为事件A,短裤为事件B,男生为事件M,女生为F,那么我们需要求P(M | A),由贝叶斯公式有:
由全概率公式有:
那么
可以看到,本来,男生都穿长裤,概率是0.6,在知道穿长裤的条件下,是男生的后验概率就增加了为0.75。
贝叶斯定理的应用
吸毒者检测
下面展示贝叶斯定理在检测吸毒者时的应用。假设一个常规的检测结果的灵敏度和特异度均为99%,即吸毒者每次检测呈阳性(+)的概率为99%。而不吸毒者每次检测呈阴性(-)的概率为99%。从检测结果的概率来看,检测结果是比较准确的,但是贝叶斯定理却可以揭示一个潜在的问题。假设某公司对全体雇员进行吸毒检测,已知0.5%的雇员吸毒。请问每位检测结果呈阳性的雇员吸毒的概率有多高?
胰腺癌检测
基于贝叶斯定理:即使100%的胰腺癌症患者都有某症状,而某人有同样的症状,绝对不代表该人有100%的概率得胰腺癌,还需要考虑先验概率,假设胰腺癌的发病率是十万分之一,而全球有同样症状的人有万分之一,则此人得胰腺癌的概率只有十分之一,90%的可能是是假阳性。
不良种子检测
基于贝叶斯定理:假设100%的不良种子都表现A性状,而种子表现A性状,并不代表此种子100%是不良种子,还需要考虑先验概率,假设一共有6万颗不良种子,在种子中的比例是十万分之一(假设总共有60亿颗种子),假设所有种子中有1/3表现A性状(即20亿颗种子表现A性状),则此种子为不良种子的概率只有十万分之三。
猜你喜欢
贝叶斯定理的通俗理解相关推荐
- 对抗生成神经网络-GAN通俗理解
对抗生成神经网络-GAN通俗理解 概念引入 对抗生成神经网络 效果的演变 由来 简介 生成模型 判别器工作原理 损失函数--交叉熵损失函数(BCE) 拓展-DCGAN网络架构 概念引入 超分辨率重构 ...
- 通俗理解“极大似然估计”
文章目录 前言 1. 似然估计 1.1 下定义 1.2 举例子 1.3 推公式 1.3.1 概率函数 1.3.2 似然函数 1.4 为什么要估计参数的似然性? 2. 极大似然估计 2.1 一般概念 2 ...
- 通俗理解条件熵-数学
就是决策树里面选划分属性用到的计算 条件熵越小表示划分之后各个集合越纯净 前面我们总结了信息熵的概念通俗理解信息熵 - 知乎专栏,这次我们来理解一下条件熵. 我们首先知道信息熵是考虑该随机变量的所有可 ...
- 通俗理解tf.nn.conv2d() tf.nn.conv3d( )参数的含义 pytorhc 卷积
20210609 例如(3,3,(3,7,7))表示的是输入图像的通道数是3,输出图像的通道数是3,(3,7,7)表示过滤器每次处理3帧图像,卷积核的大小是3 x 7 x 7. https://blo ...
- 通俗理解tf.name_scope()、tf.variable_scope()
前言:最近做一个实验,遇到TensorFlow变量作用域问题,对tf.name_scope().tf.variable_scope()等进行了较为深刻的比较,记录相关笔记: tf.name_scope ...
- dft变换的两幅图_离散傅立叶变换DTFT、DFT和FFT在工程与数学结合的通俗理解
1.离散时间傅里叶变换DTFT 何为DTFT?就是对连续时间非周期信号进行抽样(乘积),得到的离散时间非周期信号再求傅里叶变换的过程就是DTFT.其实等同于信号频谱与脉冲信号频谱的卷积,这样得到的就是 ...
- 通俗理解kaggle比赛大杀器xgboost + XGBOOST手算内容 转
通俗理解kaggle比赛大杀器xgboost 转 https://blog.csdn.net/v_JULY_v/article/details/81410574 XGBOOST有手算内容 htt ...
- 通俗理解注意力机制中的Q、K和V表示的具体含义
https://www.jianshu.com/p/7a61533fd73b 通俗理解讲解一 以翻译为例 source:我 是 中国人 target: I am Chinese 比如翻译目标单词为 I ...
- 对于随机森林的通俗理解
原文:http://blog.csdn.net/mao_xiao_feng/article/details/52728164 对于随机森林的通俗理解 一.决策树 决策树是机器学习最基本的模型,在不考虑 ...
- CNN笔记:通俗理解卷积神经网络
通俗理解卷积神经网络(cs231n与5月dl班课程笔记) http://blog.csdn.net/v_july_v/article/details/51812459 1 前言 2012年我在北京组织 ...
最新文章
- 23. matlab并行计算原理以及parpool函数
- IE6、IE7、IE8、Firefox兼容性CSS
- 《C与指针》第七章练习
- 160 - 48 DueList.3
- Windows RC、CTP、RTM、OEM、RTL、VOL等版本区别
- mathtype 7.4.10.53中文版安装教程,以及如何将MathType嵌入到word中
- Jeecg框架 修改首页
- java毕业设计便利店库存管理Mybatis+系统+数据库+调试部署
- 移动App测试中Android测试和IOS测试有啥区别
- 计算机二进制原理动画,伏羲创建的八卦图有多牛?计算机之父:二进制的原理从中发现...
- Python如何爬取免费爬虫ip
- 【转】京东抢购服务高并发实践
- linux Ubuntu 安装的搜狗双拼输入法只有五笔解决办法附安装教程
- ChatGPT办公应用:制作PPT大纲
- 编写一个学生类(Students),包括姓名(name)、性别(sex)、学号(num)、语文课(Chinese)、英语课(English)、数学课(Math)和平均值(avg),方法包括求三门课的平
- 基于FPGA等精度的实时测量频率和占空比
- VM308 WAService.js:2 Component “pages/gouwuche/gouwuche“ does not have a meth
- Android 监听系统来电获取来电信息
- python根据excel生成报表_Python实现导出数据生成excel报表的方法示例
- 赛门铁克推测试版诺顿360服务 集成多种功能