【数据挖掘】贝叶斯分类 ( 贝叶斯分类器 | 贝叶斯推断 | 逆向概率 | 贝叶斯公式 | 贝叶斯公式推导 | 使用贝叶斯公式求逆向概率 )
文章目录
- I . 贝叶斯分类器
- II . 贝叶斯推断 ( 逆向概率 )
- III . 贝叶斯推断 应用场景 ( 垃圾邮件过滤 )
- IV . 贝叶斯方法 由来
- V . 贝叶斯方法
- VI . 贝叶斯公式
- VII . 贝叶斯公式 ③ 推导过程
- VIII . 使用贝叶斯公式求逆向概率
I . 贝叶斯分类器
1 . 贝叶斯分类器 :
① 原理 : 基于统计学方法贝叶斯 ( Bayes ) 理论 , 预测样本某个属性的分类概率 ;
② 性能分析 : 朴素贝叶斯 分类器 , 与 决策树 , 神经网络 分类器 性能基本相同 , 性能指标处于同一数量级 , 适合大数据处理 ;
2 . 贝叶斯分类器的类型 :
① 朴素贝叶斯分类器 : 样本属性都是独立的 ;
② 贝叶斯信念网络 : 样本属性间有依赖关系的情况 ;
决策树 , 贝叶斯 , 神经网络 都是机器学习的核心方法
II . 贝叶斯推断 ( 逆向概率 )
1 . 贝叶斯推断 : 是统计学方法 , 贝叶斯定理的应用 , 用于估算统计量的性质 ;
2 . 正向概率 与 逆向概率 :
① 正向概率 : 盒子中有 NNN 个白球 , MMM 个黑球 , 摸出黑球的概率是 MN+M\rm \cfrac{M}{N + M}N+MM ;
② 逆向概率 : 事先不知道盒子中白球和黑球的数量 , 任意摸出 XXX 个球 , 通过观察这些球的颜色 , 推测盒子中有多少白球 , 多少黑球 ;
III . 贝叶斯推断 应用场景 ( 垃圾邮件过滤 )
1 . 传统垃圾邮件过滤方法 :
① 关键词法 : 识别特定词语 , 识别 “发票” “培训” 等关键字 ;
② 检验码法 : 计算邮件中文本的校验码 , 与已知的垃圾邮件对比 ;
③ 效果 : 关键词法 和 校验码法 对垃圾邮件的识别效果不好 , 容易规避 ;
④ 问题本质 : 垃圾邮件过滤是二元分类问题 , 针对每个邮件 , 都需要判定其是否是垃圾邮件 ,
2 . 贝叶斯推断过滤垃圾邮件 :
① 效果 : 准确性很高 , 并且没有误判 ;
② 原理 : 贝叶斯推断的垃圾邮件过滤器有学习能力 , 收到的邮件越多 , 训练集越大 , 判定越准确 ;
IV . 贝叶斯方法 由来
1 . 贝叶斯方法 由来 :
① 现实情况 : 现实世界本身的状况复杂 , 不确定性很大 , 人的观察能力也有限 ;
② 人的应对方案 : 多数情况下 , 只能根据观察到的结果 , 来估算实际的情况 ;
2 . 贝叶斯 处理 逆向概率 问题示例 :
① 盒子白球黑球问题 : 从盒子中取出白球和黑球 , 不知道盒子中有多少白球和黑球 , 只能根据从盒子中取出球的情况 , 估算盒子中的白球和黑球数 ;
② 互联网垃圾邮件问题 : 互联网中发送邮件 , 有多少是正常邮件 , 有多少是垃圾邮件是不知道的 , 只能根据当前收到的垃圾邮件 , 反向估算实际情况 ;
V . 贝叶斯方法
贝叶斯方法 :
① 提出假设 : 给出样本属性的 不同类型 的猜测的 属性值 , 如 : 邮件是否是垃圾邮件 , 是 或者 否 ;
② 计算每种取值的可能性 : 计算每种猜测的可能性 ;
③ 确定猜测 : 选取可能性最大的猜测 , 作为贝叶斯推断的结果 ;
VI . 贝叶斯公式
1 . 贝叶斯公式 :
公式 ①
P(B∣A)=P(A∣B)×P(B)P(A∣B)×P(B)+P(A∣∼B)×P(∼B)P ( B | A ) = \frac{P ( A | B ) \times P ( B ) }{ P ( A | B ) \times P ( B ) + P ( A | \sim B ) \times P ( \sim B ) }P(B∣A)=P(A∣B)×P(B)+P(A∣∼B)×P(∼B)P(A∣B)×P(B)
简写形式 :
公式 ②
P(B∣A)=P(AB)P(A)P ( B | A ) = \frac{P ( AB )}{P ( A )}P(B∣A)=P(A)P(AB)
或
公式 ③
P(B∣A)=P(B)×P(A∣B)P(A)P(B|A) = \frac{P(B) \times P(A|B)}{P(A) }P(B∣A)=P(A)P(B)×P(A∣B)
2 . 公式中的事件说明 : 有两个事件 , 事件 AAA , 和事件 BBB ;
3 . 概率的表示方法 :
① 事件 AAA 发生的概率 : 表示为 P(A)P(A)P(A) ;
② 事件 BBB 发生的概率 : 表示为 P(B)P(B)P(B) ;
③ ABA BAB两个事件同时发生的概率 : 表示为 P(A,B)P(A,B)P(A,B) ;
④ 事件 AAA 发生时 BBB 发生的概率 : 表示为 P(B∣A)P(B | A)P(B∣A) ;
VII . 贝叶斯公式 ③ 推导过程
1 . 事件 AAA 和 BBB 同时发生的概率 ( 第 111 种求法 ) :
① 先求 AAA 发生的概率 : P(A)P(A)P(A)
② 再求 AAA 发生时 BBB 发生的概率 : P(B∣A)P(B | A)P(B∣A)
③ ABABAB 同时发生的概率 : P(A,B)=P(A)×P(B∣A)P(A,B) = P(A) \times P(B|A)P(A,B)=P(A)×P(B∣A)
2 . 事件 AAA 和 BBB 同时发生的概率 ( 第 222 种求法 ) :
① 先求 BBB 发生的概率 : P(B)P(B)P(B)
② 再求 BBB 发生时 AAA 发生的概率 : P(A∣B)P(A | B)P(A∣B)
③ ABABAB 同时发生的概率 : P(A,B)=P(B)×P(A∣B)P(A,B) = P(B) \times P(A|B)P(A,B)=P(B)×P(A∣B)
3 . 公式 ③ 推导过程 :
P(A)×P(B∣A)P(A) \times P(B|A)P(A)×P(B∣A) 与 P(B)×P(A∣B)P(B) \times P(A|B)P(B)×P(A∣B) 两个公式是等价的 , 可推导出如下公式 :
P(A)×P(B∣A)=P(B)×P(A∣B)P(A) \times P(B|A) = P(B) \times P(A|B)P(A)×P(B∣A)=P(B)×P(A∣B)
P(B∣A)=P(B)×P(A∣B)P(A)P(B|A) = \frac{P(B) \times P(A|B)}{P(A) }P(B∣A)=P(A)P(B)×P(A∣B)
VIII . 使用贝叶斯公式求逆向概率
使用贝叶斯公式求逆向概率 :
知道 BBB 发生时 , AAA 发生的概率 P(A∣B)P(A|B)P(A∣B) , 求其逆概率 : AAA 发生时 , BBB 发生的概率 P(B∣A)P(B|A)P(B∣A) ;
可将已知的 P(A∣B)P(A|B)P(A∣B) 概率 , 和 ABABAB 单独发生的概率 P(A)P(A)P(A) , P(B)P(B)P(B) , 代入如下公式 :
P(B∣A)=P(B)×P(A∣B)P(A)P(B|A) = \frac{P(B) \times P(A|B)}{P(A) }P(B∣A)=P(A)P(B)×P(A∣B)
即可得到其逆概率 , BBB 发生时 , AAA 发生的概率 ;
【数据挖掘】贝叶斯分类 ( 贝叶斯分类器 | 贝叶斯推断 | 逆向概率 | 贝叶斯公式 | 贝叶斯公式推导 | 使用贝叶斯公式求逆向概率 )相关推荐
- 贝叶斯推断方法 —— 从经验知识到推断未知
贝叶斯推断方法 -- 从经验知识到推断未知 机器学习基础算法python代码实现可参考:zlxy9892/ml_code 1 什么是贝叶斯 在机器学习领域,通常将监督学习 (supervised ...
- 干货 | 基于贝叶斯推断的分类模型 机器学习你会遇到的“坑”
本文转载自公众号"读芯术"(ID:AI_Discovery) 本文3153字,建议阅读8分钟. 本文讲解了在学习基于贝叶斯推断的分类模型中,我们需要的准备和方法. 数学准备 概率: ...
- 基于贝叶斯推断的分类模型 机器学习你会遇到的“坑”
链接:贝叶斯推断分类 数学准备 概率:事件不确定性程度的量化,概率越大,表示事件发生的可能性越大. 条件概率:P(A|B),在条件B下,发生A的概率. 联合概率:P(A,B),A事件与B事件同时发生的 ...
- 基于python的垃圾邮件分类_python实现贝叶斯推断——垃圾邮件分类
理论 理论强推阮一峰大神的个人网站 1.贝叶斯推断及其互联网应用(一):定理简介 2.贝叶斯推断及其互联网应用(二):过滤垃圾邮件 非常简明易懂,然后我下面的代码就是实现上面过滤垃圾邮件算法的. 前期 ...
- 贝叶斯推断 概率编程初探
1. 写在之前的话 0x1:贝叶斯推断的思想 我们从一个例子开始我们本文的讨论.小明是一个编程老手,但是依然坚信bug仍有可能在代码中存在.于是,在实现了一段特别难的算法之后,他开始决定先来一个简单的 ...
- PYTHON贝叶斯推断计算:用BETA先验分布推断概率和可视化案例
最近我们被客户要求撰写关于贝叶斯推断的研究报告,包括一些图形和统计输出. 视频:线性回归中的贝叶斯推断与R语言预测工人工资数据案例 贝叶斯推断线性回归与R语言预测工人工资数据 ,时长09:58 在这篇 ...
- 【海量数据挖掘/数据分析】之 贝叶斯信念网络(贝叶斯信念网络、有向无环图、贝叶斯公式、贝叶斯信念网络计算实例)
[海量数据挖掘/数据分析]之 贝叶斯信念网络(贝叶斯信念网络.有向无环图.贝叶斯公式.贝叶斯信念网络计算实例) 目录 [海量数据挖掘/数据分析]之 贝叶斯信念网络(贝叶斯信念网络.有向无环图.贝叶斯公 ...
- 10分钟教你用睡觉这件事玩转贝叶斯推断
编译 | AI科技大本营(ID:rgznai100) 参与 | 张建军 编辑 | 明 明 [AI科技大本营导读]贝叶斯法则和其他统计概念很难通过只用到字母的抽象公式.或者一些虚构的情景来理解.在作者W ...
- 贝叶斯推断及其互联网应用(三):拼写检查
(这个系列的第一部分介绍了贝叶斯定理,第二部分介绍了如何过滤垃圾邮件,今天是第三部分.) 使用Google的时候,如果你拼错一个单词,它会提醒你正确的拼法. 比如,你不小心输入了seperate. G ...
最新文章
- TensorFlow四种Cross Entropy算法实现和应用
- python字典随机取数
- 苹果iOS 6悄然启用新型精准广告追踪技术
- 【转】Asp.net的生命周期之应用程序生命周期
- 识别和非识别关系之间有什么区别?
- MATLAB 画常见二次曲面汇总
- 计算机音乐苹果手机,iPhone手机音乐如何导出电脑?
- UE4TTS文字转语音功能。
- java根据位置信息切割图片
- mysql中筛选不重复值_MYSQL中筛选不重复记录值的示例
- Markdown学习之(2)-绘制表格和流程图
- Linux搭建Java部署环境
- python新手小练习(三)企业奖金提成
- Qt 小键盘功能实现
- WOS(SCI)爬虫:风车WOS下载器
- 手机上日记APP推荐哪个比较好
- 视觉类比VISALOGY: Answering Visual Analogy Questions--NIPS2015
- javaweb JAVA JSP校园二手交易平台源码jsp二手交易系统 闲置物品出售
- CSS3变形透视动画总结
- [ASP.NET网站开发] web程序设计,期末作业,问卷填写与学生选课管理系统(超简单,容易懂!课程考核必过)(使用内置数据库)
热门文章
- VisualSVN Crack
- 《PSP游戏下载 国际象棋大师:学习的艺术》(Chessmaster : The Art Of Learning)
- [全]php-redis函数使用
- 监督学习-逻辑回归及编程作业(一)
- mysql数据库的介绍及安装
- pip virtualenv requirements
- [py]django url 参数/reverse和HttpResponseRedirect
- Bootstrap File Input 真正 解决跨域问题
- JChartFree创建饼形图
- 使用rem适配不同屏幕的移动设备