贝叶斯原理

贝叶斯原理其实是用来求“逆向概率”的。所谓“逆向概率”是相对“正向概率”而言。就是从结果推出条件。贝叶斯原理建立在主观判断的基础上:在我们不了解所有客观事实的情况下,同样可以先估计一个值,然后根据实际结果不断进行修正。

贝叶斯公式

实际上,贝叶斯公式就是求阶后验概率的。

朴素贝叶斯

它是一种简单但极为强大的预测建模算法。之所以称为朴素贝叶斯,是因为它假设每个输入变量是独立的。这是一个强硬的假设,实际情况并不一定,但是这项技术对于绝大部分的复杂问题仍然非常有效。

输入变量就是特征,朴素贝叶斯假设这些特征之间是没有关系的,是独立事件。因此算特征概率的时候可以分开算然后相乘。

朴素贝叶斯模型由两种类型的概率组成:

  • 每个类别的概率P(Cj);
  • 每个属性的条件概率P(Ai|Cj)。

类别概率和条件概率的区别:

类别概率是输出变量之间的概率,与特征没有关系。但条件概率是基于特征的变量的概率。

为了训练朴素贝叶斯模型,我们需要先给出训练数据,以及这些数据对应的分类。那么上面这两个概率,也就是类别概率和条件概率。他们都可以从给出的训练数据中计算出来。一旦计算出来,概率模型就可以使用贝叶斯原理对新数据进行预测。

贝叶斯原理、贝叶斯分类器、朴素贝叶斯的区别

贝叶斯原理是最大的概念,它解决了概率论中“逆向概率”的问题,在这个理论基础上,人们设计出了贝叶斯分类器,朴素贝叶斯分类是贝叶斯分类器中的一种,也是最简单,最常用的分类器。朴素贝叶斯之所以朴素是因为它假设属性是相互独立的,因此对实际情况有所约束,如果属性之间存在关联,分类准确率会降低。不过好在对于大部分情况下,朴素贝叶斯的分类效果都不错。

实际上,贝叶斯原理是数学基础,贝叶斯分类是一种模型,而朴素贝叶斯则是具体方法。

朴素贝叶斯分类的工作流程

  1. 输入和输出,输入训练的数据集,第i个样本的第j个特征,第j个特征可能取得第l个值:输出x的分类
  2. 计算出先验概率和条件概率,对于给定的实例,基于独立假设条件下计算联合概率P(X=x,Y=ck),根据最大化后验概率法则,确定x的类别。

先验概率:通过经验来判断事情发生的概率,比如说“贝叶死”的发病率是万分之一,就是先验概率。再比如南方的梅雨季是 6-7 月,就是通过往年的气候总结出来的经验,这个时候下雨的概率就比其他时间高出很多。
后验概率:后验概率就是发生结果之后,推测原因的概率。比如说某人查出来了患有“贝叶死”,那么患病的原因可能是 A、B 或 C。患有“贝叶死”是因为原因 A 的概率就是后验概率。它是属于条件概率的一种。
条件概率:事件 A 在另外一个事件 B 已经发生条件下的发生概率,表示为 P(A|B),读作“在 B 发生的条件下 A 发生的概率”。比如原因 A 的条件下,患有“贝叶死”的概率,就是条件概率。

那么我们通过输入的特征和目标变量就可以求出先验概率和条件概率。通过条件独立性假设和最大似然估计(后验概率最大化)来得出最后的分类。

后验概率最大化的含义

我们这里假设为0-1损失函数,为了使损失函数最小相当于后验概率最大化。

原理

朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的待分类项xx,通过学习到的模型计算后验概率分布,即:在此项出现的条件下各个目标类别出现的概率,将后验概率最大的类作为xx所属的类别。

在估计条件概率P(X∣Y)P(X∣Y)时出现概率为0的情况怎么办?

解决这一问题的方法是采用贝叶斯估计。简单来说,引入λλ,当λ=1λ=1时,就是普通的极大似然估计;当λ=1λ=1时称为拉普拉斯平滑。。

怎么理解朴素贝叶斯中的“朴素”?

因为它假定所有的特征在数据集中的作用是独立同分布的,但这个假设在现实生活中很不真实,因此很“朴素”。

为什么引入条件独立性假设?

为了避免贝叶斯定理求解时面临的组合爆炸、这就导致条件概率分布的参数数量为指数级别。

朴素贝叶斯朴素在哪里?

在计算条件概率分布P(X=x∣Y=ck)P(X=x∣Y=c k)时,NB引入了一个很强的条件独立假设,即,当Y确定时,X的各个特征分量取值之间相互独立。

朴素贝叶斯与LR的区别?

(1)简单来说:

朴素贝叶斯是生成模型,根据已有样本进行贝叶斯估计学习出先验概率P(Y)和条件概率P(X|Y),进而求出联合分布概率P(XY),最后利用贝叶斯定理求解P(Y|X), 而LR是判别模型,根据极大化对数似然函数直接求出条件概率P(Y|X); 朴素贝叶斯是基于很强的条件独立假设(在已知分类Y的条件下,各个特征变量取值是相互独立的),而LR则对此没有要求; 朴素贝叶斯适用于数据集少的情景,而LR适用于大规模数据集。 (2)进一步说明:前者是生成式模型,后者是判别式模型,二者的区别就是生成式模型与判别式模型的区别。

朴素贝叶斯的三种模型

  • 多项式模型,特征是离散的时候,用多项式模型或做一些平滑的处理。一般是拉普拉斯平滑,这时候用到的是贝叶斯估计,不再是极大似然估计。因为如果不做平滑,当出现一些训练样本中没有的数据时,会使条件概率为0,从而导致后验概率为0
  • 高斯模型,当特征是连续变量时,运用多项式模型,条件概率难以描述真实情况。因此此时用高斯模型,假设特征都服从正态分布。就是求出某一特征的样本和方差得到该特征的正态分布,然后带入样本点进概率密度函数估计为条件概率值,这样就可以计算性别分类了。
  • 伯努利分布

基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_朴素贝叶斯算法知识点总结...相关推荐

  1. 基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_第十章:利用Python实现朴素贝叶斯模型

    免责声明:本文是通过网络收集并结合自身学习等途径合法获取,仅作为学习交流使用,其版权归出版社或者原创作者所有,并不对涉及的版权问题负责.若原创作者或者出版社认为侵权,请联系及时联系,我将立即删除文章, ...

  2. 基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_朴素贝叶斯为什么被称为“朴素”?...

    一.基本理解 1.朴素贝叶斯分类器: 例:如果有一种水果具有红.椭圆形.直径约3英寸等特征,则该水果可以被判定为是苹果. 尽管这些特征相互依赖或者有些特征由其他特征决定,然而朴素贝叶斯分类器认为这些属 ...

  3. 基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_朴素贝叶斯(转载自Morgan)...

    什么是朴素贝叶斯 要搞懂朴素贝叶斯分类,首先需要了解什么是贝叶斯定理和特征条件独立假设,朴素贝叶斯算法就是基于这两个来实现的分类方法. 贝叶斯定理 贝叶斯定理通俗点讲就是求在事件 B 已经发生的前提下 ...

  4. 基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_机器学习之朴素贝叶斯

    1.贝叶斯原理 朴素贝叶斯分类(Naive Bayesian,NB)源于贝叶斯理论,是一类基于概率的分类器,其基本思想:假设样本属性之间相互独立,对于给定的待分类项,求解在此项出现的情况下其他各个类别 ...

  5. 基于朴素贝叶斯分类器的西瓜数据集(实战)

    最近刚开始学习机器学习中的朴素贝叶斯分类器,用西瓜数据集做了一下,最后结果预测正确率75%,其中运用到的python语法并不复杂,适合小白观看. 目录 朴素贝叶斯分类器思想的自然语言描述: 详细步骤在 ...

  6. 朴素贝叶斯分类器及西瓜判定实例

    朴素贝叶斯分类器是一系列以假设特征之间强(朴素)独立下运用贝叶斯定理为基础的简单概率分类器.下面我们通过西瓜判定的实例,阐述利用贝叶斯算法进行简单模式识别分类的过程. 鉴于概率论与数理统计基础,我们直 ...

  7. 基于朴素贝叶斯分类器的钞票真伪识别模型

    基于朴素贝叶斯分类器的钞票真伪识别模型 内容 本实验通过实现钞票真伪判别案例来展开学习朴素贝叶斯分类器的原理及应用. 本实验的主要技能点: 1. 朴素贝叶斯分类器模型的构建 2. 模型的评估与预测 3 ...

  8. 基于python的贝叶斯分类器_Python实现朴素贝叶斯分类器的方法详解

    本文实例讲述了Python实现朴素贝叶斯分类器的方法.分享给大家供大家参考,具体如下: 贝叶斯定理 贝叶斯定理是通过对观测值概率分布的主观判断(即先验概率)进行修正的定理,在概率论中具有重要地位. 先 ...

  9. 朴素贝叶斯python实现预测_Python实现朴素贝叶斯分类器的方法详解

    本文实例讲述了Python实现朴素贝叶斯分类器的方法.分享给大家供大家参考,具体如下: 贝叶斯定理 贝叶斯定理是通过对观测值概率分布的主观判断(即先验概率)进行修正的定理,在概率论中具有重要地位. 先 ...

  10. 朴素贝叶斯分类器python_朴素贝叶斯分类器及Python实现

    贝叶斯定理 贝叶斯定理是通过对观测值概率分布的主观判断(即先验概率)进行修正的定理,在概率论中具有重要地位. 先验概率分布(边缘概率)是指基于主观判断而非样本分布的概率分布,后验概率(条件概率)是根据 ...

最新文章

  1. 数据集超越MS COCO,2020智源x旷视Objects365物体检测挑战赛开赛
  2. actived生命周期_vue生命周期钩子函数actived没有执行
  3. jsp页面展示更加商品的分类,控制商品的显示
  4. 自学编程的 6 个技巧总结
  5. Android okHttp上传图片
  6. linux系统中使用pycharn,在pycharm中使用linux控制台
  7. 监控视图 oracle,Oracle“并行执行”之四——监控视图
  8. sublimetext3插件安装_sublime text 3 交互python
  9. 如何测试web服务器性能,如何执行Web服务器性能基准测试?
  10. SpringMVC防止XSS攻击
  11. Redis2.8的安装教程,linux下
  12. Mac下安装git极简教程
  13. SecureCRT 不能输入命令及回车键不能用
  14. WordPress网站建设中实用的简繁切换工具
  15. Windows Server 2008 R2 安装及配置
  16. c语言课设雷霆战机编程,C语言写的雷霆战机
  17. 头条极速版问答自动化教程
  18. 怎样去除掉心灵的杂草
  19. 加盐密码哈希:如何正确使用 (转)
  20. 2018.8.盛夏,

热门文章

  1. 学前教育计算机课程设置,计算机网络背景下学前教育专业课程设置分析
  2. 从零实现加密隧道(二):socks5 协议详解
  3. dell系统重装后无法进入系统_戴尔电脑重装系统后开机出现NO Boot Device Found进不了系统...
  4. [管理]鼎捷软件售后服务体验
  5. Wordpress源码文件详解
  6. Android混淆注意事项
  7. Struts1.x ActionForm
  8. IPK轻量级密钥技术在电力卫星物联网中的接入与非证书签名认证
  9. m序列的原理以及verilog实现
  10. 数学建模算法python源码_热传导方程之显示差分算法(python源码)