一、极大似然估计

在上一笔记中,经过推导,得到了朴素贝叶斯分类器的表示形式:

y=argmaxckP(Y=ck)∏jP(X(j)=x(j)|Y=ck)(1)

y = arg \max_{c_k} P(Y=c_k)\prod_jP(X^{(j)} = x^{(j)}| Y=c_k) (1)

也就是说,朴素贝叶斯方法的学习是对概率P(Y=ck)P(Y=c_k)和P(X(j)=x(j)|Y=ck)P(X^{(j)} = x^{(j)}| Y=c_k) 的估计。故可以用极大似然估计法估计上述先验概率和条件概率。


先验概率P(Y=ck)P(Y=c_k)的极大似然估计为:

P(Y=ck)=∑Ni=1I(yi=ck)N,k=1,2,…,K

P(Y=c_k) = \frac{\sum_{i=1}^{N}I(y_i=c_k)}{N}, k=1,2, \dots, K

条件概率P(X(j)=ajl|Y=ck)P(X^{(j)} = a_{jl}| Y=c_k) 的极大似然估计是:

P(X(j)=ajl|Y=ck)=∑Ni=1I(x(j)i=ajl,yi=ck)∑Ni=1I(yi=ck)

P(X^{(j)} = a_{jl}| Y=c_k) = \frac{\sum_{i=1}^{N}I(x_i^{(j)} = a_{jl},y_i=c_k)}{\sum_{i=1}^{N}I(y_i=c_k)}
其中, x(j)ix_i^{(j)}是第i个样本的第j个属性; ajla_{jl}是第j个属性可能取l的值; II是指示函数。


将上述两个极大似然估计的值求出后,根据(1)式确定输入实例的分类。

二、贝叶斯估计

由(1)式可以得知,用极大似然估计可能导致估计出来的概率为0的情况,这会影响后验概率的计算结果,使得后验概率为0,解决这一问题的方法是采用贝叶斯估计。


先验概率Pλ(Y=ck)P_{\lambda}(Y=c_k)的贝叶斯估计是:

P(Y=ck)=∑Ni=1I(yi=ck)+λN+Kλ

P(Y=c_k) = \frac{\sum_{i=1}^{N}I(y_i=c_k)+\lambda}{N+K\lambda}

条件概率Pλ(X(j)=ajl|Y=ck)P_{\lambda}(X^{(j)} = a_{jl}| Y=c_k) 的极大似然估计是:

Pλ(X(j)=ajl|Y=ck)=∑Ni=1I(x(j)i=ajl,yi=ck)+λ∑Ni=1I(yi=ck)+Sjλ

P_{\lambda}(X^{(j)} = a_{jl}| Y=c_k) = \frac{\sum_{i=1}^{N}I(x_i^{(j)} = a_{jl},y_i=c_k)+\lambda}{\sum_{i=1}^{N}I(y_i=c_k)+S_j\lambda}

上式中,λ≥0\lambda \ge 0,等价于在随机变量各个取值的频数上加上一个正数λ>0\lambda > 0。当λ=0\lambda = 0时就是极大似然估计。取λ=1\lambda = 1称为拉普拉斯平滑(Laplace smoothing)。

显然对于任何l=1,2,…,Sj;k=1,2,…,Kl =1,2, \dots,S_j; k=1,2 ,\dots,K有:

Pλ(X(j)=ajl|Y=ck)>0

P_{\lambda}(X^{(j)} = a_{jl}| Y=c_k) >0

∑l=1SjP(X(j)=ajl|Y=ck)=1

\sum_{l=1}^{S_j}P(X^{(j)} = a_{jl}| Y=c_k) =1

总结

朴素贝叶斯方法的原理和重点内容到目前用了三节内容就重点学习完了,接下来会进一步学习跟贝叶斯相关的贝叶斯网络的内容。

机器学习笔记(六)——朴素贝叶斯法的参数估计相关推荐

  1. 朴素贝叶斯法的参数估计——贝叶斯估计及其Python实现

    统计学习方法--朴素贝叶斯法原理 1. 贝叶斯估计 1.1 为什么要用贝叶斯估计(极大似然的缺点) 1.2 贝叶斯估计原理 贝叶斯估计的算法过程合极大似然估计的算法过程一模一样,代码也几乎一模一样,只 ...

  2. 机器学习笔记 - 学习朴素贝叶斯概念及应用

    一.思想概述         贝叶斯分类算法是一大类分类算法的总称:贝叶斯分类算法以样本可能属于某类的概率来作为分类依据:朴素贝叶斯分类算法是贝叶斯分类算法中最简单的一种. 朴素贝叶斯分类器是一种用于 ...

  3. 机器学习笔记:朴素贝叶斯方法(Naive Bayes)原理和实现

    本文主要描述了朴素贝叶斯分类方法,包括模型导出和学习描述.实例部分总结了<machine learning in action>一书中展示的一个该方法用于句子感情色彩分类的程序.1 方法概 ...

  4. 【机器学习笔记】朴素贝叶斯

    本文学习自 https://zhuanlan.zhihu.com/ml-jack 朴素贝叶斯 朴素贝叶斯算法是有监督的学习算法,解决的是分类问题. 1.贝叶斯决策理论 贝叶斯决策理论的核心思想:选择具 ...

  5. 朴素贝叶斯法---朴素贝叶斯法的参数估计

    为什么80%的码农都做不了架构师?>>>    极大似然估计 学习与分类算法 贝叶斯估计 转载于:https://my.oschina.net/liyangke/blog/29452 ...

  6. 《统计学习方法》读书笔记——朴素贝叶斯法(公式推导+代码实现)

    传送门 <统计学习方法>读书笔记--机器学习常用评价指标 <统计学习方法>读书笔记--感知机(原理+代码实现) <统计学习方法>读书笔记--K近邻法(原理+代码实现 ...

  7. 机器学习理论《统计学习方法》学习笔记:第四章 朴素贝叶斯法

    机器学习理论<统计学习方法>学习笔记:第四章 朴素贝叶斯法 4 朴素贝叶斯法 4.1 朴素贝叶斯法的学习与分类 4.1.1 基本方法 4.1.2 后验概率最大化的含义 4.2 朴素贝叶斯法 ...

  8. 04 朴素贝叶斯法——读书笔记

    一.相关概念: 先验概率: 是指事件发生前的预判概念,也可以说是"因"发生的概率,即表示为 P(X). 条件概率: 是指事件发生后求得反向条件概率,也可以说是在"因&qu ...

  9. 机器学习理论学习:朴素贝叶斯

    最近一直在看<统计学习方法>,打算先把理论搞明白,后续将着重用c++实现下自己ml库,计划就是这样,好好干吧.其实在平常中使用这个算法比较少,但他主要的优势是在少量,几十或几百张样本的情况 ...

最新文章

  1. VC遍历窗体控件的实现
  2. 红帽企业版linux 7.3,红帽推企业Linux 7.3 新功能特性一览
  3. LeetCode 1023. 驼峰式匹配(暴力匹配)
  4. Cannot determine the location of the VS Common Tools folder.
  5. java的幂运算_java数组五种运算符
  6. svn diff和vimdiff的使用
  7. win7录屏_好哈屏幕录制下载_好哈屏幕录制最新官方版下载[录屏软件]
  8. 移动端UI设计尺寸规范以及iPhone尺寸大小
  9. 微信测试号实现微信网页的分享
  10. 青少年重度抑郁的动态功能连接:与严重程度和症状维度的关系
  11. speedoffice(Excel)如何全选表格
  12. 微信小程序---倒计时
  13. 摆的频率公式_频率与转速的公式
  14. JavaScript中的计时器与定时器
  15. 实验一:JSP编程范例
  16. 图片加载失败处理方法
  17. 如何准确查询网易邮箱和微软邮箱的注册时间
  18. 蓝桥杯 九宫重排 java_九宫重排--蓝桥杯国赛历年真题
  19. 关于gameonline.info
  20. 视频播放三:Vitamio

热门文章

  1. HTML的文本格式化
  2. 用Notepad++来编写第一个HTML网页程序,你也可以!!!
  3. python3 struct.pack方法报错argument for 's' must be a bytes object
  4. VGG网络结构(二)
  5. 方舟服务器维护驯龙,方舟生存进化新手图文攻略 最详细的驯龙教程方法
  6. ValueError: Program dot not found in path.python下运行pygraphviz出现报错
  7. 汇编语言基础知识摘要(《汇编语言》王爽)第 1 / 17 章
  8. Unix/Linux环境C编程入门教程(18) kali-linuxCCPP开发环境搭建
  9. MySQL数据库SQL层级优化
  10. 从FLC中学习的设计模式系列-创建型模式(3)-工厂方法