机器学习实战 - 读书笔记(04) - 朴素贝叶斯
核心公式 - 贝叶斯准则
\[p(c|x) = \frac{p(x|c)p(c)}{p(x)}\]
- p(c|x) 是在x发生的情况下,c发生的概率。
- p(x|c) 是在c发生的情况下,x发生的概率。
- p(c) 是c发生的概率。
- p(x) 是x发生的概率。
规则
如果P(c₁|x) > P(c₂|x),那么属于类别c₁。
如果P(c₁|x) < P(c₂|x),那么属于类别c₂。
等价变化
\[p(c1|x) = \frac{p(x|c1)p(c1)}{p(x)}\]
\[p(c2|x) = \frac{p(x|c2)p(c2)}{p(x)}\]
Therefore, comparing p(c1|x) and p(c2|x)
are same as comparing
\(\frac{p(x|c1)p(c1)}{p(x)}\) and \(\frac{p(x|c2)p(c2)}{p(x)}\)
same as comparing
\(p(x|c1)p(c1)\) and \(p(x|c2)p(c2)\)
多个独立特征的变化
p(x|c1)中,x是多个独立特征,即\(x=x_0,x_1...x_n\),
则: \(p(x|c1)=p(x_0,x_1...x_n|c1)\)
\(p(x|c1)=p(x_0|c1)p(x_1|c1)...p(x_n|c1)\)
下溢出问题
为了解决下溢出问题,这是由于太多很小的数相乘造成的,所以程序会下溢出或者得到不正确的答案。
在代数中有ln(a*b) = ln(a)+ln(b),于是通过求对数可以避免下溢出或者浮点数舍入导致的错误。同时,采用自然对数进行处理不会有任何损失。
Therefore, comparing p(c1|x) and p(c2|x)
same as comparing
\(log(p(x_0|c1)) + log(p(x_1|c1)) + ... + log(p(x_n|c1) + log(p(c1))\) and
\(log(p(x_0|c2)) + log(p(x_1|c2)) + ... + log(p(x_n|c2) + log(p(c2))\)
实际应用
- 过滤侮辱性留言
- 过滤垃圾邮件
转载于:https://www.cnblogs.com/steven-yang/p/5592582.html
机器学习实战 - 读书笔记(04) - 朴素贝叶斯相关推荐
- 机器学习实战读书笔记(3)朴素贝叶斯
贝叶斯定理 要理解贝叶斯推断,必须先理解贝叶斯定理.后者实际上就是计算"条件概率"的公式. 所谓"条件概率"(Conditional probability), ...
- 机器学习实战(三)朴素贝叶斯NB(Naive Bayes)
目录 0. 前言 1. 条件概率 2. 朴素贝叶斯(Naive Bayes) 3. 朴素贝叶斯应用于文本分类 4. 实战案例 4.1. 垃圾邮件分类案例 学习完机器学习实战的朴素贝叶斯,简单的做个笔记 ...
- 机器学习实战(三)朴素贝叶斯 (Peter Harrington著)
知识储备: 一.概率论和数理统计 第一章 概率论的基本概念 1.必须要掌握的名词 (1) 样本空间 一般可以认为是整个样本 (2) 样本点 其中的一个样本,其中每个样本一般可以理解为特征向量 (3) ...
- 《机器学习实战》-04 朴素贝叶斯
说明: 作业的所有代码都要基于Python3 学习大纲:https://blog.csdn.net/qq_34243930/article/details/84669684 (所有计划均在学习大纲里) ...
- 机器学习实战---读书笔记: 第11章 使用Apriori算法进行关联分析---2---从频繁项集中挖掘关联规则
#!/usr/bin/env python # encoding: utf-8''' <<机器学习实战>> 读书笔记 第11章 使用Apriori算法进行关联分析---从频繁项 ...
- 机器学习实战读书笔记--朴素贝叶斯
1.朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法, 最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Bayesian Model, ...
- 04 朴素贝叶斯法——读书笔记
一.相关概念: 先验概率: 是指事件发生前的预判概念,也可以说是"因"发生的概率,即表示为 P(X). 条件概率: 是指事件发生后求得反向条件概率,也可以说是在"因&qu ...
- 机器学习笔记:朴素贝叶斯方法(Naive Bayes)原理和实现
本文主要描述了朴素贝叶斯分类方法,包括模型导出和学习描述.实例部分总结了<machine learning in action>一书中展示的一个该方法用于句子感情色彩分类的程序.1 方法概 ...
- 机器学习读书笔记之6 - 贝叶斯系列
概率论只不过是把常识用数学公式表达了出来. --拉普拉斯 目录 0. 前言 1. 历史 1.1 一个例子:自然语言的二义性 1.2 贝叶斯公式 2. 拼写纠正 3. 模型比较 ...
最新文章
- 计算机视觉方向简介 | 单目微运动生成深度图
- 隐马尔科夫模型(HMM)解释 和 前向与后向算法[转] 讲解通俗易懂 赞
- 北京工商大学计算机学院研究生院,北京工商大学计算机学院
- 第十六天:9.1规划人力资源管理。
- Linux文件操作实用笔记
- 南京铁道学院计算机应用,南京铁道职业技术学院交通运营管理专业怎么样
- Servlet是否单例?
- Android系统性能优化(71)---关于Bitmap图片资源优化的小事
- 试设计递归算法dfs traverse_BFS 算法框架套路详解
- /usr/bin/ld: cannot find -l*
- android8.0华为荣耀8,一线|华为手机开启重大升级 荣耀成安卓8.0覆盖机型最多品牌...
- 接口自动化测试框架必备的9个功能举例
- MacOS如何设置不使用时退出登录用户账号
- 20200815每日一句
- 【知识产权之专利权】选择题题库
- css3帮助文档,CSS3 最新版参考手册
- 7.15周三晚8点,dotnet课堂全新起航,张善友/陈计节/刘腾飞我们一起来聊聊abp的故事...
- SQLite Expert查看SQLite数据库文件没有数据的问题
- python图形绘制星空图_天文星空图谱开源软件Stellarium
- Shadow DOM的样式ShadowRoot
热门文章
- 《巫师 3:狂猎》:传统叙事在开放世界中的水土不服
- 《Artifact》的得与失:成功的游戏工业品,却与主流背道而驰
- Unite 2018 | 浅谈伽玛和线性颜色空间
- 再观手游市场新风口-二次元游戏
- LOL手游2.3版皮肤大更新,端游玩家:新春级和珍稀级会返场吗
- 递归_三要素_基础算法必备
- SQL基础【九、Update】
- DB_NAME、DB_UNIQUE_NAME、SERVICE_NAME和INSTANCE_NAME等的区别
- File stdin , line 1
- Codeforces 285E Positions in Permutations dp + 容斥原理