目录

引入

生成式模型和判别式模型

朴素贝叶斯实例(了解三大知识点)

朴素贝叶斯相关代码理解

使用Python进行文本分类

从文本中构建词向量

训练算法:从词向量计算概率

朴素贝叶斯分类器

使用朴素贝叶斯过滤垃圾邮件

切分文本

使用朴素贝叶斯进行交叉验证

使用朴素贝叶斯分类器通过博主个人博客内容辨别博主知识侧重点

导入并处理RSS源数据

构造RSS源分类器

分析数据:显示两个博主的博客的表征词

总结:


引入

前面学习的内容都是要求分类器直接给出分类结果,今天学习的朴素贝叶斯可以给出一个最优的类别猜测结果,同时给出这个猜测的概率估计值。

以垃圾邮件分类为例,一封邮件通过朴素贝叶斯得到的分类结果可能会是如下结果:

没有一个准确猜测,但是会给每个猜测计算概率,最后会选取概率最大的猜测作为结果。

先验概率:在训练模型之前,通过历史数据得到的初始概率;该概率与待测样本无关,独立于样本。

后验概率:反映了在看到数据样本x后cj成立的置信度,即通过样本获得新的信息(既有先验概率资料,也有补充资料),利用贝叶斯公式对先验概率进行修正,而后得到的概率。

后验概率实为一个条件概率,即为已知历史数据和现有数据互不重叠的前提下,在历史数据的条件下,现有数据发生的概率

区别:先验概率只需要简单地计算,没有用到贝叶斯公式;而后验概率的计算,要用到贝叶斯公式,而且在利用样本资料计算逻辑概率时,还要使用理论概率分布,需要更多的数理统计知识。

注意:大部分机器学习模型尝试得到后验概率

生成式模型和判别式模型

机器学习可以分为两大视角,分别是生成式模型和判别式模型,本次的朴素贝叶斯是生成式模型的典型代表。

生成式模型是对联合概率P(Di,X)建立函数映射关系。

判别式模型是对条件概率P(Di|X)建立函数映射关系,该模型在学习过程中会生成一个显式决策边界,当待测样本的数据(耦合地包含了决策条件)落入某个边界,则意味着该数据属于这个类别。

举个我能理解的栗子:如何确定一只羊是山羊还是绵羊。

生成式模型:该模型会从训练数据中分别学习出一个山羊模型和一个绵羊模型,然后从待测的

机器学习(四)——朴素贝叶斯相关推荐

  1. 朴素贝叶斯 php,PHP实现机器学习之朴素贝叶斯算法详解.pdf

    PHP实实现现机机器器学学习习之之朴朴素素贝贝叶叶斯斯算算法法详详解解 本文实例讲述了PHP实现机器学习之朴素贝叶斯算法.分享给大家供大家参考 具体如下: 机器学习已经在我们的生活中变得随处可见了.比 ...

  2. 【机器学习】朴素贝叶斯、SVM和数据分布检验分析

    [机器学习]朴素贝叶斯.SVM和数据分布检验分析 文章目录 1 朴素贝叶斯 2 SVM2.1 线性可分2.2 最大间隔超平面2.3 SVM 最优化问题 3 数据分布检验方法3.1 数据分布检验3.2 ...

  3. 机器学习:朴素贝叶斯

    机器学习:朴素贝叶斯 1 朴素贝叶斯应用场景 2 朴素贝叶斯相关公式 3 sklearn库中朴素贝叶斯运用 3.1 伯努利朴素贝叶斯 3.2 多项式朴素贝叶斯 3.3 高斯朴素贝叶斯 4 代码 4.1 ...

  4. 机器学习:朴素贝叶斯模型算法原理(含实战案例)

    机器学习:朴素贝叶斯模型算法原理 作者:i阿极 作者简介:Python领域新星作者.多项比赛获奖者:博主个人首页

  5. 机器学习之朴素贝叶斯 1

    机器学习之朴素贝叶斯 1 朴素贝叶斯 2 朴素贝叶斯应用 3 代码实现贝努力朴素贝叶斯 4 代码实现高斯朴素贝叶斯 5 代码实现多项式朴素贝叶斯 6 总结 前言:主要介绍朴素贝叶斯的概念.公式,以及代 ...

  6. 【机器学习算法-朴素贝叶斯、支持向量机】

    机器学习算法-朴素贝叶斯算法 1.朴素贝叶斯算法 2.支持向量机 2.1SVM基本综述 1.朴素贝叶斯算法 朴素贝叶斯是生成模型,需要根据已有的数据求出先验概率. 1.联合概率 2.条件概率 3.相互 ...

  7. 机器学习实战---朴素贝叶斯算法实现+使用K折交叉验证(代码详解+创新)

    <机器学习实战朴素贝叶斯算法实现+使用K折交叉验证> 未经允许,不得擅自转载! 提供数据集如下(永久有效,需要的自行下载): 链接:https://pan.baidu.com/s/1Sv0 ...

  8. 机器学习实战 朴素贝叶斯分类器

    基于概率论的分类方法: 朴素贝叶斯 我的微信公众号: s406205391; 欢迎大家一起学习,一起进步!!! k-近邻算法和决策树会给出"该数据属于哪一类"的明确回答.不过,分类 ...

  9. 机器学习之朴素贝叶斯学习笔记

    朴素贝叶斯 一.概述 朴素贝叶斯算法是有监督的学习算法,解决的是分类问题,如客户是否流失.是否值得投资.信用等级评定等多分类问题.该算法的优点在于简单易懂.学习效率高.在某些领域的分类问题中能够与决策 ...

  10. 机器学习实验 - 朴素贝叶斯分类器

    目录 一.报告摘要 1.1 实验要求 1.2 实验思路 1.3 实验结论 二.实验内容 2.1 方法介绍 2.2 实验细节 2.2.1 实验环境 2.2.2 实验过程 2.2.3 实验与理论内容的不同 ...

最新文章

  1. show在php,show.php
  2. Mysql优化系列(1)--Innodb重要参数优化
  3. JS实现图片上传时的本地预览,兼容IE和firefox谷歌
  4. 闪迪U3利用工具U3-Pwn
  5. 【7集iCore3基础视频】7-7 Qt5.2.1安装
  6. GODADDY主机用tar命令通过SSH远程打包20M以上的文件
  7. GGNN(Gated Graph Sequence Neural Networks)
  8. 鸟哥的Linux私房菜(基础篇)- 第八章、Linux 磁盘与文件系统管理
  9. mysql用户角色权限代码_用户权限管理代码
  10. JDK 10的摘要Javadoc标签
  11. IntelliJ IDEA:使用Google Guava生成equals,hashCode和toString
  12. 获得系统中某个进程的cpu使用率
  13. android listview的理解,Android ListView的理解
  14. css-盒子模型详解以及远视图的制作
  15. DevCon.exe 导出output至指定文件
  16. HTTP消息推送原理
  17. HBase学习笔记:HBase数据库介绍
  18. HTML,CSS 样式模板大全
  19. selenium-模拟登录QQ空间(附模拟滑动验证码)
  20. python的十句名言_“洗 脑”最厉害的10句名言!经典!

热门文章

  1. 软件测试是吃青春饭的吗?30岁后软件测试该何去何从?
  2. Java动态代理实现与分析
  3. 【GEE 学习】在云平台实现波段计算--以MOD09GA计算albedo为例
  4. 西工大计算机考研情况,2007我的西工大计算机考研之路总结
  5. pug模板引擎基本用法
  6. 驾考一点通 android
  7. CreCloud云网管测试手记
  8. 差分驱动芯片AM26LS31使用总结
  9. vue项目中的一些报错解决方法
  10. HDFS 分布式文件系统的搭建与使用