来,继续回顾基础算法

文章目录

  • 背景&贝叶斯原理
  • 贝叶斯分类器
  • 朴素贝叶斯分类器
  • 西瓜数据集下的朴素贝叶斯示例
  • 朴素贝叶斯分类的优缺点
  • 朴素贝叶斯关键问题
  • 朴素贝叶斯企业中的应用案例
  • 基于朴素贝叶斯的垃圾邮件分类

背景&贝叶斯原理

  • 朴素贝叶斯基于的原理是贝叶斯原理。

  • 贝叶斯原理:通过相关概率已知的情况下利用误判损失来选择最优的类别分类。

  • 贝叶斯原理是英国数学家托马斯·贝叶斯提出的。贝叶斯是个很神奇的人,他的经历类似梵高。生前没有得到重视,死后,他写的一篇关于归纳推理的论文被朋友翻了出来,并发表了。这一发表不要紧,结果这篇论文的思想直接影响了接下来两个多世纪的统计学,是科学史上著名的论文之一。

  • 贝叶斯为了解决一个叫“逆向概率”问题写了一篇文章,尝试解答在没有太多可靠证据的情况下,怎样做出更符合数学逻辑的推测。

  • 什么是“逆向概率”呢?先说正向概率,正向概率的问题很容易理解,比如我们已经知道袋子里面有 N 个球,不是黑球就是白球,其中 M 个是黑球,那么把手伸进去摸一个球,就能知道摸出黑球的概率是多少。但这种情况往往是上帝视角,即了解了事情的全貌再做判断

  • 逆向概率:**如果我们事先不知道袋子里面黑球和白球的比例,而是通过我们摸出来的球的颜色,能判断出袋子里面黑白球的比例么?**贝叶斯原理与其他统计学推断方法截然不同,它是建立在主观判断的基础上:在我们不了解所有客观事实的情况下,同样可以先估计一个值,然后根据实际结果不断进行修正。

  • 关于贝叶斯原理,又不得不熟悉这几个概念:条件概率,先验概率,后验概率,我这边文章有解释:AI基础:先验概率、后验概率

贝叶斯分类器

贝叶斯公式先上
P ( B ∣ A ) = P ( A ∣ B ) P ( B ) P ( A ) P ( 类别 ∣ 特征 ) = P ( 特征 ∣ 类别 ) P ( 类别 ) P ( 特征 ) P\left( B|A \right) \,\,=\,\,\frac{P\left( A|B \right) P\left( B \right)}{P\left( A \right)} \\ P\left( \text{类别}|\text{特征} \right) \,\,=\,\,\frac{P\left( \text{特征}|\text{类别} \right) P\left( \text{类别} \right)}{P\left( \text{特征} \right)} P(B∣A)=P(A)P(A∣B)P(B)​P(类别∣特征)=P(特征)P(特征∣类别)P(类别)​

我们最终的目的是求在当前特征下样本所属类别,化作条件概率公式就是P(类别|特征1,特征2,特征n)。当然就是求这一组特征{特征1,特征2,特征n}下每个类别的条件概率,哪个概率大,那就属于哪个类别。

贝叶斯分类器是基于贝叶斯原理理论的实践。

假设有N种可能的分类标记,记为

AI基础:朴素贝叶斯与垃圾邮件分类相关推荐

  1. Python实现基于朴素贝叶斯的垃圾邮件分类 标签: python朴素贝叶斯垃圾邮件分类 2016-04-20 15:09 2750人阅读 评论(1) 收藏 举报 分类: 机器学习(19) 听说

    Python实现基于朴素贝叶斯的垃圾邮件分类 标签: python朴素贝叶斯垃圾邮件分类 2016-04-20 15:09 2750人阅读 评论(1) 收藏 举报  分类: 机器学习(19)  听说朴 ...

  2. 机器学习--使用朴素贝叶斯进行垃圾邮件分类

    一.学习背景 垃圾邮件的问题一直困扰着人们,传统的垃圾邮件分类的方法主要有"关键词法"和"校验码法"等,然而这两种方法效果并不理想.其中,如果使用的是" ...

  3. 朴素贝叶斯法 - 垃圾邮件分类

    本文基于朴素贝叶斯构建一个分类垃圾邮件的模型,研究对象是英文的垃圾邮件. 邮件内容保存在txt文件中,其中分为训练样本train和测试样本test. 在训练样本中正常邮件命名为:pos:垃圾邮件命名为 ...

  4. [CS229学习笔记] 5.判别学习算法与生成学习算法,高斯判别分析,朴素贝叶斯,垃圾邮件分类,拉普拉斯平滑

    本文对应的是吴恩达老师的CS229机器学习的第五课.这节课介绍了判别学习算法和生成学习算法,并给出了生成学习算法的一个实例:利用朴素贝叶斯进行垃圾邮件分类. 判别学习(Discriminative L ...

  5. 朴素贝叶斯(垃圾邮件分类)

    一.基于贝叶斯决策理论的分类方法 朴素贝叶斯是经典的机器学习算法之一,也是为数不多的基于概率论的分类算法.对于大多数的分类算法,在所有的机器学习分类算法中,朴素贝叶斯和其他绝大多数的分类算法都不同.比 ...

  6. Python微调文本顺序对抗朴素贝叶斯算法垃圾邮件分类机制

    封面图片:<Python可以这样学>,ISBN:9787302456469,董付国,清华大学出版社 图书详情(京东): ================= 关于朴素贝叶斯算法中文垃圾邮件分 ...

  7. 基于朴素贝叶斯的垃圾邮件分类-着重理解拉普拉斯变换

    1. 引言 在正式学习朴素贝叶斯之前,需要明确的是机器学习所要实现的是基于有限的训练样本集尽可能准确地估计出后验概率P(c|x),即根据特征得到所属类别的概率,首先引入两个概念. 判别式模型(disc ...

  8. 朴素贝叶斯与垃圾邮件分类

    垃圾邮件识别问题,也即对给定样本(包含垃圾邮件,非垃圾邮件)判断是否为垃圾邮件,根据贝叶斯定理: ⎧⎩⎨⎪⎪⎪⎪⎪⎪p(y=1|x)=p(y=1,x)p(x)p(y=0|x)=p(y=0,x)p(x) ...

  9. 朴素贝叶斯 实现 垃圾邮件分类

    1.贝叶斯的基本思想: 已知公式:p(y|x)=p(x|y)*p(y)/p(x) 可以将x看做特征向量,y为结果,那么p(y|x)就是在x特征出现的情况下,结果为y的概率. 在机器学习中,p(y|x) ...

最新文章

  1. pigcms 标签读不出
  2. 卷积神经网络模型解读汇总——LeNet5,AlexNet、ZFNet、VGG16、GoogLeNet和ResNet
  3. 编程之美 1.12 nim(2)
  4. 8位数控分频器的设计_8位数控分频器
  5. 获取32R的图像的直方图的一个算法
  6. [置顶] 自己动手写Web容器之TomJetty之六:动态页面引入
  7. 写python程序最佳实践_Python后台程序打包最佳实践
  8. 【Hoxton.SR1版本】Spring Cloud Gateway网关初体验
  9. python如何跳出函数_python如何跳出函数
  10. 联想台式电脑序列号查看方法
  11. 手游pvp系统网络设计
  12. tas5707php,TAS5707PHP
  13. Android自定义View实现方位刻度尺(类似于吃鸡手游)
  14. 生吃素食健康驻颜5大注意
  15. 论文阅读笔记:(2021.06, cvpr) Monocular 3D Object Detection: An Extrinsic Parameter Free Approach
  16. 4 万字超强总结!Java 这些必备基础知识不可少
  17. 瑞工热敏票据打印机不自动裁切的设置
  18. 魅蓝note3联通卡显示无服务器,竟然有这么多bug?面对魅蓝note3犹豫了
  19. linux中tmount命令,Linux中mount命令起什么作用呢?
  20. 股票数据爬取常用库及方法

热门文章

  1. 如何给普通用户设置 sudo 权限
  2. 北斗分析 (众神之战--阿努比斯)
  3. 行走在台北·之五·淡水的黄昏(转载)
  4. 回顾2021,瞻望2022.
  5. linux输入法软件安装目录,Linux下的文件管理与汉语输入法的安装
  6. NYOJ 647 奋斗小蜗牛在请客【模拟】
  7. 如何去掉/消除网页复制粘贴后带到word或WPS文档中的浅灰色背景
  8. 中文信息处理实验7——基于Word2Vec的文本表示
  9. 【随心记】Boosting算法随想
  10. 我想要的框架-可能是痴人说梦