贝叶斯法则可能是概率论中最有生命力的一个公式。它可以用来计算条件概率或者主观概率。

贝叶斯法则的思想非常简单:随机事件发生的概率随着相关条件的发生而改变,一个命题真假的信念即主观概率随着相关证据的发现而改变。当正相关条件发生时,条件概率上调,当负相关条件发生时,条件概率下调。当有利证据发现时,主观概率上调,当不利证据发现时,主观概率下调。

然而,贝叶斯法则具有非常深刻的哲学意义和广泛的应用价值。哲学家们用它来解决休谟归纳问题;生命科学家用它来研究基因是如何被控制的;教育学家突然意识到,学生的学习过程正是贝叶斯法则的运用;基金经理用贝叶斯法则找到投资策略;Google用贝叶斯法则改进搜索功能;人工智能,机器翻译中大量用到贝叶斯法则……

本文将通过公式推演和3个简单的范例,带领大家读懂贝叶斯法则并领略其独特的魅力。

一,条件概率和贝叶斯定理

条件概率P(A|B)表示随机事件B发生的前提下随机事件A发生的概率。条件概率P(A|B)也被称为后验概率,P(A)是其对应的先验概率。

以下为第1个应用举例:

HIV携带检测

假设艾滋病毒HIV在人群中的携带比率为0.01%,目前检测它的医学技术非常高超,如果一个人真的携带有HIV,那么血液检测有99.9%的概率为阳性,即检测出来的概率很高。如果一个人不携带有HIV,那么血液检测只有0.01%的概率为阳性,即冤枉一个正常人的概率很低。现在从街头上随机找个人给他做检查,发现检测结果不妙,是HIV阳性,那么他真的携带有HIV病毒的概率为多大?

从这个例子中,我们发现如果一个事件发生的先验概率很低,那么即使出现了非常有力的证据,这个事件发生的后验概率也不一定会很高。

二,朴素贝叶斯方法

在实际应用贝叶斯法则的时候,通常会存在许多的条件,而不是单个条件。此时为了简化问题,我们有时候会做一个非常天真的假设,即这些条件事件之间是相互独立的,这时候我们会得到朴素贝叶斯方法。

以下是第2个应用范例:

垃圾邮件识别

假设现在收到一封邮件,内容如下:

"东南亚7日游,只要6999。"

那么这封邮件是否是一封垃圾邮件呢?为了用算法对垃圾邮件进行分类,我们对100000封邮件进行了标注,其中正常邮件有80000封,垃圾邮件有20000封。我们把收到的这封邮件进行分词处理,得到"东南亚"、"7日游","只要","6999"这4个词。统计它们在已标注邮件中出现的次数如下。

现在利用朴素贝叶斯方法,我们可以计算这封邮件是否为垃圾邮件的概率了。

于是,这封邮件有0.96的概率是一封垃圾邮件。

三,贝叶斯排序模型

在对多条件下的后验概率进行展开时,除了运用朴素贝叶斯假设外,我们还可以使用另外一种迭代的方法。

当存在更多的条件时,可以继续按照这个模式展开。以上展开表达式和各个条件事件的迭代顺序无关。下面是一个简单的证明。

利用这种迭代展开式,我们可以构造一种贝叶斯排序模型,对诸多信息进行加工,生成主观概率。

以下为第3个应用范例:

贝叶斯排序模型

有两个同类别商品A和B,A有1个五星好评,B有5个五星好评和1个四星好评,那么你觉得这两个商品哪个更好一些呢?

有的同学会觉得商品A更好一些,因为A的平均星级就是5,而B的平均星级为4.83。

另外一些同学会觉得B更好一些,因为B有更多的五星好评,可靠性更大。

实际上我们在对商品的诸多评论信息加工出一个对商品的整体评价时,使用的就是贝叶斯公式。

在没有任何信息的前提下,我们假设一个商品为非常棒的商品的概率为0.5。

并且我们假设,一个非常棒的商品获得各个星级的评价的概率分别如下,即我们假设非常棒的商品倾向于获得较高的评级。

一个不是非常棒的商品获得各个星级的评价的概率分别如下,即我们假设不是非常棒的商品倾向于获得较低的评级。

迭代计算如下。

于是我们得出结论:B商品更好。

python贝叶斯算法的论文_3个范例带你读懂贝叶斯法则相关推荐

  1. 一文读懂贝叶斯原理(Bayes‘ theorem)

    一文读懂贝叶斯原理(Bayes' theorem) 前言:贝叶斯定理是18世纪英国数学家托马斯·贝叶斯(Thomas Bayes)提出得重要概率论理论.以下摘一段 wikipedia 上的简介: 一. ...

  2. python贝叶斯算法的论文_朴素贝叶斯算法从入门到Python实践

    1,前言 很久不发文章,整理些干货,希望相互学习吧.进入主题,本文主要时说的为朴素贝叶斯分类算法.与逻辑回归,决策树一样,是较为广泛使用的有监督分类算法,简单且易于理解(号称十大数据挖掘算法中最简单的 ...

  3. 朴素贝叶斯算法_机器学习第三篇:详解朴素贝叶斯算法

    一.统计知识 01|随机事件: 1.概念 随机事件是在随机试验中,可能出现也可能不出现,而在大量重复试验中具有某种规律性的事件叫做随机事件(简称事件).随机事件通常用大写英文字母A.B.C等表示.随机 ...

  4. ​独家 | 一文读懂贝叶斯优化

    作者:Apoorv Agnihotri,Nipun Batra 翻译:王雨桐 校对:张一然 本文约6200字,建议阅读10+分钟. 本文将贝叶斯优化拆解为易于理解的小部分. 许多现代的机器学习算法都涉 ...

  5. 独家 | 一文读懂贝叶斯网络

    作者:Devin Soni 翻译:车前子 校对:孙韬淳 本文约1400字,建议阅读8分钟. 本文从概率论出发,为你阐述贝叶斯网络. 贝叶斯网络是一种利用贝叶斯推断进行概率计算的概率图模型.贝叶斯网络的 ...

  6. 推荐 :一文读懂贝叶斯网络

    作者:Devin Soni  翻译:车前子   校对:孙韬淳 本文约1400字,建议阅读8分钟. 本文从概率论出发,为你阐述贝叶斯网络. 贝叶斯网络是一种利用贝叶斯推断进行概率计算的概率图模型.贝叶斯 ...

  7. 一篇文章带你读懂Python的魔法方法

    作者:Python进阶者 来源:Python爬虫与数据挖掘 今 日 鸡 汤 燕雀安知鸿鹄之志哉? /1 前言/ 魔法方法是python 里面非常重要的一个分支,平时我们写代码或多或少都会接触到他们,而 ...

  8. 一文带你读懂Python的5大特点与8大应用方向!

    关注头条号,私信回复资料会有意外惊喜呦------最后一张照片有资料. 2017年互联网领域薪资增幅最高的Top15职位中,新兴技术岗位普遍排在前列.而Python 作为当下人工智能.数据分析等领域的 ...

  9. 9个元素换6次达到排序序列_一文带你读懂排序算法(三):堆排序算法

    国庆节快乐~点击上方文字关注我们哦 堆是一种特殊的树形数据结构,其每一个结点都有一个值,通常提到的堆都是指一棵完全二叉树,根结点的值小于(或大于)两个子结点的值,同时,根结点的两个子树也分别是一个堆. ...

最新文章

  1. php删除空标签_PHP如何去除Html所有标签、空格以及空白
  2. 【OpenGL】十二、OpenGL 绘制线段 ( 绘制单条线段 | 绘制多条线段 | 依次连接的点组成的线 | 绘制圈 | 绘制彩色的线 )
  3. uva 1252——Twenty Questions
  4. 常用NTP网络时间服务器整理
  5. 发表email所需要
  6. Linux scp 两台服务器传输文件
  7. 量化投资与信用风险机器学习建模
  8. javascript代码_认识 JavaScript 可执行代码
  9. 歌曲影视随意赏计算机课件,世界影视音乐赏析课件.ppt
  10. error和exception区别,throw和throws
  11. c语言编程最大公约数教程说明,C语言:最大公约数。
  12. 用Python爬中国银行指定日期九点三十分汇率
  13. 【ThinkPad系统重装】
  14. 一起学Python吧~re正则+MySQL
  15. Unity 碰撞距离设定
  16. chrome 显示IP地址
  17. java项目统一打印入参出参等日志
  18. docker 应用系列(一)--- 一步步搭建虚拟机 docker 环境 附有 vue-cli + nginx 应用...
  19. 舌尖上的职场(二)一起去吃饭吧!(转)
  20. 学生出国参加会议(西班牙商务签流程)

热门文章

  1. STM32_iC-MHM磁编码器使用
  2. 汇佳学校|张思孝赵启阳:音乐制作歌曲演唱,伯克利音乐学院录取
  3. 第一届嵌入式电子竞赛方案设计——智能门禁系统
  4. 单位根检验urdf_R语言时间序列函数整理[转]]
  5. mysql随机生成中文姓名_mysql 随机生成姓名函数,及模拟大量测试数据
  6. 寺庙公众号开发:vue实现祈福牌位的前端部分
  7. ORACLE获取当天所在月份的所有日期和周几(每月类似台历显示)
  8. Clojure极简教程
  9. html折叠 手风琴效果,jQuery制作效果超棒的手风琴折叠菜单
  10. vmware workstation虚拟机安装Debian系统教程