文章来源:公众号-智能化IT系统。

贝叶斯的原理类似于概率反转,通过先验概率推导出后验概率。其公式如下:

在大数据分析中,该定理可以很好的做推导预测,很多电商以及用户取向可以参照此方式,从已有数据推导出未知数据,以归类做后续操作。

例如,在一个购房机构的网站,已有8个客户,信息如下:

用户ID 年龄 性别 收入 婚姻状况 是否买房
1 27 15W
2 47 30W
3 32 12W
4 24 45W
5 45 30W
6 56 32W
7 31 15W
8 23 30W

这时来了一个新的客户,还没买房,其信息如下:

年龄 性别 收入 婚姻状况
34 31W

那么怎么判断她是否会买呢,是否需要给她做买房推荐呢?

我们用贝叶斯理论来计算其概率。在上述已有的8个客户中,有四个维度,年龄,性别,收入,婚姻状况,这四个纬度构成衡量最终是否买房的标准。我们按照最终是否买房,把记录分为两个表:

买了房的(图表1):

用户ID 年龄 性别 收入 婚姻状况 是否买房
2 47 30W
4 24 45W
6 56 32W

没买房的(图表2):

用户ID 年龄 性别 收入 婚姻状况 是否买房
1 27 15W
3 32 12W
5 45 30W
7 31 15W
8 23 30W

买房的概率我们用P(a1)表示,为3/8,没买房的概率我们用P(a2)表示,为5/8。

我们依次从这四个纬度分析:

年龄:

这里我们按照年龄段,分为20-30,30-40,40+三个阶段。这个新客户的年龄在30-40。

P(b1|a1) --- 30-40买房的概率是1/3

P(b1|a2) --- 30-40没买房的概率是2/5

收入:

这里我们按照薪水,分为10-20,20-40,40+三个级别。这个新客户的收入在20-40。

P(b2|a1) --- 20-40买房的概率是2/3

P(b2|a2) --- 20-40没买房的概率是2/5

婚姻状况:

新客户是未婚

P(b3|a1) --- 未婚买房的概率是1/3
P(b3|a2) --- 未婚没买房的概率是3/5

性别:

新客户是女

P(b4|a1) --- 女性买房的概率是1/3
P(b4|a2) --- 女性没买房的概率是1/5

OK,现在开始做整合:

新用户买房的统计概率为P(b|a1)P(a1),其中P(b|a1)为P(b1|a1)P(b2|a1)P(b3|a1)P(b4|a1),那么为0.33*0.66*0.33*0.33*3/8 = 0.0089

新用户不会买房的统计概率为P(b|a2)P(a2),其中P(b|a2)为P(b1|a2)P(b2|a2)P(b3|a2)P(b4|a2),那么为0.4*0.4*0.6*0.2*5/8 = 0.012

由结果得知,该用户不会买房的概率大,所以可以将其分类至不会买房的类别。


公众号-智能化IT系统。每周都有技术文章推送,包括原创技术干货,以及技术工作的心得分享。扫描下方关注。

【数据分析】贝叶斯原理相关推荐

  1. multinormalNB多项式朴素贝叶斯原理及代码

    https://blog.csdn.net/u011239443/article/details/76176743 multinormalNB多项式朴素贝叶斯原理及代码 https://www.cnb ...

  2. 统计学习方法|朴素贝叶斯原理剖析及实现

    欢迎直接到我的博客查看最近文章:www.pkudodo.com.更新会比较快,评论回复我也能比较快看见,排版也会更好一点. 原始blog链接: http://www.pkudodo.com/2018/ ...

  3. [机器学习]朴素贝叶斯原理和基于Spark 实例

    朴素贝叶斯分类 贝叶斯原理的由来:贝叶斯为了解决一个叫"逆向概率"问题写了一篇文章,尝试解答在缺乏太多可靠证据的情况下,怎样做出更符合数学逻辑的推测. 逆向概率:逆向概率是相对正向 ...

  4. 一文读懂贝叶斯原理(Bayes‘ theorem)

    一文读懂贝叶斯原理(Bayes' theorem) 前言:贝叶斯定理是18世纪英国数学家托马斯·贝叶斯(Thomas Bayes)提出得重要概率论理论.以下摘一段 wikipedia 上的简介: 一. ...

  5. 通俗简单讲解贝叶斯原理,并python实现贝叶斯分类代码

    1. 前言 贝叶斯原理相信大家都非常熟悉了,但是一般情况下,我们的数学水平不怎么地,学生的数学基础也不怎么地,所以要想给学生简单明了的讲明白,还不是一件容易的事情. 为此,在备课(为河南中医药大学py ...

  6. 利用朴素贝叶斯原理过滤垃圾邮件(TF-IDF算法)

    本人是新手,为了还原该过程用了自己的方法,可能时间复杂度较高,并且在训练数据时也没有用到SKlearn模块中的贝叶斯分类器,是为了尝试自己去还原求后验条件概率这个过程. 目录 一.简述朴素贝叶斯原理 ...

  7. 统计学习方法笔记(三)-朴素贝叶斯原理及python实现

    朴素贝叶斯 条件概率 特征条件独立假设 朴素贝叶分类器 朴素贝叶斯分类算法原理 学习与分类算法 朴素贝叶斯算法原理 模型 多项式模型 高斯模型 伯努利模型 多项式模型的朴素贝叶斯分类器实现代码 高斯模 ...

  8. sklearn朴素贝叶斯分类器_朴素贝叶斯原理

    贝叶斯分类算法是统计学是一种概率分类方法,朴素贝叶斯分类时贝叶斯分类中最简单的一种.利用贝叶斯公式根据某特征的先验概率计算出其后延概率,然后选择具有最大后延概率的类作为该特征所属的类.朴素贝叶斯,称之 ...

  9. 朴素贝叶斯原理及实现

    一.理论基础 (一)朴素贝叶斯定理 简单的说:一个样本属于某个类别的概率是:这个类别出现的概率 * 已知这个类别出现的情况下各个属性出现的概率的乘积 根据贝叶斯定理,事件X发生时,类别Ci发生的后验概 ...

最新文章

  1. Go 学习笔记(20)— Go 操作 json 文件(编码生成 json、解码 json 为 map、解码 json 为 struct)
  2. windows程序移植linux
  3. xshell如何登陆堡垒机_Xshell连接有跳板机(堡垒机)的服务器
  4. 第十六届智能车竞赛赛前补充比赛信息
  5. mfc倾斜文本输入_文本检测知识梳理(持续更新)
  6. basler相机 ip linux,Basler 相机启动运行程序, Basler IP相机软件 - 其他软件 | Basler
  7. python现在版本强势英雄_当前版本有哪些强势英雄?
  8. JavaWeb程序设计任务教程(黑马程序员 传智播客)测一测 编写一个Servlet,实现统计网站被访问次数的功能
  9. 基于数据库的事务消息解决分布式事务方案
  10. MySQL 服务无法启动--服务没有报告任何错误 ---Failed to find valid data directory.
  11. 华为防火墙查看日志命令_华为防火墙异常日志,请高手进来查看,跪谢
  12. mysql输入密码就闪退_MySQL在我的服务列表里凭空消失~
  13. 【mybatis】学习笔记之conf.xml与mapper.xml配置
  14. python-gui-pyqt5的使用方法-7--partial 传递参数的方法:
  15. 手动注册native方法
  16. G480改装固态硬盘、光驱变机械硬盘以及装系统(下)
  17. 业务持续计划(BCP,Business Continuity Plan)
  18. React中过渡动画的编写方式
  19. tomcat问题——判断tomcat是否安装成功
  20. PCL:交互点选点云

热门文章

  1. JAVA 中IO总结 之前篇阻塞、非阻塞
  2. SpringBoot有关数组对象转JSON
  3. CDR2022首发全新版本性能介绍
  4. 如何搭建一个超级好用的JavaWeb框架?
  5. 金融业务知识(2):股票交易的基本流程
  6. PPT之幻灯片中的大纲选项卡
  7. matlab-粒子群源码优化模糊隶属度函数值
  8. 捷联惯导基础知识解析之四(粗/精对准和GPS/IMU和GPS/里程计组合导航)
  9. 浏览器使用默认端口9006连接TinyWebServer服务器连接不上?
  10. boost::python::vector_indexing_suite相关的测试程序