【数据分析】贝叶斯原理
文章来源:公众号-智能化IT系统。
贝叶斯的原理类似于概率反转,通过先验概率推导出后验概率。其公式如下:
在大数据分析中,该定理可以很好的做推导预测,很多电商以及用户取向可以参照此方式,从已有数据推导出未知数据,以归类做后续操作。
例如,在一个购房机构的网站,已有8个客户,信息如下:
用户ID | 年龄 | 性别 | 收入 | 婚姻状况 | 是否买房 |
1 | 27 | 男 | 15W | 否 | 否 |
2 | 47 | 女 | 30W | 是 | 是 |
3 | 32 | 男 | 12W | 否 | 否 |
4 | 24 | 男 | 45W | 否 | 是 |
5 | 45 | 男 | 30W | 是 | 否 |
6 | 56 | 男 | 32W | 是 | 是 |
7 | 31 | 男 | 15W | 否 | 否 |
8 | 23 | 女 | 30W | 是 | 否 |
这时来了一个新的客户,还没买房,其信息如下:
年龄 | 性别 | 收入 | 婚姻状况 |
34 | 女 | 31W | 否 |
那么怎么判断她是否会买呢,是否需要给她做买房推荐呢?
我们用贝叶斯理论来计算其概率。在上述已有的8个客户中,有四个维度,年龄,性别,收入,婚姻状况,这四个纬度构成衡量最终是否买房的标准。我们按照最终是否买房,把记录分为两个表:
买了房的(图表1):
用户ID | 年龄 | 性别 | 收入 | 婚姻状况 | 是否买房 |
2 | 47 | 女 | 30W | 是 | 是 |
4 | 24 | 男 | 45W | 否 | 是 |
6 | 56 | 男 | 32W | 是 | 是 |
没买房的(图表2):
用户ID | 年龄 | 性别 | 收入 | 婚姻状况 | 是否买房 |
1 | 27 | 男 | 15W | 否 | 否 |
3 | 32 | 男 | 12W | 否 | 否 |
5 | 45 | 男 | 30W | 是 | 否 |
7 | 31 | 男 | 15W | 否 | 否 |
8 | 23 | 女 | 30W | 是 | 否 |
买房的概率我们用P(a1)表示,为3/8,没买房的概率我们用P(a2)表示,为5/8。
我们依次从这四个纬度分析:
年龄:
这里我们按照年龄段,分为20-30,30-40,40+三个阶段。这个新客户的年龄在30-40。
P(b1|a1) --- 30-40买房的概率是1/3
P(b1|a2) --- 30-40没买房的概率是2/5
收入:
这里我们按照薪水,分为10-20,20-40,40+三个级别。这个新客户的收入在20-40。
P(b2|a1) --- 20-40买房的概率是2/3
P(b2|a2) --- 20-40没买房的概率是2/5
婚姻状况:
新客户是未婚
P(b3|a1) --- 未婚买房的概率是1/3
P(b3|a2) --- 未婚没买房的概率是3/5
性别:
新客户是女
P(b4|a1) --- 女性买房的概率是1/3
P(b4|a2) --- 女性没买房的概率是1/5
OK,现在开始做整合:
新用户买房的统计概率为P(b|a1)P(a1),其中P(b|a1)为P(b1|a1)P(b2|a1)P(b3|a1)P(b4|a1),那么为0.33*0.66*0.33*0.33*3/8 = 0.0089
新用户不会买房的统计概率为P(b|a2)P(a2),其中P(b|a2)为P(b1|a2)P(b2|a2)P(b3|a2)P(b4|a2),那么为0.4*0.4*0.6*0.2*5/8 = 0.012
由结果得知,该用户不会买房的概率大,所以可以将其分类至不会买房的类别。
公众号-智能化IT系统。每周都有技术文章推送,包括原创技术干货,以及技术工作的心得分享。扫描下方关注。
【数据分析】贝叶斯原理相关推荐
- multinormalNB多项式朴素贝叶斯原理及代码
https://blog.csdn.net/u011239443/article/details/76176743 multinormalNB多项式朴素贝叶斯原理及代码 https://www.cnb ...
- 统计学习方法|朴素贝叶斯原理剖析及实现
欢迎直接到我的博客查看最近文章:www.pkudodo.com.更新会比较快,评论回复我也能比较快看见,排版也会更好一点. 原始blog链接: http://www.pkudodo.com/2018/ ...
- [机器学习]朴素贝叶斯原理和基于Spark 实例
朴素贝叶斯分类 贝叶斯原理的由来:贝叶斯为了解决一个叫"逆向概率"问题写了一篇文章,尝试解答在缺乏太多可靠证据的情况下,怎样做出更符合数学逻辑的推测. 逆向概率:逆向概率是相对正向 ...
- 一文读懂贝叶斯原理(Bayes‘ theorem)
一文读懂贝叶斯原理(Bayes' theorem) 前言:贝叶斯定理是18世纪英国数学家托马斯·贝叶斯(Thomas Bayes)提出得重要概率论理论.以下摘一段 wikipedia 上的简介: 一. ...
- 通俗简单讲解贝叶斯原理,并python实现贝叶斯分类代码
1. 前言 贝叶斯原理相信大家都非常熟悉了,但是一般情况下,我们的数学水平不怎么地,学生的数学基础也不怎么地,所以要想给学生简单明了的讲明白,还不是一件容易的事情. 为此,在备课(为河南中医药大学py ...
- 利用朴素贝叶斯原理过滤垃圾邮件(TF-IDF算法)
本人是新手,为了还原该过程用了自己的方法,可能时间复杂度较高,并且在训练数据时也没有用到SKlearn模块中的贝叶斯分类器,是为了尝试自己去还原求后验条件概率这个过程. 目录 一.简述朴素贝叶斯原理 ...
- 统计学习方法笔记(三)-朴素贝叶斯原理及python实现
朴素贝叶斯 条件概率 特征条件独立假设 朴素贝叶分类器 朴素贝叶斯分类算法原理 学习与分类算法 朴素贝叶斯算法原理 模型 多项式模型 高斯模型 伯努利模型 多项式模型的朴素贝叶斯分类器实现代码 高斯模 ...
- sklearn朴素贝叶斯分类器_朴素贝叶斯原理
贝叶斯分类算法是统计学是一种概率分类方法,朴素贝叶斯分类时贝叶斯分类中最简单的一种.利用贝叶斯公式根据某特征的先验概率计算出其后延概率,然后选择具有最大后延概率的类作为该特征所属的类.朴素贝叶斯,称之 ...
- 朴素贝叶斯原理及实现
一.理论基础 (一)朴素贝叶斯定理 简单的说:一个样本属于某个类别的概率是:这个类别出现的概率 * 已知这个类别出现的情况下各个属性出现的概率的乘积 根据贝叶斯定理,事件X发生时,类别Ci发生的后验概 ...
最新文章
- Go 学习笔记(20)— Go 操作 json 文件(编码生成 json、解码 json 为 map、解码 json 为 struct)
- windows程序移植linux
- xshell如何登陆堡垒机_Xshell连接有跳板机(堡垒机)的服务器
- 第十六届智能车竞赛赛前补充比赛信息
- mfc倾斜文本输入_文本检测知识梳理(持续更新)
- basler相机 ip linux,Basler 相机启动运行程序, Basler IP相机软件 - 其他软件 | Basler
- python现在版本强势英雄_当前版本有哪些强势英雄?
- JavaWeb程序设计任务教程(黑马程序员 传智播客)测一测 编写一个Servlet,实现统计网站被访问次数的功能
- 基于数据库的事务消息解决分布式事务方案
- MySQL 服务无法启动--服务没有报告任何错误 ---Failed to find valid data directory.
- 华为防火墙查看日志命令_华为防火墙异常日志,请高手进来查看,跪谢
- mysql输入密码就闪退_MySQL在我的服务列表里凭空消失~
- 【mybatis】学习笔记之conf.xml与mapper.xml配置
- python-gui-pyqt5的使用方法-7--partial 传递参数的方法:
- 手动注册native方法
- G480改装固态硬盘、光驱变机械硬盘以及装系统(下)
- 业务持续计划(BCP,Business Continuity Plan)
- React中过渡动画的编写方式
- tomcat问题——判断tomcat是否安装成功
- PCL:交互点选点云
热门文章
- JAVA 中IO总结 之前篇阻塞、非阻塞
- SpringBoot有关数组对象转JSON
- CDR2022首发全新版本性能介绍
- 如何搭建一个超级好用的JavaWeb框架?
- 金融业务知识(2):股票交易的基本流程
- PPT之幻灯片中的大纲选项卡
- matlab-粒子群源码优化模糊隶属度函数值
- 捷联惯导基础知识解析之四(粗/精对准和GPS/IMU和GPS/里程计组合导航)
- 浏览器使用默认端口9006连接TinyWebServer服务器连接不上?
- boost::python::vector_indexing_suite相关的测试程序