“人工智能源于数据科学,大数据成就了人工智能”-----郭毅可

数据对人工智能来说尤为关键,我国人工智能发展如此之迅速,其中就因为我国的人口基数大.但当某些数据缺失时,怎么解决呢?

举个最简单的例子,我有一张数据表有1000条数据,里面有性别,谈恋爱次数,恋爱次数与人品,恋人的颜值,第三者出现时的做法等,但是在第100-110行中有一个字段的数据丢失了,假如缺少的是性别.那么,我是不是可以通过完整的数据去判断那10行缺的数据呢?

刚好最近在学习<<概率论与数理统计及其应用第二版>>,其中就讲到了全概率公式以及贝叶斯公式,有了一定的理论基础后,我开始尝试制作用于预测性别的贝叶斯算法模型.

我们先来学习一下基本理论, <<概率论与数理统计及其应用第二版>>这本书里的概念不容易理解,我在网上找了一些比较好理解的解释,经过总结后,跟大家分享:

先验概率
事件发生前的预判概率。可以是基于历史数据的统计,可以由背景常识得出,也可以是人的主观观点给出。一般都是单独事件概率,如P(x),P(y)

条件概率公式
设A,B是两个事件,且P(B)>0,则在事件B发生的条件下,事件A发生的条件概率(conditional probability)为:P(A|B)=P(AB)/P(B)
P(A|B)是在B发生的情况下A发生的可能性

乘法公式
由条件概率公式得:P(AB)=P(A|B)P(B)=P(B|A)P(A)
对于任何正整数n≥2,当P(A1A2…An-1) > 0 时,有:
P(A1A2…An-1An)=P(A

基于贝叶斯定理的根据大学生恋爱心理数据预测性别的朴素贝叶斯模型(python+mysql)相关推荐

  1. ML之NB:基于news新闻文本数据集利用纯统计法、kNN、朴素贝叶斯(高斯/多元伯努利/多项式)、线性判别分析LDA、感知器等算法实现文本分类预测

    ML之NB:基于news新闻文本数据集利用纯统计法.kNN.朴素贝叶斯(高斯/多元伯努利/多项式).线性判别分析LDA.感知器等算法实现文本分类预测 目录 基于news新闻文本数据集利用纯统计法.kN ...

  2. python基于朴素贝叶斯模型的预测概率和标签信息可视化ROC曲线

    python基于朴素贝叶斯模型的预测概率和标签信息可视化ROC曲线 目录 python基于朴素贝叶斯模型的预测概率和标签信息可视化ROC曲线

  3. 基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_朴素贝叶斯(转载自Morgan)...

    什么是朴素贝叶斯 要搞懂朴素贝叶斯分类,首先需要了解什么是贝叶斯定理和特征条件独立假设,朴素贝叶斯算法就是基于这两个来实现的分类方法. 贝叶斯定理 贝叶斯定理通俗点讲就是求在事件 B 已经发生的前提下 ...

  4. 基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_第十章:利用Python实现朴素贝叶斯模型

    免责声明:本文是通过网络收集并结合自身学习等途径合法获取,仅作为学习交流使用,其版权归出版社或者原创作者所有,并不对涉及的版权问题负责.若原创作者或者出版社认为侵权,请联系及时联系,我将立即删除文章, ...

  5. 基于6种监督学习(逻辑回归+决策树+随机森林+SVM+朴素贝叶斯+神经网络)的毒蘑菇分类

    公众号:尤而小屋 作者:Peter 编辑:Peter 大家好,我是Peter~ 本文是kaggle案例分享的第3篇,赛题的名称是:Mushroom Classification,Safe to eat ...

  6. 基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_朴素贝叶斯为什么被称为“朴素”?...

    一.基本理解 1.朴素贝叶斯分类器: 例:如果有一种水果具有红.椭圆形.直径约3英寸等特征,则该水果可以被判定为是苹果. 尽管这些特征相互依赖或者有些特征由其他特征决定,然而朴素贝叶斯分类器认为这些属 ...

  7. r包调用legend函数_R语言实现基于朴素贝叶斯构造分类模型数据可视化

    本文内容原创,未经作者许可禁止转载! 目录 一.前言 二.摘要 三.关键词 四.算法原理 五.经典应用 六.R建模 1.载入相关包(内含彩蛋): 1.1 library包载入 1.2 pacman包载 ...

  8. 机器学习实战(四)——基于概率论的分类方法:朴素贝叶斯

    朴素贝叶斯法 4.1 基于贝叶斯决策理论的分类方法 4.1.1 贝叶斯决策理论 4.1.2 条件概率 4.1.3 全概率公式 4.1.4 贝叶斯推断 4.1.5 朴素贝叶斯 4.2 使用朴素贝叶斯进行 ...

  9. Java实现基于朴素贝叶斯的情感词分析

    朴素贝叶斯(Naive Bayesian)是一种基于贝叶斯定理和特征条件独立假设的分类方法,它是基于概率论的一种有监督学习方法,被广泛应用于自然语言处理,并在机器学习领域中占据了非常重要的地位.在之前 ...

最新文章

  1. 20165206 2017-2018-2 《Java程序设计》第三周学习总结
  2. 第十六届智能车竞赛广东线上比赛 - 哈尔滨工业大学(深圳)比赛筹备
  3. HTML5-响应式的实现方式-弹性布局浅谈
  4. win10系统中查找端口
  5. QRCode简介(收藏)
  6. html radio 作用域,ionic 表单输入 ion-checkbox ion-radio ion-toggle ion-spinner
  7. 编程的第一步都要使能时钟吗_在您的第一份编程工作中要做的11件事
  8. Xampp 配置出现403无法访问
  9. Codeforces Round #512 (Div. 2, based on Technocup 2019 Elimination Ro A. In Search of an Easy Proble
  10. python 使用ThreadPool 创建线程,后台执行并check
  11. python测试开发面试题带答案整理
  12. Excel 简单线性回归图表制作
  13. 关于APP界面布局设计的八种优缺点
  14. 液晶显示器偏光膜的基本原理
  15. $%7BpageContext.request.contextPath%7D
  16. 安全测试简述/安全审计工具
  17. 图像特征提取(纹理特征)
  18. 《小白兔到大黑牛》第十一篇yum命令的总结
  19. 《论股票市价规则缺陷》根治方法
  20. 七大产业向民间投资放开

热门文章

  1. 如何选择网站更新监控方式
  2. Android studio 打开项目丢失、文件打不开
  3. 基于Java解决容量设施选址问题
  4. C语言实现扫雷(具体步骤和代码)
  5. python wraps模块_python中 wraps 的作用
  6. 浅谈 PostgreSQL 的 timestamp 类型
  7. JMeter监控插件 的安装与使用
  8. Java 中for循环中break、continue的区别
  9. DBeaver,一款好用的通用数据库管理器
  10. MenuStrip控件