撕开算法的神秘面纱

看了一大堆让人头疼的公式,真正想表达的思想,其实很简单。一切都在这个乾坤大挪移里面:

这个公式将后验概率以先验概率的形式表达,说一千道一万,做的事儿很简单,就是先假设数据X服从某种分布,但是参数未知。一般假设服从高斯分布,那么未知参数就是均值和标准差,这两个参数很容易获取,但是数据X是n维的向量,那朴素点对待吧,假想n维之间是相互独立的,皆大欢喜,每一维对应一组均值和标准差。

计算类概率P(Ci)就统计训练集中每一类的占比即可,或者干脆假设每一类出现的概率均等。

计算P(X|Ci)那就统计训练样本的每一类中X出现的频率,假如X维度很多,未出现的样本很多,那就朴素起来,认为每一维度的值相互独立,这个类条件概率就变成了每一维的类条件概率的连乘:

每一维的类条件概率就通过统计计算每一类数据的均值和标准差获得。

最后用这些每一维的类条件概率推理新数据的类后验概率,概率最大的那一类就是对应的类。

从统计学角度看多维数据,其实是忽略是各个维度之间的关联,不论是维度之间的幅值关系还是时空关系。存在的弊端,已经是解析解锁无法搞定的,既然无法完全掌控,不如退而求其次,逼近它。那么,这些弊端将发展方向都指向了像谜一样的  深度学习。

大白话说说 朴素贝叶斯相关推荐

  1. 【白话机器学习】算法理论+实战之朴素贝叶斯

    1. 写在前面 如果想从事数据挖掘或者机器学习的工作,掌握常用的机器学习算法是非常有必要的,常见的机器学习算法: 监督学习算法:逻辑回归,线性回归,决策树,朴素贝叶斯,K近邻,支持向量机,集成算法Ad ...

  2. 机器学习的练功方式(六)——朴素贝叶斯

    文章目录 致谢 6 朴素贝叶斯 6.1 概述 6.2 概率论 6.2.1 大数定律 6.2.2 基本概念 6.2.3 极大似然估计 6.2.4 多项式分布 6.2.4.1 伯努利分布 6.2.4.2 ...

  3. 白话 贝叶斯公式_【白话机器学习】算法理论+实战之朴素贝叶斯

    来自于: AI蜗牛车团队(作者:Miracle8070) 公众号: AI蜗牛车 原文链接:[白话机器学习]算法理论+实战之朴素贝叶斯​mp.weixin.qq.com 有兴趣的同学可以关注我的公众号: ...

  4. 朴素贝叶斯与逻辑回归区别

    朴素贝叶斯与逻辑回归有什么异同 1.上述链接大佬详细的介绍了朴素贝叶斯.逻辑回归的由来. 2.在B站李宏毅老师机器学习课中第4讲Classification中提到了从贝叶斯公式推导出逻辑函数的激活函数 ...

  5. 机器学习(8)朴素贝叶斯算法(20条新闻分类)

    目录 一.基础理论 二.实战:20条新闻分类 1.读取数据 2.训练集划分 3.特征工程(文本特征提取) 4.朴素贝叶斯算法训练 5.模型评估 方法一:预测值与真实值比对 方法二:计算准确率 总代码 ...

  6. 【机器学习入门】(3) 朴素贝叶斯算法:多项式、高斯、伯努利,实例应用(心脏病预测)附python完整代码及数据集

    各位同学好,今天我和大家分享一下朴素贝叶斯算法中的三大模型.在上一篇文章中,我介绍了朴素贝叶斯算法的原理,并利用多项式模型进行了文本分类预测. 朴素贝叶斯算法 -- 原理,多项式模型文档分类预测,附p ...

  7. 【机器学习入门】(2) 朴素贝叶斯算法:原理、实例应用(文档分类预测)附python完整代码及数据集

    各位同学好,今天我向大家介绍python机器学习中的朴素贝叶斯算法.内容有:算法的基本原理:案例实战--新闻文档的分类预测. 案例简介:新闻数据有20个主题,有10万多篇文章,每篇文章对应不同的主题, ...

  8. 朴素贝叶斯预测是否为垃圾短信

    朴素贝叶斯预测是否为垃圾短信 目的 数据集 源代码 结果 目的 1.利用朴素贝叶斯分类器判断短信(数据集已给)是否为垃圾短信: 2.可参考给定的文本分类代码:不可以直接调用sklearn的方法: 数据 ...

  9. 统计学习方法:朴素贝叶斯

    作者:桂. 时间:2017-04-20  18:31:37 链接:http://www.cnblogs.com/xingshansi/p/6740308.html 前言 本文为<统计学习方法&g ...

最新文章

  1. 2019.1.11英语笔记1
  2. 释疑の手工凭证界面不显示页数
  3. 更新npm至最新版本
  4. 在ThoughtWorks工作12年的技术主管,所总结的12条技术人经验
  5. [SpringBoot2]错误处理_默认规则
  6. python读取单元格部分内容_Python提取表格一定区域的内容
  7. UC浏览器APP如何卸载插件
  8. Merry Christmas!看甜点海报如何庆祝圣诞
  9. Python yield generator
  10. 91.接收用户请求包体的方式
  11. 图档生成bin文件_「嵌入式笔记」hex文件、bin文件、axf文件的区别?
  12. 全源最短路 Johnson算法
  13. 支付宝 支付返回 4000 ,系统繁忙请稍后再试
  14. 在eclipse中查看jar包
  15. TP5 PHPExcel导出类
  16. 【GIT】error: failed to push some refs to 'https://github.com/username/python.git'
  17. 以太坊源码学习(一) 正本清源
  18. php备忘录,备忘录模式及其php实现
  19. Leetcode-D21-动态规划(二刷)-55. 跳跃游戏45. 跳跃游戏 II
  20. 华北电力大学计算机科学,华北电力大学计算机科学与技术系介绍

热门文章

  1. html取元素的文本,解析HTML以获取元素内的文本
  2. python解析xml存入字典_如何将xml字符串转换为字典?
  3. OpenCV图像处理(13)——指定区域截取和指定区域复制
  4. oracle apex表隐藏,oracle-apex 处理表格形式
  5. 微信防撤回python代码_python实现微信防撤回神器
  6. linux显示 cron 服务是否正在运行_通过Linux系统自带日志监控系统安全
  7. android create命令,phonegap运行android – create命令失败,退出代码8 – linux
  8. linux dhcp 绑定mac地址,●DHCP协议的功能是 (58) 。在Linux中提供DHCP服务的程序是 (59) ;DHCP服务将主机的MAC地址和IP地 - 赏学吧...
  9. matlab对有周期性噪声的图像去噪,数字图像中去除周期性噪声研究.doc
  10. android布局参照示例_约束布局Android示例–第2部分