机器学习算法与自然语言处理推荐 

来源:http://www.cnblogs.com/pinard/p/6069267.html

作者:刘建平Pinard

【机器学习算法与自然语言处理导读】朴素贝叶斯算法是最经典的几个机器学习算法之一,本文对它的优点,缺点进行总结。

1.  朴素贝叶斯算法

朴素贝叶斯属于生成式模型(关于生成模型和判别式模型,主要还是在于是否需要求联合分布),比较简单,你只需做一堆计数即可。如果注有条件独立性假设(一个比较严格的条件),朴素贝叶斯分类器的收敛速度将快于判别模型,比如逻辑回归,所以你只需要较少的训练数据即可。即使NB条件独立假设不成立,NB分类器在实践中仍然表现的很出色。它的主要缺点是它不能学习特征间的相互作用,用mRMR中R来讲,就是特征冗余。引用一个比较经典的例子,比如,虽然你喜欢Brad Pitt和Tom Cruise的电影,但是它不能学习出你不喜欢他们在一起演的电影。

2.  优点

1. 朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率;

2. 对大数量训练和查询时具有较高的速度。即使使用超大规模的训练集,针对每个项目通常也只会有相对较少的特征数,并且对项目的训练和分类也仅仅是特征概率的数学运算而已;

3. 对小规模的数据表现很好,能个处理多分类任务,适合增量式训练(即可以实时的对新增的样本进行训练);

4. 对缺失数据不太敏感,算法也比较简单,常用于文本分类;

5. 朴素贝叶斯对结果解释容易理解。

3.  缺点

1. 需要计算先验概率;

2. 分类决策存在错误率;

3. 对输入数据的表达形式很敏感;

4. 由于使用了样本属性独立性的假设,所以如果样本属性有关联时其效果不好。

4.  应用领域

1. 欺诈检测中使用较多;

2. 一封电子邮件是否是垃圾邮件;

3. 一篇文章应该分到科技、政治,还是体育类;

4. 一段文字表达的是积极的情绪还是消极的情绪;

5. 人脸识别。

推荐阅读:

华为调研82位离职博士!任正非发电邮:反思人才流失根源

漫话:如何给女朋友解释为什么双11无法修改收货地址

2019 AI 国际顶级学术会议全在这里,请查收!

算法的优缺点_朴素贝叶斯算法的优缺点相关推荐

  1. python贝叶斯算法的论文_朴素贝叶斯算法从入门到Python实践

    1,前言 很久不发文章,整理些干货,希望相互学习吧.进入主题,本文主要时说的为朴素贝叶斯分类算法.与逻辑回归,决策树一样,是较为广泛使用的有监督分类算法,简单且易于理解(号称十大数据挖掘算法中最简单的 ...

  2. 用python实现朴素贝叶斯算法_朴素贝叶斯算法 python 实现

    应用贝叶斯准则: 使用上面这些定义,可以定义贝叶斯分类准则为: 如果 P(c1|x, y) > P(c2|x, y), 那么属于类别 c1; 如果 P(c2|x, y) > P(c1|x, ...

  3. 朴素贝叶斯算法_朴素贝叶斯算法原理

    摘要:本文介绍了贝叶斯公式,并根据公式而产生的朴素贝叶斯分类算法在机器学习中的应用,并列举了朴素贝叶斯分类算法的优缺点. 1贝叶斯公式的理解 贝叶斯定理(Bayes' theorem)是概率论中的一个 ...

  4. java mllib 算法_朴素贝叶斯算法原理及Spark MLlib实例(Scala/Java/Python)

    朴素贝叶斯 算法介绍: 朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法. 朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,在没有其它可用信息下,我 ...

  5. 机器学习算法(7)—— 朴素贝叶斯算法

    朴素贝叶斯算法 1 朴素贝叶斯介绍 2 贝叶斯公式 3 拉普拉斯平滑系数 4 朴素贝叶斯api使用 5 朴素贝叶斯算法总结 5.1 朴素贝叶斯优缺点 5.2 朴素贝叶斯疑难点 5.3 与逻辑回归的区别 ...

  6. python实现排列组合公式算法_朴素贝叶斯算法的Python实现

    朴素贝叶斯分类算法被广泛应用于文本分类场景中.包含垃圾邮件.互联网新闻等分类任务,属于有监督学习算法.它独立考量每一维度特征被分类的条件概率,然后综合这些概率对其所在的特征向量做出分类预测,即&quo ...

  7. python推荐系统算法朴素贝叶斯_朴素贝叶斯算法在人才盘点中的应用(之一)

    一.识别人才首先是处理不确定性问题 做招聘面试的HR应该会认同这样的经历. 打开应聘者简历,赫然写着TOP10名学毕业.抬头一瞧,小伙长得一表人才,精神抖擞,朝气蓬勃.HR兴趣大增. 再一看,研究方向 ...

  8. 分类算法(2) ---- 朴素贝叶斯算法(NB)

    朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法. 朴素贝叶斯分类器假设样本每个特征与其他特征都不相关. 一. 基于离散变量 下面以一个简单的数据集为例,阐述基于NB的回归/预测模型: 上述三 ...

  9. 朴素贝叶斯算法python sklearn实现_朴素贝叶斯算法优化与 sklearn 实现

    进行拉普拉斯平滑运算后,我们运行程序,仍然得出了两个测试样本均属于非侮辱类的结果,这是为什么呢? 我们查看最终计算出的 p0 和 p1 会发现,他们的结果都是 0,这又是为什么呢? 这是因为出现了另一 ...

最新文章

  1. 6D位姿估计Point Pair Feature (PPF)算法详解
  2. 光端机和收发器的区别有哪些?
  3. python configparser 注释_使用configpar添加注释
  4. Pandas Apply函数
  5. 输入框中光标过长原因
  6. 李开复:一切靠命运或靠自己都是不合适的
  7. 展讯SC9820E驱动配置之LCD配置
  8. 一文搞懂激活函数(Sigmoid/ReLU/LeakyReLU/PReLU/ELU)
  9. Java内存马-Instrument
  10. 在ubuntu20.04中安装MATLAB时常见问题及解决方法
  11. GD32IAP升级(BootLoader)
  12. Excel根据单元格内容分类并插入空行的方法
  13. 游戏手柄按键遥杆值检测
  14. css里面的网格布局
  15. MySQL中建表时 pk、nn、qu、b、un、zf、ai、g代表的意思
  16. Python中如何保留n位有效数字
  17. “面子”真的那么重要吗?——2017过年返乡见闻与思考
  18. 【ARM】led·fs2410流水灯
  19. 前端判断文件后缀名_JS 获取文件后缀,判断文件类型(比如是否为图片格式)
  20. 爬虫(二):新浪财经爬虫(获取文本信息)

热门文章

  1. 421. 数组中两个数的最大异或值
  2. 679. 24 点游戏
  3. python 面向对象_Python 和 Java 基础对比 08 —— 面向对象
  4. mysql时间 gt_关于Mysql 5.6 TIMESTAMPDIFFgt;=和gt;的一个问题 - SegmentFault 思否
  5. mysql 一个文章多个分类_jdbc mysql 插入一篇文章并与多个标签,一个分类建立关联关系。...
  6. 为什么用jdbc插入数据为空_为什么气象数据推荐用 ModelWhale 处理
  7. android系统一直显示通知栏_Android8以上 显示通知栏简单实现
  8. k近邻算法matlab实现_k近邻算法
  9. Ubuntu上安装GCC编译器
  10. 防伪拉线 CCD 纠偏控制器