朴素贝叶斯案例流程

1、加载20类新闻数据,并进行分割

2、生成文章特征词

3、朴素贝叶斯estimator流程进行预估

代码

from sklearn.datasets import fetch_20newsgroups
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import MultinomialNBdef naviebayes():"""朴素贝叶斯进行文本分类:return: None"""news = fetch_20newsgroups(subset='all')# 进行数据分割x_train, x_test, y_train, y_test = train_test_split(news.data, news.target, test_size=0.25)# 对数据集进行特征抽取tf = TfidfVectorizer()# 以训练集当中的词的列表进行每篇文章重要性统计x_train = tf.fit_transform(x_train)print(tf.get_feature_names())x_test = tf.transform(x_test)# 进行朴素贝叶斯算法的预测mlt = MultinomialNB(alpha=1.0)print(x_train.toarray())mlt.fit(x_train, y_train)y_predict = mlt.predict(x_test)print("预测的文章类别为:", y_predict)# 得出准确率print("准确率为:", mlt.score(x_test, y_test))print("每个类别的精确率和召回率:", classification_report(y_test, y_predict, target_names=news.target_names))return Noneif __name__=="__main__":naviebayes()

P:

关于sklearn.datasets.fetch_20newsgroups的下载速度极慢的解决
https://segmentfault.com/a/1190000016498146?utm_source=tag-newest

python人工智能——机器学习——分类算法-朴素贝叶斯算法对新闻进行分类案例相关推荐

  1. Python scikit-learn,分类,朴素贝叶斯算法,文档分类,MultinomialNB,拉普拉斯平滑系数

    朴素贝叶斯预测分类的思想就是根据待预测文档的特征(TF-IDF高的词)分别计算属于各个类别的概率,其中概率最大的类别,就是预测的类别.(朴素的意思就是文档的特征(词)之间相互独立) 朴素贝叶斯进行文档 ...

  2. 机器学习朴素贝叶斯算法_机器学习中的朴素贝叶斯算法

    机器学习朴素贝叶斯算法 朴素贝叶斯算法 (Naive Bayes Algorithm) Naive Bayes is basically used for text learning. Using t ...

  3. 机器学习实验:朴素贝叶斯算法

    机器学习实验:朴素贝叶斯算法 问题如下: 根据给出的算法naivebayes.py,实现: 1.将数据集文件naivebayes_data.csv中的数据替换成14天打球与天气数据: 2.预测样本{O ...

  4. Python微调文本顺序对抗朴素贝叶斯算法垃圾邮件分类机制

    封面图片:<Python可以这样学>,ISBN:9787302456469,董付国,清华大学出版社 图书详情(京东): ================= 关于朴素贝叶斯算法中文垃圾邮件分 ...

  5. 机器学习-分类算法-朴素贝叶斯算法07

    概率:概率定义为一件事情发生的可能性 如:扔硬币某一面朝上有50%概率 "朴素"贝叶斯:所有特征之间条件独立 朴素贝叶斯-文档分类 from sklearn.datasets im ...

  6. 机器学习算法: 朴素贝叶斯算法

    朴素贝叶斯算法原理简述 理解朴素贝叶斯算法之前, 先应该理解什么是条件概率. 条件概率是指, 在事件A已经发生的情况下, 事件B发生的概率. 数学符号记作P(A|B). 机器学习就是利用这个原理, 对 ...

  7. 文本分类(朴素贝叶斯算法)

    一.贝叶斯定理引入 1.朴素贝叶斯:   朴素贝叶斯中的朴素一词的来源就是假设各特征之间相互独立.这一假设使得朴素贝叶斯算法变得简单,但有时会牺牲一定的分类准确率. 2.贝叶斯公式: 3.换成分类任务 ...

  8. python人工智能——机器学习——分类算法-朴素贝叶斯算法

    1.概率基础 2.朴素贝叶斯介绍 概率基础 概率定义为一件事情发生的可能性 联合概率和条件概率 朴素贝叶斯-贝叶斯公式 拉普拉斯平滑 如果词频列表里面有很多出现次数都为0,则会导致计算结果为0. sk ...

  9. 机器学习实战:朴素贝叶斯算法在新闻文本数据上的分类表现

    https://www.toutiao.com/a6647102437532369421/ 2019-01-17 08:01:00 大家好,今天跟大家学习一下通过sklearn的朴素贝叶斯模型实战.前 ...

最新文章

  1. .gitignore 无效及解决办法
  2. 使用wordpress 搭建 文档索引服务器
  3. 虚拟机无法远程连接的问题
  4. android程序root权限,android – 如何从源代码授予对特定应用程序的root访问权限而不是root权限?...
  5. 关于Socket通讯时通讯协议的制定
  6. 数学计算机学具制作,神奇的数学
  7. pcre-7.9编译安装出错[pcrecpp.lo] Error 1
  8. cmmi写文档工作教训
  9. 第012讲 盒子模型经典应用
  10. 无锁(Lock-Free)编程简介及漫谈
  11. win10操作系统上编译assimp库
  12. SSH攻击ip列表【不定时更新】
  13. 数学建模常用模型04 :灰色关联分析法
  14. 2-44钟静雯_day05
  15. 最短路——最短路计数(spfa)
  16. 判断一个多边形是凸多边形还是凹多边形
  17. vscode 一直显示Load project: XXXX,保存时提示“从 “‘Vetur‘, ‘Vue Language Features (Volar)‘“ (configure)中获取代码操作”
  18. 更改服务器网站默认端口,更改服务器默认端口号
  19. 【Java】Java获取昨天日期的正确姿势
  20. wayland与linux_Linux最让人叹息的地方

热门文章

  1. LeetCode Search in Rotated Sorted Array II -- 有重复的旋转序列搜索
  2. C#的类,构造函数以及Array阵列的数据填充与绑定
  3. [转]java构造方法的访问修饰符
  4. 2015 11月30日 一周工作计划与执行
  5. 向数据库中导入AWR数据
  6. 动态将表中的列名全部转换成小写
  7. c#对象集合去重_C# List 对象去重
  8. oracle / parallle /,Oracle海量数据迁移之使用shell启用多个动态并行
  9. Java黑皮书课后题第5章:**5.28(显示每月第一天是周几)编写程序,提示用户输入年份和代表概念第一天是周几的数字,然后在控制台显示该年各个月份的第一天是周几
  10. java 读取word书签_Java 添加、读取、删除Word书签