继续将《机器学习实战》的内容带给大家,如果你已经是大牛,请将我的文章忽略,本人适合入门的人物,今天先把前边的数据建立和数据的预处理带给大家。好了先看第一段代码:

def loadDataSet():postingList=[['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'],['maybe', 'not', 'take', 'him', 'to', 'dog', 'park', 'stupid'],['my', 'dalmation', 'is', 'so', 'cute', 'I', 'love', 'him'],['stop', 'posting', 'stupid', 'worthless', 'garbage'],['mr', 'licks', 'ate', 'my', 'steak', 'how', 'to', 'stop', 'him'],['quit', 'buying', 'worthless', 'dog', 'food', 'stupid']]classVec = [0,1,0,1,0,1]    #1 is abusive, 0 notreturn postingList,classVec

这个函数是创建数据的代码,这里就不详细说明了,就是两个列表。

然后我们看一下将所有词汇去掉重复的统计出来:

def createVocabList(dataSet):vocabSet = set([])  #create empty setfor document in dataSet:vocabSet = vocabSet | set(document) #union of the two setsreturn list(vocabSet)

O(∩_∩)O~ 函数都非常简单,python用来求并集非常方便,O(∩_∩)O~,这个是非常好的一个例子,然后我们继续说明如何查询新来的文本和我们统计的文本进行对照进行统计是否出现该文本:

def setOfWords2Vec(vocabList, inputSet):returnVec = [0]*len(vocabList)for word in inputSet:if word in vocabList:returnVec[vocabList.index(word)] = 1else: print ("the word: %s is not in my Vocabulary!" % word)return returnVec

最后给大家来张截图(因为很多人常说无图无真相啊,为了保持我有图有真相的形象,果断来一张):

[置顶] 贝叶斯分类(一)相关推荐

  1. 【置顶】利用 NLP 技术做简单数据可视化分析教程(实战)

    置顶 本人决定将过去一段时间在公司以及日常生活中关于自然语言处理的相关技术积累,将在gitbook做一个简单分享,内容应该会很丰富,希望对你有所帮助,欢迎大家支持. 内容介绍如下 你是否曾经在租房时因 ...

  2. android列表实现置顶,Android利用RecyclerView实现全选、置顶和拖拽功能示例

    Android利用RecyclerView实现全选.置顶和拖拽功能示例 发布时间:2020-08-23 16:26:42 来源:脚本之家 阅读:159 作者:爱开发 前言 今天给大家分享是如何在Rec ...

  3. python tkinter窗口弹出置顶的方法

    加上下面两句即可实现root窗口的置顶显示,可以用于某些程序的消息提示,能够弹出到桌面显示 root = Tk() root.wm_attributes('-topmost',1) 转载于:https ...

  4. html简单响应式滚动条置顶

    简单响应式滚动条置顶 一般的,让页面出现滚动条的常见方法有: overflow:auto||overflow:scroll 或者overflow-x水平滚动条和overflow-y垂直滚动条 那么现在 ...

  5. [置顶] ros的navigation之———gmapping应用详解(in ros)

    gmapping是一个比较完善的地图构建开源包,使用激光和里程计的数据来生成二维地图.  博主最近也一直在使用gmapping,在前期着实被它卡了好久,因为好多东西不明白(原谅我是ros小白).  现 ...

  6. JavaScript中hoisting(悬置/置顶解析/预解析) 实例解释,全局对象,隐含的全局概念...

    JavaScript中hoisting(悬置/置顶解析/预解析) 实例解释,全局对象,隐含的全局概念 <html><body><script type="tex ...

  7. [Winform]检测exe是否已经运行,并将其置顶

    摘要 在很多pc应用中,基本上都需要有这样的判断,保证在一个终端只运行一个winform的client.并且如果最小化了,用户再次双击桌面图标的时候,将client置顶显示. 解决方案 需要使用win ...

  8. 博客文章的置顶功能『博客帮助』

    已经有不止一个博友不止一次地呼吁:我想要文章置顶功能!好,这不就来了嘛. 文章置顶有什么好处呢?可以将你有代表性的博文,或者你的最得意之作,或者你最想让你的读者第一眼看到的文章,推到你博客文章的顶部. ...

  9. setwindowpos怎么改变z序_置顶窗口SetWindowPos()的用法

    置顶窗口 SetWindowPos() 的用法 SetWindowPos () 函数功能:该函数改变一个子窗口,弹出式窗口式 顶层窗口的尺寸,位置和 Z 序.子窗口,弹出式窗口,及顶 层窗口根据它们在 ...

最新文章

  1. python2安装pyyaml_Python3安装Pyyaml
  2. c语言函数 t啥意思,C语言函数大全(t开头)
  3. ×××站点的路由(隧道、接口)模式和策略模式
  4. Python二级笔记(11)
  5. dubbo是如何“插入”到spring框架中的
  6. matlab求微分数值,用MATLAB语言求微积分方程的数值解.(xd^2y)/dx^2-5dy/dx+y=0y(0)=0y'(0)=0...
  7. Codeforces Round #172 (Div. 2) C. Rectangle Puzzle 数学题几何
  8. 平衡二叉树的插入与调整
  9. 数据结构题集(C语言版 清华大学出版社)
  10. python 会议室预约系统解决方案_会议室预约管理系统方案书.pdf
  11. 发射光功率和接收灵敏度对光模块的实际使用有什么影响?
  12. 第一次Java课小结
  13. 今日头条(layout下xml布局)
  14. 魔幻绘画风之不死魔女-张聪-专题视频课程
  15. 示波器表笔旁边的夹子是什么_示波器探头容易忽略的几个问题
  16. 在网上看看非诚勿扰,要不要报名
  17. 黑客内参小讲堂三步实现滚动条触动css动画效果
  18. redhat6.5进入救援
  19. 985湖南大学苏州高等研究院在苏州相城经开区正式揭牌成立
  20. DO、DTO、BO、AO、VO、POJO

热门文章

  1. 用Python提取解析pdf文档中内容
  2. LeetCode Bitwise AND of Numbers Range(位操作)
  3. LeetCode 601. Human Traffic of Stadium
  4. 题目梳理(一)(2019.07.06~2019.07.20)
  5. PHP之preg_replace()与ereg_replace()正则匹配比较讲解
  6. File类与FileInfo类的区别
  7. Ogre 学习笔记 (二) 环境:阴影 、雾效、灯光
  8. Java用数组的包文件_在Java中获取包内的类文件数组
  9. ad域控如何建立在云端_呼叫中心哪家好?选择云端呼叫中心还是本地化部署呼叫中心好?...
  10. JavaScript框架