Educoder 机器学习第1关：基于贝叶斯决策理论的分类方法

第1关：基于贝叶斯决策理论的分类方法

任务描述

本关任务：理解朴素贝叶斯的分类思想，完成编程习题。

编程要求

根据提示，在右侧编辑器补充代码，运行程序。

测试说明

根据所学完成右侧编程题。

开始你的任务吧，祝你成功！

import numpy as np'''
Parameters:无
Returns:postingList - 实验样本切分的词条classVec - 类别标签向量
'''
# 函数说明:创建实验样本
def loadDataSet():postingList=[['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'],       #切分的词条['maybe', 'not', 'take', 'him', 'to', 'dog', 'park', 'stupid'],['my', 'dalmation', 'is', 'so', 'cute', 'I', 'love', 'him'],['stop', 'posting', 'stupid', 'worthless', 'garbage'],['mr', 'licks', 'ate', 'my', 'steak', 'how', 'to', 'stop', 'him'],['quit', 'buying', 'worthless', 'dog', 'food', 'stupid']]classVec = [0,1,0,1,0,1]#类别标签向量，1代表侮辱性词汇，0代表不是return postingList,classVec'''
Parameters:vocabList - createVocabList返回的列表inputSet - 切分的词条列表
Returns:returnVec - 文档向量,词集模型
'''
# 函数说明:根据vocabList词汇表，将inputSet向量化，向量的每个元素为1或0
def setOfWords2Vec(vocabList, inputSet):returnVec = [0] * len(vocabList)                               #创建一个其中所含元素都为0的向量for word in inputSet:                                          #遍历每个词条if word in vocabList:                                      #如果词条存在于词汇表中，则置1returnVec[vocabList.index(word)] = 1else: print("the word: %s is not in my Vocabulary!" % word)return returnVec                                               #返回文档向量'''
Parameters:dataSet - 整理的样本数据集
Returns:vocabSet - 返回不重复的词条列表，也就是词汇表
'''
# 函数说明:将切分的实验样本词条整理成不重复的词条列表，也就是词汇表
def createVocabList(dataSet):vocabSet = set([])                      #创建一个空的不重复列表for document in dataSet:vocabSet = vocabSet | set(document) #取并集return list(vocabSet)'''
Parameters:trainMatrix - 训练文档矩阵，即setOfWords2Vec返回的returnVec构成的矩阵trainCategory - 训练类别标签向量，即loadDataSet返回的classVec
Returns:p0Vect - 侮辱类的条件概率数组p1Vect - 非侮辱类的条件概率数组pAbusive - 文档属于侮辱类的概率
'''
# 函数说明:朴素贝叶斯分类器训练函数
def trainNB0(trainMatrix,trainCategory):numTrainDocs = len(trainMatrix)                     #计算训练的文档数目numWords = len(trainMatrix[0])                      #计算每篇文档的词条数pAbusive = sum(trainCategory)/float(numTrainDocs)   #文档属于侮辱类的概率p0Num = np.ones(numWords); p1Num = np.ones(numWords)#创建numpy.ones数组,词条出现数初始化为1，拉普拉斯平滑p0Denom = 2.0; p1Denom = 2.0                        #分母初始化为2,拉普拉斯平滑for i in range(numTrainDocs):##########if trainCategory[i]==1:p1Num+=trainMatrix[i]p1Denom+=sum(trainMatrix[i])else:p0Num+=trainMatrix[i]p0Denom+=sum(trainMatrix[i])##########p1Vect = np.log(p1Num/p1Denom)                      #取对数，防止下溢出p0Vect = np.log(p0Num/p0Denom)#返回属于侮辱类的条件概率数组，属于非侮辱类的条件概率数组，文档属于侮辱类的概率return p0Vect,p1Vect,pAbusiveif __name__ == '__main__':postingList, classVec = loadDataSet()myVocabList = createVocabList(postingList)print('myVocabList:\n', myVocabList)trainMat = []#for循环使用词向量来填充trainMat列表for postinDoc in postingList:trainMat.append(setOfWords2Vec(myVocabList, postinDoc))p0V, p1V, pAb = trainNB0(trainMat, classVec)print('p0V:\n', p0V)print('p1V:\n', p1V)print('classVec:\n', classVec)print('pAb:\n', pAb)

Educoder 机器学习第1关：基于贝叶斯决策理论的分类方法相关推荐

《模式识别原理及工程应用》——第2章基于贝叶斯决策理论的分类器 2.1 分类器的描述方法...
第2章基于贝叶斯决策理论的分类器 2.1 分类器的描述方法分类器是一种计算机程序,它的设计目标是在通过学习后,可自动将数据分到已知类别.分类器常应用在搜索引擎以及各种检索程序中,同时也大量应用于数 ...
基于稀疏表示的分类方法 Sparse Representation based Classification Method
文章来源 Jia K, Chan T H, Ma Y. Robust and practical face recognition via structured sparsity[J]. Comput ...
matlab的稀疏表示分类,基于稀疏表示的分类方法
四天数模,做得不好,但收获不小.最后还通宵一宿,多日后得以重获新生,特做个小记,聊记心得. 本次选题为神经元的分类和聚类,前者给定种类,需要通过训练样本找寻分类特征,再用测试样本测试分类方法的正确性. ...
[模式识别].(希腊)西奥多里蒂斯第四版笔记2之__基于贝叶斯决策理论的分类器
本章的主要工作在基于训练集的特征向量,估计概率密度函数. 1,贝叶斯决策理论条件概率公式.其中P(w)为先验概率,P(x|w)为类条件概率密度 2,基于正态分布的贝叶斯分类高斯分布和正态分布是最常 ...
基于贝叶斯决策理论的分类器
1.引言模式识别是根据对象特征值将其分类.d个特征组成特征向量x=[x1,···,xd]T,生成d维特征空间,在特征空间一个x称为一个模式样本. Bayes决策理论是用概率统计方法研究决策问题. ( ...
tensorflow实现基于LSTM的文本分类方法
http://blog.csdn.net/u010223750/article/details/53334313?locationNum=7&fps=1 引言学习一段时间的tensor fl ...
《机器学习实战》学习笔记（四）：基于概率论的分类方法 - 朴素贝叶斯
欢迎关注WX公众号:[程序员管小亮] [机器学习]<机器学习实战>读书笔记及代码总目录 https://blog.csdn.net/TeFuirnever/article/details ...
机器学习实战之基于概率论的分类方法：朴素贝叶斯
基于概率论的分类方法:朴素贝叶斯引入 1 基于贝叶斯决策理论的分类方法 1.1 条件概率 1.2 使用条件概率来分类 1.3 使用朴素贝叶斯进行文档分类 2 使用Python进行文本分类 2.1 准 ...
机器学习实战（四）——基于概率论的分类方法：朴素贝叶斯
朴素贝叶斯法 4.1 基于贝叶斯决策理论的分类方法 4.1.1 贝叶斯决策理论 4.1.2 条件概率 4.1.3 全概率公式 4.1.4 贝叶斯推断 4.1.5 朴素贝叶斯 4.2 使用朴素贝叶斯进行 ...

Educoder 机器学习第1关：基于贝叶斯决策理论的分类方法

第1关：基于贝叶斯决策理论的分类方法

任务描述

相关知识

编程要求

测试说明

Educoder 机器学习第1关：基于贝叶斯决策理论的分类方法相关推荐

最新文章

热门文章

Educoder 机器学习 第1关：基于贝叶斯决策理论的分类方法

第1关：基于贝叶斯决策理论的分类方法

任务描述

相关知识

编程要求

测试说明

Educoder 机器学习 第1关：基于贝叶斯决策理论的分类方法相关推荐

最新文章

热门文章

Educoder 机器学习第1关：基于贝叶斯决策理论的分类方法

Educoder 机器学习第1关：基于贝叶斯决策理论的分类方法相关推荐