python分类器knn、svm_[转载]MatLab分类器大全(svm,knn,随机森林等)

train_data是训练特征数据, train_label是分类标签。

Predict_label是预测的标签。

MatLab训练数据, 得到语义标签向量 Scores(概率输出)。

1.逻辑回归(多项式MultiNomial logistic Regression)

Factor = mnrfit(train_data, train_label);

Scores = mnrval(Factor, test_data);

scores是语义向量(概率输出)。对高维特征，吃不消。

2.随机森林分类器(Random Forest)

Factor = TreeBagger(nTree, train_data,

train_label);

[Predict_label,Scores] = predict(Factor,

test_data);

scores是语义向量(概率输出)。实验中nTree = 500。

效果好，但是有点慢。2500行数据，耗时400秒。500万行大数据分析，会咋样？准备好一篇小说慢慢阅读吧^_^

3.朴素贝叶斯分类(Naive Bayes)

Factor = NaiveBayes.fit(train_data, train_label);

Scores = posterior(Factor, test_data);

[Scores,Predict_label] = posterior(Factor,

test_data);

Predict_label = predict(Factor, test_data);

accuracy = length(find(predict_label ==

test_label))/length(test_label)*100;

效果不佳。

4. 支持向量机SVM分类

Factor = svmtrain(train_data, train_label);

predict_label = svmclassify(Factor, test_data);

不能有语义向量 Scores(概率输出)

支持向量机SVM(Libsvm)

Factor = svmtrain(train_label, train_data, '-b

1');

[predicted_label, accuracy, Scores] = svmpredict(test_label,

test_data, Factor, '-b 1');

5.K近邻分类器 (KNN)

predict_label = knnclassify(test_data, train_data,train_label,

num_neighbors);

accuracy = length(find(predict_label ==

test_label))/length(test_label)*100;

不能有语义向量 Scores(概率输出)

IDX = knnsearch(train_data, test_data);

IDX = knnsearch(train_data, test_data, 'K',

num_neighbors);

[IDX, Dist] = knnsearch(train_data, test_data, 'K',

num_neighbors);

IDX是近邻样本的下标集合，Dist是距离集合。

自己编写, 实现概率输出 Scores(概率输出)

Matlab 2012新版本:

Factor = ClassificationKNN.fit(train_data, train_label,

'NumNeighbors', num_neighbors);

predict_label = predict(Factor, test_data);

[predict_label, Scores] = predict(Factor,

test_data);

6.集成学习器(Ensembles for Boosting, Bagging, or Random

Subspace)

Matlab 2012新版本:

Factor = fitensemble(train_data, train_label, 'AdaBoostM2', 100,

'tree');

Factor = fitensemble(train_data, train_label, 'AdaBoostM2', 100,

'tree', 'type', 'classification');

Factor = fitensemble(train_data, train_label, 'Subspace', 50,

'KNN');

predict_label = predict(Factor, test_data);

[predict_label, Scores] = predict(Factor,

test_data);

效果比预期差了很多。不佳。

7. 判别分析分类器(discriminant analysis classifier)

Factor = ClassificationDiscriminant.fit(train_data,

train_label);

Factor = ClassificationDiscriminant.fit(train_data, train_label,

'discrimType', '判别类型:伪线性...');

predict_label = predict(Factor, test_data);

[predict_label,

Scores] = predict(Factor, test_data);

转载自：http://blog.csdn.net/xuhaijiao99/article/details/15027093

python分类器knn、svm_[转载]MatLab分类器大全(svm,knn,随机森林等)相关推荐

paper 130：MatLab分类器大全(svm,knn,随机森林等)
train_data是训练特征数据, train_label是分类标签. Predict_label是预测的标签. MatLab训练数据, 得到语义标签向量 Scores(概率输出). 1.逻辑回归( ...
MatLab2012b/MatLab2013b分类器大全(svm,knn,随机森林等)
train_data是训练特征数据, train_label是分类标签. Predict_label是预测的标签. MatLab训练数据, 得到语义标签向量 Scores(概率输出). 1.逻辑回归( ...
(转载)机器学习知识点(十七)Bagging与随机森林算法原理小结
集成学习有两个流派,一个是boosting派系,它的特点是各个弱学习器之间有依赖关系.另一种是bagging流派,它的特点是各个弱学习器之间没有依赖关系,可以并行拟合.本文就对集成学习中Bagging ...
02-分类算法：knn、朴素贝叶斯、决策树和随机森林
目录 sklearn数据集一.数据集划分二. 数据集获取三.sklearn机器学习算法的实现-估计器分类算法-k近邻算法(KNN) 一.定义: 二.公式: 三.语法: 四.模型调优方法: 1. ...
Python数据分析与机器学习实战＜八＞决策树、随机森林
目录决策树原理概述树模型决策树树的组成决策树的训练和测试选择节点(即如何进行特征划分?) 衡量标准---熵公式: Pi为取到某个类别的概率熵的图像如何决策一个节点的选择? 决策树构 ...
python随机森林筛选变量_用随机森林分类器和GBDT进行特征筛选
一.决策树(类型.节点特征选择的算法原理.优缺点.随机森林算法产生的背景) 1.分类树和回归树由目标变量是离散的还是连续的来决定的:目标变量是离散的,选择分类树:反之(目标变量是连续的,但自变量可以 ...
随机森林分类器_建立您的第一个随机森林分类器
随机森林分类器 In this post, I will guide you through building a simple classifier using Random Forest from ...
Python信贷风控模型：Adaboost,XGBoost,SGD, SVC,随机森林, KNN预测信贷违约支付
全文链接:http://tecdat.cn/?p=26184 在此数据集中,我们必须预测信贷的违约支付,并找出哪些变量是违约支付的最强预测因子?以及不同人口统计学变量的类别,拖欠还款的概率如何变化?( ...
用随机森林分类器和GBDT进行特征筛选
一.决策树(类型.节点特征选择的算法原理.优缺点.随机森林算法产生的背景) 1.分类树和回归树由目标变量是离散的还是连续的来决定的:目标变量是离散的,选择分类树:反之(目标变量是连续的,但自变量可以 ...

python分类器knn、svm_[转载]MatLab分类器大全(svm,knn,随机森林等)

python分类器knn、svm_[转载]MatLab分类器大全(svm,knn,随机森林等)相关推荐

最新文章

热门文章