libsvm多分类python_LIBSVM (三) 葡萄酒种类识别
3.1 原始数据分析
1)测试数据为:wine data set,储存在chapter_WineClass.mat。classnumer = 3;wine,记录了178个样本的13个属性;wine_labels.178×1,记录了178个样本的各自类别标签。
2)数据的可视化:13个指标的属性值即数据的箱式图;数据的分维可视化图。
% 画出测试数据的分维可视化图
figure
subplot(3,5,1);
hold on
for run = 1:178
plot(run,wine_labels(run),'*');
end
xlabel('样本','FontSize',10);
ylabel('类别标签','FontSize',10);
title('class','FontSize',10);
for run = 2:14
subplot(3,5,run);
hold on;
str = ['attrib ',num2str(run-1)];
for i = 1:178
plot(i,wine(i,run-1),'*');
end
xlabel('样本','FontSize',10);
ylabel('属性值','FontSize',10);
title(str,'FontSize',10);
end
3.2 模型建立及其实现
3.2.1 模型建立
首先从原始数据中把训练集和测试集提取出来,然后进行预处理,之后用训练集对SVM进行训练,最后用得到的模型来预测测试集的分类标签,算法流程如图:
选定训练集和测试集 → 数据预处理 → 训练SVM → 分类准确率 → 预测(测试集)
3.2.2 MATLAB 实现
1) 选定测试集和训练集
该数据一共有三类,现将每个类别分为两组,重新组合数据,一部分为训练集(train_wine),一部分为测试集(test_wine)。
% 选定训练集和测试集
% 将第一类的1-30,第二类的60-95,第三类的131-153做为训练集
train_wine = [wine(1:30,:);wine(60:95,:);wine(131:153,:)];
% 相应的训练集的标签也要分离出来
train_wine_labels = [wine_labels(1:30);wine_labels(60:95);wine_labels(131:153)];
% 将第一类的31-59,第二类的96-130,第三类的154-178做为测试集
test_wine = [wine(31:59,:);wine(96:130,:);wine(154:178,:)];
% 相应的测试集的标签也要分离出来
test_wine_labels = [wine_labels(31:59);wine_labels(96:130);wine_labels(154:178)];
2) 数据预处理——归一化
[0,1]区间归一化:y=(x-xmin)/(xmax-xmin);
[-1,1]区间归一化:2*(x-xmin)/(xmax-xmin)-1;
mapminmax 函数实现:y=(ymax-ymin)×(x-xmin)/(xmax-xmin)+ymin,其中ymin和ymax是映射范围参数,可调节,默认值是-1和1。函数接口如下:
[y,ps] = mapminmax(x)
[y,ps] = mapminmax(x,ymin,ymax)
[x,ps] = mapminmax('reverse',y,ps) %反归一化
新的映射函数对x进行重新归一化方法:
[y,ps] = mapminmax(x);
ps.ymin = 0;
ps.ymax = 1;
[ynew,ps] = mapminmax(x,ps);
wine 数据的归一化实现:
%% 数据预处理
% 数据预处理,将训练集和测试集归一化到[0,1]区间
[mtrain,ntrain] = size(train_wine);
[mtest,ntest] = size(test_wine);
dataset = [train_wine;test_wine];
% mapminmax为MATLAB自带的归一化函数
[dataset_scale,ps] = mapminmax(dataset',0,1);
dataset_scale = dataset_scale';
train_wine = dataset_scale(1:mtrain,:);
test_wine = dataset_scale( (mtrain+1):(mtrain+mtest),: );
3) 分类及预测
%% SVM网络训练
model = svmtrain(train_wine_labels, train_wine, '-c 2 -g 1');
%% SVM网络预测
[predict_label, accuracy,dec_values] = svmpredict(test_wine_labels, test_wine, model);
%% 结果分析
% 测试集的实际分类和预测分类图
% 通过图可以看出只有一个测试样本是被错分的
figure;
hold on;
plot(test_wine_labels,'o');
plot(predict_label,'r*');
xlabel('测试集样本','FontSize',12);
ylabel('类别标签','FontSize',12);
legend('实际测试集分类','预测测试集分类');
title('测试集的实际分类和预测分类图','FontSize',12);
grid on;
3.3 案例扩展——归一化方式及核函数对准确了的影响
1)采用不同归一化方式的对比
a.不进行归一化处理
Accuracy = 39.3258% (35/89) (classification)
b.[-1,1]归一化
[dataset_scale,ps] = mapminmax(dataset',-1,1);
Accuracy = 97.7528% (87/89) (classification)
c.[0,1]归一化
[dataset_scale,ps] = mapminmax(dataset',0,1);
Accuracy = 98.8764% (88/89) (classification)
不同的归一化对最后的准确率会有一定的影响。并不是任何问题都必须事先把原始数据进行归一化,要具体问题具体看待,测试表明有时候归一化后的测试准确率比没有归一化的准确率会低很多。
2) 采用不同核函数的对比
a.linear
'-c 2 -g 1 -t 0'
Accuracy = 97.7528% (87/89) (classification)
b.polynomial
'-c 2 -g 1 -t 1'
Accuracy = 98.8764% (88/89) (classification)
c.radial basis function
'-c 2 -g 1 -t 2'
Accuracy = 98.8764% (88/89) (classification)
d.sigmoid
'-c 2 -g 1 -t 3'
Accuracy = 52.809% (47/89) (classification)
如何通过选取 c 和 g 的值提升分类器的性能?下个随笔将会具体介绍。
libsvm多分类python_LIBSVM (三) 葡萄酒种类识别相关推荐
- LIBSVM (三) 葡萄酒种类识别
转自大神Jack王 https://www.cnblogs.com/blogwww/p/9498343.html 3.1 原始数据分析 1)测试数据为:wine data set,储存在chapter ...
- LIBSVM 多分类问题- 葡萄酒种类识别
3.1 原始数据分析 1)测试数据为:wine data set,储存在chapter_WineClass.mat.classnumer = 3;wine,记录了178个样本的13个属性:wine_l ...
- libsvm多分类python_libsvm多分类模型文件解释
问: 已有哪些学校的课程应用了libsvm? 德国弗赖堡大学,计算机科学学院应用科学系 数学与计算机科学部. Faculteit der Exacte Wetenschappen 荷兰,自由大学(VU ...
- 基于SVM的数据分类预测——意大利葡萄酒种类识别
SVM的基础概念 SVM的主要思想是:建立一个超平面作为决策平面,使得正例和反例之间的隔离边缘被最大化.SVM也是结构风险最小化方法的近似实现. SVM的分类和预测在现实生活中作用特别大,例如说今年的 ...
- 《MATLAB智能算法30个案例》:第26章 有导师学习神经网络的分类——鸢尾花种类识别
<MATLAB智能算法30个案例>:第26章 有导师学习神经网络的分类--鸢尾花种类识别 1. 前言 2. MATLAB 仿真示例 3. 小结 1. 前言 <MATLAB智能算法30 ...
- 基于pytorch搭建神经网络的花朵种类识别(深度学习)
基于pytorch搭建神经网络的花朵种类识别(深度学习) 文章目录 基于pytorch搭建神经网络的花朵种类识别(深度学习) 一.知识点 1.特征提取.神经元逐层判断 2.中间层(隐藏层) 3.学习权 ...
- 基于Python机器视觉的远程害虫种类识别和数量检测系统 报告+项目源码及数据
摘 要 农业与民生和经济发展息息相关,对农业发展科学化的关注既是民生需求, 也是经济稳步发展的迫切需求.病虫害是影响农作物生长的重要因素,对农作物的产量和品质都能造成无法估计的损害. 针对目前广大农业 ...
- 百度BML飞桨训练营(五)商品种类识别
百度BML&飞桨训练营(五)商品种类识别 文章相关内容资料已经取得百度BML允许,仅用与交流学习,请不要用于商业传播. 这一期继续来手把手教学如何进行视觉上对商品饮料分类. 下载商品识别模板( ...
- 【深度学习】Keras自建神经网络模型实现133种狗的种类识别(记录笔记)
〇.内容说明 主体部分资料来源于: 1.[深度学习图像识别课程]毕业项目:狗狗种类识别(2)代码实现 2.项目:实现一个狗品种识别算法App 3.Kaggle相关比赛:Dog Breed Identi ...
- 实例:【基于逻辑回归的鸢尾花二分类和三分类问题】
基于逻辑回归的鸢尾花二分类和三分类问题 一.问题描述及数据集获取 二.逻辑回归 1.概述 2.应用 3. LogisticRegression回归算法 4. sklearn逻辑回归API 三.代码实现 ...
最新文章
- Apache启用mod_expires模块
- 解决服务间调用的三种传统方式
- Ubuntu19.04安装mysql8.0版本(亲测OK)
- 微服务架构---服务降级
- python注释的用法(单and多行)
- 逐步创建ASP.NET Core 2.2应用程序
- java ,static
- cognos java,cognos10用JAVA如何获取passPortID(即实现单点登录)
- 信息管理系统技术开发合同书(补充协议)模板
- 北华大学c语言题库百度云,北华大学C语言题库精简打印版(全).docx
- 90行代码爬取链家广州二手房相关信息
- 爱荷华州立大学计算机专业,爱荷华州立大学|Iowa State University|Department of Electrical and Computer Engineering_毕达留学...
- JavaScript(基础)——初窥门径
- java ean13 计算_实训java第三课 for 逻辑运算符 条件判断 商品条形码Ean-13验证码生成...
- android iphone6 同步短信,如何将Android手机短信备份到iPhone6
- 【论文阅读】Learning Effective Road Network Representation with Hierarchical Graph Neural Networks
- AI算法,又整新活!萌妹子来挑战~
- 凡客副总裁被曝离职:或因IPO受阻|凡客|王春焕|离职_互联网_新浪科技_新浪网...
- 常用Debug模式下的打印DLog
- 2021年中国驾驶学校软件市场趋势报告、技术动态创新及2027年市场预测