说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取。

1.项目背景

支持向量机是由间隔最大化和高维映射两大部件组成。间隔最大化是目标,支持向量机的损失函数依靠间隔计算,能让间隔达到最大的就是支持向量机要“学习”的过程。

高维映射用于解决线性不可分问题,可以理解为对数据的“预处理”。对于那些你中有我、间不容发的非线性分布数据,首先通过核函数映射至高维,映射后的数据集呈线性分布,为使用线性方法分类创造了条件。

最后归纳一下,使用支持向量机进行分类经过三个步骤:

1)选取一个合适的数学函数作为核函数。

2)使用核函数进行高维映射,数据点在映射后由原本的线性不可分变为线性可分。

3)间隔最大化,用间隔作为度量分类效果的损失函数,最终找到能够让间隔最大的超平面,分类也就最终完成了。

2.数据获取

本次建模数据来源于网络(本项目撰写人整理而成),数据项统计如下:

数据包括两个Excel数据集:

数据详情如下(部分展示):

3.数据预处理

3.1 用Pandas工具查看数据

使用Pandas工具的head()方法查看前五行数据:

关键代码:

3.2 缺失值统计

使用Pandas工具的info()方法查看数据是否有缺失值:

从图中可以看到,数据集1没有缺失值。

3.2 描述性统计分析

使用Pandas工具的describe ()方法进行描述性统计分析:

从上图可以看到,每个数据项的数量、平均值、标准差、最小值、最大值、分位数。

4.特征工程

4.1 构建特征和标签

关键代码如下:

5.探索性数据分析

5.1 可视化特征数据集:绘制散点图

从图中可以看到,数据集1中两个特征变量的散点图分布情况。

5.2 画决策边界:散点图中制作网格

通过上图可以看到,散点图中中布满了网格小点。

6.构建支持向量机分类模型

主要使用SVC算法,用于构建决策边界。

6.1 建模,计算决策边界并找出网格上每个点到决策边界的距离

从上图可以看到,从上图可以看到三条等高线,这三条等高线是分别基于Z的值为-1、0、1绘制的。

关键代码:

6.2 模型探索

进行模型预测、计算模型的准确率和模型中支持向量的个数:

从上图可以看到,可以看到模型的预测值、支持向量和支持向量的个数为2。

关键参数代码:

6.3 推广到非线性情况

数据集2特征的散点图:

从上图可以看到,是大圆里面套了一个小圆。

绘制带有决策边界的散点图:

从上图可以看出,明显,现在线性SVM已经不适合于数据集2。

6.4为非线性数据增加维度并绘制3D图像

从上图可以看到,数据集2明显是线性可分的了:我们可以使用一个平面来将数据完全分开,并使平面的上方的所有数据点为一类,平面下方的所有数据点为另一类,这就是决策树模型的高维映射。

7.结论与展望

综上所述,本项目采用了SVM分类模型来绘制线性数据和非线性数据决策边界的可视化图,最终证明了支持向量机分类模型具备非线性数据的分类能力,即具有高维映射的能力。

本次机器学习项目实战所需的资料,项目资源如下:

项目说明:
链接:https://pan.baidu.com/s/1dW3S1a6KGdUHK90W-lmA4w 
提取码:bcbp

网盘如果失效,可以添加博主微信:zy10178083

Python实现支持向量机SVM分类模型线性SVM决策过程的可视化项目实战相关推荐

  1. sklearn保存svm分类模型_【菜菜的sklearn】07 支持向量机(上)

    小伙伴们大家好~o( ̄▽ ̄)ブ,我是菜菜,这里是我的sklearn课堂第7期,今天分享的内容是支持向量机(上),下周还有下篇哦~ 我的开发环境是Jupyter lab,所用的库和版本大家参考:Pyth ...

  2. 机器学习(六)分类模型--线性判别法、距离判别法、贝叶斯分类器

    机器学习(六)分类模型--线性判别法.距离判别法.贝叶斯分类器 首先我们了解常见的分类模型和算法有哪些 线性判别法 简单来说就是用一些规定来寻找某一条直线,用直线划分学习集,然后根据待测点在直线的哪一 ...

  3. logistic回归 如何_第七章:利用Python实现Logistic回归分类模型

    免责声明:本文是通过网络收集并结合自身学习等途径合法获取,仅作为学习交流使用,其版权归出版社或者原创作者所有,并不对涉及的版权问题负责.若原创作者或者出版社认为侵权,请联系及时联系,我将立即删除文章, ...

  4. python+sklearn训练决策树分类模型(绘制学习曲线和验证曲线)

    本文所用文件的链接 链接:https://pan.baidu.com/s/1RWNVHuXMQleOrEi5vig_bQ 提取码:p57s 关于决策树的初级应用,可以看我之前的文章: https:// ...

  5. Python每日一记23分类模型的可信度评估

    "万事万物都存在不确定性,包括真理" 对于分类模型,我们知道利用模型确实能进行预测分类,为其加上标签,但是,模型预测的内部机制也是依据概率计算的,大概率属于1类,则分到1类. 大部 ...

  6. 【项目实战】Python基于OpenCV和卷积神经网络CNN进行车牌号码识别项目实战

    说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取. 1.项目背景 车牌识别系统(Vehicle License Plate Rec ...

  7. 手把手带你用Python做数据分析和可视化项目实战,能写进简历的那种!(另送15个实战案例)...

    最近几年,数据分析可真是太火了. 阿里.字节等互联网巨头基于大数据打造的商业模式获得巨大成功,使得"数据思维"."数据能力"迅速成为衡量职场人能力的核心指标,专 ...

  8. sklearn保存svm分类模型_机器学习100天-Day1601线性支持向量机分类

    说明:本文依据<Sklearn 与 TensorFlow 机器学习实用指南>完成,所有版权和解释权均归作者和翻译成员所有,我只是搬运和做注解. 第五章是对支持向量机SVM的系统介绍,阐述支 ...

  9. 基于python的分类模型_python SVM 线性分类模型的实现

    运行环境:win10 64位 py 3.6 pycharm 2018.1.1 导入对应的包和数据 import matplotlib.pyplot as plt import numpy as np ...

最新文章

  1. 字体大小的设置_老年人用智能手机,怎样更改字体大小?3种方法,手把手教您学会...
  2. Angular 项目里 angular.json 文件内容的学习笔记
  3. 序列生成_PR Structured Ⅴ:GraphRNN——将图生成问题转化为序列生成
  4. 简单就是不复杂 转
  5. Mysql运维管理-一主多从宕机从库切换主库继续和从库同步过程16
  6. 小程序如何上传代码到服务器,云服务器怎么上传小程序代码
  7. plugin zsh-autosuggestions/zsh-syntax-highlighting not found
  8. 熊猫烧香手工清除实验
  9. Spark视频王家林大神第8课:彻底理解大数据机器学习
  10. 2021年熔化焊接与热切割考试题库与解析
  11. CSS布局:多种方案实现固定页脚(sticky footer)
  12. Android Provision源码分析
  13. jQuery插件库链接
  14. linux tao环境 安装_菜鸟Linux 编译TAO2.0a的问题,求高手指导
  15. 比赛记录——记录一次失败的比赛,九坤量化验证码识别大赛
  16. 【kafka】二、kafka安装
  17. 微搭小课堂-第一课 实现到店导航
  18. html parser java库_Java解析HTML之HTMLParser使用与详解
  19. OrientDB入门
  20. 使用python爬取马蜂窝游记

热门文章

  1. 8.ASP.NET Core中的Kestrel Web服务器
  2. redux启示与实践
  3. 蓝桥杯2013年国赛A组——网络寻路(DFS和中转边巧解)
  4. java导出excel,导入excel,导出csv工具类整理
  5. Windows 11 即将问世 | Windows 10 和 Windows 11 该如何抉择
  6. 计算机科学与探索期刊审稿周期,计算机科学与探索期刊 从投稿到录用过程
  7. LeetCode 1079. 活字印刷
  8. No qualifying bean of type ‘com.itheima.dao.BookDao1‘ available: expected single matching bean 问题解决
  9. 痞子衡嵌入式:飞思卡尔i.MX RT系列MCU量产神器RT-Flash用户指南
  10. 【xp系统下载】用Excel做个工程倒计时牌