上节说到我们有了一个线性分类函数,也有了判断解优劣的标准——即有了优化的目标,这个目标就是最大化几何间隔,但是看过一些关于SVM的论文的人一定记得什么优化的目标是要最小化||w||这样的说法,这是怎么回事呢?回头再看看我们对间隔和几何间隔的定义:

间隔:δ=y(wx+b)=|g(x)|

几何间隔:

可以看出δ=||w||δ几何。注意到几何间隔与||w||是成反比的,因此最大化几何间隔与最小化||w||完全是一回事。而我们常用的方法并不是固定||w||的大小而寻求最大几何间隔,而是固定间隔(例如固定为1),寻找最小的||w||。

而凡是求一个函数的最小值(或最大值)的问题都可以称为寻优问题(也叫作一个规划问题),又由于找最大值的问题总可以通过加一个负号变为找最小值的问题,因此我们下面讨论的时候都针对找最小值的过程来进行。一个寻优问题最重要的部分是目标函数,顾名思义,就是指寻优的目标。例如我们想寻找最小的||w||这件事,就可以用下面的式子表示:

但实际上对于这个目标,我们常常使用另一个完全等价的目标函数来代替,那就是:

(式1)

不难看出当||w||2达到最小时,||w||也达到最小,反之亦然(前提当然是||w||描述的是向量的长度,因而是非负的)。之所以采用这种形式,是因为后面的求解过程会对目标函数作一系列变换,而式(1)的形式会使变换后的形式更为简洁(正如聪明的读者所料,添加的系数二分之一和平方,皆是为求导数所需)。

接下来我们自然会问的就是,这个式子是否就描述了我们的问题呢?(回想一下,我们的问题是有一堆点,可以被分成两类,我们要找出最好的分类面)

如果直接来解这个求最小值问题,很容易看出当||w||=0的时候就得到了目标函数的最小值。但是你也会发现,无论你给什么样的数据,都是这个解!反映在图中,就是H1与H2两条直线间的距离无限大,这个时候,所有的样本点(无论正样本还是负样本)都跑到了H1和H2中间,而我们原本的意图是,H1右侧的被分为正类,H2 左侧的被分为负类,位于两类中间的样本则拒绝分类(拒绝分类的另一种理解是分给哪一类都有道理,因而分给哪一类也都没有道理)。这下可好,所有样本点都进入了无法分类的灰色地带。

造成这种结果的原因是在描述问题的时候只考虑了目标,而没有加入约束条件,约束条件就是在求解过程中必须满足的条件,体现在我们的问题中就是样本点必须在H1或H2的某一侧(或者至少在H1和H2上),而不能跑到两者中间。我们前文提到过把间隔固定为1,这是指把所有样本点中间隔最小的那一点的间隔定为1(这也是集合的间隔的定义,有点绕嘴),也就意味着集合中的其他点间隔都不会小于1,按照间隔的定义,满足这些条件就相当于让下面的式子总是成立:

yi[(w·xi)+b]≥1 (i=1,2,…,l) (l是总的样本数)

但我们常常习惯让式子的值和0比较,因而经常用变换过的形式:

yi[(w·xi)+b]-1≥0 (i=1,2,…,l) (l是总的样本数)

因此我们的两类分类问题也被我们转化成了它的数学形式,一个带约束的最小值的问题:

下一节我们从最一般的意义上看看一个求最小值的问题有何特征,以及如何来解。

SVM入门(四)线性分类器的求解——问题的描述Part1相关推荐

  1. 【机器学习】SVM学习(三):线性分类器的求解

    [机器学习]SVM学习(三):线性分类器的求解 2016-10-10 19:56 239人阅读 评论(0) 收藏 举报 本文章已收录于:  机器学习知识库  分类: 机器学习(37)  目录(?)[+ ...

  2. SVM学习(三):线性分类器的求解

    1.问题的描述 上节说到我们有了一个线性分类函数,也有了判断解优劣的标准--即有了优化的目标,这个目标就是最大化几何间隔,但是看过一些关于SVM的论文的人一定记得什么优化的目标是要最小化||w||这样 ...

  3. SVM中的线性分类器

    线性分类器: 首先给出一个非常非常简单的分类问题(线性可分),我们要用一条直线,将下图中黑色的点和白色的点分开,很显然,图上的这条直线就是我们要求的直线之一(可以有无数条这样的直线)     假如说, ...

  4. # cs231n (二)线性分类器

    cs231n (二)线性分类器 标签(空格分隔): 神经网络 文章目录 cs231n (二)线性分类器 0.回顾 1.线性分类 从图像到标签分值的参数化映射 理解线性分类器 损失函数 2.支持向量机( ...

  5. 2. SVM线性分类器

    在一个线性分类器中,可以看到SVM形成的思路,并接触很多SVM的核心概念.用一个二维空间里仅有两类样本的分类问题来举个小例子.如图所示 和是要区分的两个类别,在二维平面中它们的样本如上图所示.中间的直 ...

  6. 【线性分类器】(四)万字长文解释拉格朗日乘子与支持向量机

    [线性分类器](一)线性判别 [线性判别器](二)"深度学习"的鼻祖--感知器 [线性分类器](三)线性分类器的松弛求解: LEMS 算法,H-K 算法 文章目录 拉格朗日乘子与支 ...

  7. 线性分类器:感知器/SVM

    线性可分 存在一个超平面,可以将数据集的正负例完全正确地划分至超平面两侧.如:左图中的数据是线性可分,而右图不是.     线性模型形式 是x在第i个特征的取值. 反映了第i个特征的重要程度.如 可看 ...

  8. CS231n 学习笔记(2)——神经网络 part2 :线性分类器,SVM

    *此系列为斯坦福李飞飞团队的系列公开课"cs231n convolutional neural network for visual recognition "的学习笔记.本文主要 ...

  9. 图像的线性分类器(感知机、SVM、Softmax)

      本文主要内容为 CS231n 课程的学习笔记,主要参考 学习视频 和对应的 课程笔记翻译 ,感谢各位前辈对于深度学习的辛苦付出.在这里我主要记录下自己觉得重要的内容以及一些相关的想法,希望能与大家 ...

  10. [模式识别].(希腊)西奥多里蒂斯第四版笔记3之__线性分类器

    1,线性分类器主要优点是他们的简化和计算吸引力 2,线性判别函数和决策超平面 3,感知器算法 4,最小二乘法:均方误差估计:随机近似和LMS算法:方差和估计 5,均方估计回顾:均方误差回归:MSE估计 ...

最新文章

  1. python入门(12)dict
  2. Java程序员从笨鸟到菜鸟之(二十八)Javascript总结之语言基础
  3. 简单的派生类构造函数C++
  4. Linux 进程通信fifo,Linux 进程通信之FIFO的实现
  5. Tensorflow实现数据分档操作
  6. 专转本-矩阵的初等变换与线性方程组
  7. Windows 10 家庭版在忘记旧密码的情况下,如何重置密码
  8. cms php 免费,十大免费PHP内容管理系统(CMS)
  9. 2020年初冠状病毒大事记随笔
  10. 老徐自述:《软件自动化测试实战解析_基于Python3编程语言》
  11. 六千档最强万金油?华硕无畏Pro15 2022锐龙版笔记本体验
  12. 手机上有哪些超棒超实用的APP让你觉得相见恨晚
  13. 基于C++的递归和回溯国际象棋女王安全算法
  14. 机器学习(九)基于SVM的上证指数涨跌预测
  15. 专业人士解释杜邦分析法(二)
  16. Fleaphp 数组辅助文件中 array_to_tree 的bug修正
  17. 【地理】从物理到地理之自然地理提纲整理2——大气圈
  18. vue .sync 用法
  19. a java runtime enviroment jre or java de,手把手教你启动报错:A java Runtime Environment(JRE)…...
  20. CTF日记之web题目(入门题目)

热门文章

  1. 项目国际化时,简体中文转繁体的自己主动化方案
  2. 【转帖】Java并发编程:volatile关键字解析
  3. Hibernate 关于配置Mapping不成功 Unknow Entity
  4. 使用 New Relic 监控接口服务性能 (APM)
  5. 【转帖】MATLAB中用FDATool设计滤波器及使用
  6. [ASP.NET]UserControl對UserControl參數傳遞
  7. C# 简单封装一个XML文件读取类
  8. axure后台示例_【Axure电商案例】如何设计和真的后台一样给客户看
  9. webstormjs文件全部报错_springboot启动报错org.yaml.snakeyaml.error.YAMLException...
  10. php粉层,thinkphp 模型分层