前面我们介绍了线性情况下的支持向量机,它通过寻找一个线性的超平面来达到对数据进行分类的目的。不过,由于是线性方法,所以对非线性的数据就没有办法处理了。例如图中的两类数据,分别分布为两个圆圈的形状,不论是任何高级的分类器,只要它是线性的,就没法处理,SVM 也不行。因为这样的数据本身就是线性不可分的。

对于这个数据集,我可以悄悄透露一下:我生成它的时候就是用两个半径不同的圆圈加上了少量的噪音得到的,所以,一个理想的分界应该是一个“圆圈”而不是一条线(超平面)。如果用 X1 和 X2 来表示这个二维平面的两个坐标的话,我们知道一条二次曲线(圆圈是二次曲线的一种特殊情况)的方程可以写作这样的形式:

现在让我们再回到 SVM 的情形,假设原始的数据时非线性的,我们通过一个映射 ϕ(⋅) 将其映射到一个高维空间中,数据变得线性可分了,这个时候,我们就可以使用原来的推导来进行计算,只是所有的推导现在是在新的空间,而不是原始空间中进行。当然,推导过程也并不是可以简单地直接类比的,例如,原本我们要求超平面的法向量 w ,但是如果映射之后得到的新空间的维度是无穷维的(确实会出现这样的情况,比如后面会提到的 Gaussian Kernel ),要表示一个无穷维的向量描述起来就比较麻烦。于是我们不妨先忽略过这些细节,直接从最终的结论来分析,回忆一下,我们上一次得到的最终的分类函数是这样的:

最后,总结一下:对于非线性的情况,SVM 的处理方法是选择一个核函数 κ(⋅,⋅) ,通过将数据映射到高维空间,来解决在原始空间中线性不可分的问题。由于核函数的优良品质,这样的非线性扩展在计算量上并没有比原来复杂多少,这一点是非常难得的。当然,这要归功于核方法——除了 SVM 之外,任何将计算表示为数据点的内积的方法,都可以使用核方法进行非线性扩展。

此外,略微提一下,也有不少工作试图自动构造专门针对特定数据的分布结构的核函数,感兴趣的同学可以参考,比如 NIPS 2003 的 Cluster Kernels for Semi-Supervised Learning 和 ICML 2005 的 Beyond the point cloud: from transductive to semisupervised learning 等。

转载于:https://www.cnblogs.com/molakejin/p/5143483.html

paper 6:支持向量机系列三:Kernel —— 介绍核方法,并由此将支持向量机推广到非线性的情况。...相关推荐

  1. Redis6 系列三 配置文件介绍

    Redis6 系列三 配置文件介绍 穆成祥 千缘科技 自定义目录:/myredis/redis.conf 1.1.   ###Units单位### 配置大小单位,开头定义了一些基本的度量单位,只支持b ...

  2. Kernel Method核方法—应用与理解

    前一篇主要梳理了几个基本概念以及相关关系,这一篇主要针对核方法的应用进行讨论,并理解核方法的思想,了解为什么要引入核方法. 核方法在机器学习中是一种灵活的技术,主要归结为两个方面: 非线性问题转换为高 ...

  3. WPF入门教程系列三——Application介绍(续)

    接上文WPF入门教程系列二--Application介绍,我们继续来学习Application 三.WPF应用程序的关闭 WPF应用程序的关闭只有在应用程序的 Shutdown 方法被调用时,应用程序 ...

  4. Kernel Method核方法—基本概念

    这里只是简单叙述了核方法中运用到的几个概念和相互的关系,包括什么是核函数Kernel function.正定函数Positive definite function.再生核希尔伯特空间Reproduc ...

  5. 【指数编制系列三】权重设置方法

        在指数编制方法中,我们会经常提到加权平均法(这个在后面会介绍),这里面有一个重要的概念就是权重.权重的设定在指数编制过程中是非常重要的一步,适当的权重设定是指数客观准确反映目标变化趋势的一个关 ...

  6. 可变形卷积系列(三) Deformable Kernels,创意满满的可变形卷积核 | ICLR 2020

    论文提出可变形卷积核(DK)来自适应有效感受域,每次进行卷积操作时都从原卷积中采样出新卷积,是一种新颖的可变形卷积的形式,从实验来看,是之前方法的一种有力的补充.   来源:晓飞的算法工程笔记 公众号 ...

  7. Hadoop系列 (三):HDFS详细介绍

    文章目录 Hadoop系列文章 HDFS简介 HDFS基本概念 分布式文件系统特点 HDFS设计目标 HDFS架构 HDFS应用场景 HDFS三大组件 NameNode SecondaryNameNo ...

  8. 三种IP核总线接口比较分析

    三种IP核总线接口比较分析 (2018-01-13 09:26:44) 转载▼ 标签: 三种IP核总线接口比较分析   原文地址:三种IP核总线接口比较分析作者:Stephen 作者:王智鸣  田金文 ...

  9. 机器学习与高维信息检索 - Note 6 - 核, 核方法与核函数(Kernels and the Kernel Trick)

    Note 6 核, 核方法与核函数 到目前为止,我们所讨论的机器学习算法的成功都依赖于对输入数据分布的假设.例如,PCA的效果越好,数据围绕线性子空间分布.或者在线性判别分析中,我们假设类的高斯分布, ...

最新文章

  1. CSP认证201809-2 买菜[C++题解]:区间覆盖、pair、交集长度、右端点的min-左端点的max
  2. 15. 二维数组中的查找【难度: 一般 / 知识点: 思维】
  3. XtraGrid RepositoryItemCheckEdit 显示状态以及单选多选问题
  4. Method Area(方法区)
  5. sql数据迁移到oracle数据库,从Oracle到SQL Server数据库主键的迁移
  6. TypeScript里的.d.ts语法
  7. 华为说绝不造车,但轮值董事长却忙着看车展,未来华为会造车吗?
  8. 导出排除的表_excel拆分实例:如何快速制作考勤统计分析表
  9. Android自定义控件之流式布局
  10. python第三方库tkinter之Label控件和Button控件
  11. 当ThreadLocal碰上线程池
  12. php中dump是什么文件怎么打开,Win8/Win10 dump文件怎么打开?dump文件分析工具下载及使用教程...
  13. android申请蓝牙动态权限,Android权限动态申请
  14. EBS开发_导入物料编码
  15. Python 解析风云四A卫星L1级别数据以及绘制卫星云图
  16. 笔记 左程云算法基础
  17. 【论文泛读08】基于深度时空残差网络的城市人群流动预测
  18. 18岁少年盗取1500万日元萌乃币, 逼交易所关停, 引发日本史上第一次加密币盗窃法律诉讼...
  19. Windows文件名太长无法删除
  20. 风控模型基本概念和方法

热门文章

  1. go语言打印日期_go语言基础:流程控制(4)-多重循环跳转控制
  2. 双精度浮点数转换_模型压缩一半,精度几乎无损,TensorFlow推出半精度浮点量化工具包,还有在线Demo...
  3. cnn 示意图_Two-Stream CNN(双流CNN)介绍(NIPS2014)
  4. 计算包含+、-、*、/、(、)等几种运算符的表达式的值。
  5. 更改ftp服务器根文件夹,ftp服务器的主目录根文件夹
  6. Excel 宏写入文件乱码解决
  7. Responsive自适应网页设计与ResponsiveColumn自适应列实例
  8. Teamcenter 开发中的一些问题
  9. mpAndroidchart 坐标和图表距离_几个小细节--图表那些事
  10. android手机如何提速,安卓手机上网如何提速