核函数和核矩阵【转】
核函数
为了解决线性不可分的问题,需要将样本从原始空间映射到高维空间,在高维空间实现线性可分。然后利用常见的线性分类器ex:SVM分类
然而,将输入的空间中样本映射到新的空间中,在新的空间中求内积;维数高,计算开销大。【可通过最后一张图理解】
设计采用核函数的方法:利用核函数,不需要将输入空间中的样本映射到新的空间中去,在输入空间中就可以直接计算出内积了。对输入空间向高维空间的一种隐式映射(注意,这也是低维空间到高维空间的一种映射)。不需要给出那个映射,而在输入空间中就可以计算内积,即核函数方法。【核函数可以简化映射空间中的内积运算】
核函数K,对于所有的x1,x2满足:
注:核函数和隐射没有关系,只是用来计算映射到高维空间空间之后内积计算的简便方法。故;上面提到为隐形隐射。
核函数也就是一种函数,本质上跟其他常见的函数(如幂函数)是一样的。
满足以下要求的函数才能称为核函数(定理):
令为输入空间,是定义在上的对称函数,则是核函数当且仅当对于任意数据,核矩阵K总是半正定的:
.
上面的定理表明,只要一个对称函数对应的核矩阵半正定,它就能作为核函数。
核函数的作用:隐含着一个从低维空间到高维空间的映射,计算样本在高维空间的内积。
假如出于某些原因,我们要将样本从原始空间映射到高维空间(如在低维空间样本线性不可分,需要映射到高维空间产生线性可分的样本)。
假设映射为,表示x映射后的特征向量。假设在高维空间中,正好涉及到计算内积:。这时,就可以引入核函数(涉及选择什么核函数):
.
上式将在高维空间的内积转化到在原始空间计算。
那为什么不直接在映射后的高维空间计算?原因有两点:
- 通常我们不知道映射的具体形式;
- 映射后的空间维数可能非常高,甚至无限维,直接计算开销太大,十分困难.
上面提到有5种常用的核函数,选择了不同的核函数,意味选择了不同的某种映射。因为我们不知道映射的具体形式,所以我们并不知道什么样的核函数合适。核函数的选择成为算法的“变数”。
核函数的选择有一些基本经验:
- 例如对文本数据通常采用线性核,情况不明时可先尝试高斯核。线性核和高斯核也是最为常用的核函数。
https://blog.csdn.net/weixin_35732969/article/details/81603520
https://blog.csdn.net/puqutogether/article/details/41309745
http://www.360doc.com/content/14/0728/15/14106735_397653989.shtml
核函数和核矩阵【转】相关推荐
- OpenCV-Python图像运算变换处理:开运算和闭运算以及不同核矩阵的影响分析
☞ ░ 前往老猿Python博客 https://blog.csdn.net/LaoYuanPython ░ 一.引言 在<OpenCV-Python图像处理:腐蚀和膨胀原理及erode.dil ...
- 核密度聚类(一)核函数、核密度估计、核密度聚类
核密度聚类 当问题需要自动地确定聚类数目时,传统的KMeans等聚类方法不在适用.因此,使用"核概率密度估计"的思路自行设计了两种聚类方法.本文收录: 核是什么 核密度估计 基于核 ...
- 机器学习中的核函数与核方法(好!)
原文见:https://blog.csdn.net/qq_34099953/article/details/84316905 我们在学习机器学习的时候,总是会看到一个概念--核,然后看到一堆公式.但是 ...
- 【补充知识】支持向量机和核函数
1)Zhang, Kun, et al. "Domain adaptation under target and conditional shift." International ...
- 核函数,再生核Hilbert空间,表示定理
在许许多多的分类模型中,线性模型f(x)=w⊤xf(x)=w⊤x是最为简单高效的一种,它最后可以得到一个线性分界面,如下图左图所示,但是在数据集 S={x1,-,xm}, xi∈XS={x1,-, ...
- 机器学习-特征工程中的特征降维
对于一个机器学习问题,数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限.由此可见,数据和特征在模型的整个开发过程中是比较重要.特征工程,顾名思义,是对原始数据进行一系列工程处理,将其提炼为 ...
- 机器学习笔记(六) ---- 支持向量机(SVM)
支持向量机(SVM)可以说是一个完全由数学理论和公式进行应用的一种机器学习算法,在小批量数据分类上准确度高.性能好,在二分类问题上有广泛的应用. 同样是二分类算法,支持向量机和逻辑回归有很多相似性,都 ...
- 沈华伟老师图卷积神经网络教学视频笔记
图卷积神经网络 感谢 0. 背景介绍 基于图的应用 node-level graph-level singal-level 数据集介绍 1. Cora数据集: 2. CiteSeer 3. Pubme ...
- 西瓜书学习(task2)
4.1.1 组成 一颗决策树包含一个根结点.若干个子结点和若干个叶结点. 根结点:包含样本全集: 子结点:对应属性划分,包含划分样本: 叶结点:对应决策结果,包含决策样本. 从根结点到每个叶结点的路径 ...
最新文章
- 练习2: Python基本图形绘制 (第2周)
- as3.0全屏代码…
- Java通过Netty,实现Websocket消息推送简单几步搞定
- phpfind mysql怎么用_MySQL 的 find_in_set 函数使用方法
- html文档 字符引用,【转】HTML中常见形如#number;的东西叫做 字符实体引用,简称引用,代表一个对应的unicode字符...
- 分享一个非常 nice 的工具
- two+few+arguments+php,PHP5.5 ~ PHP7.2 新特性整理
- 面试基础算法、及编程 第一弹
- 搜索推荐广告中的Position Bias:美团DPIN
- 项目中比较常用的数据筛选场景
- lvgl 笔记(3)-中文字库的制作和使用(windows模拟和esp32)
- C#仿win10计算器
- 使用QRCode.js生成二维码
- Mysql8.0.17压缩包安装——超详细简单教程
- 使用JSON-Schema验证数据,第1部分
- 数字中国城市巡礼之济宁:以信立本,大数据点亮城市信用招牌
- 2020腾讯数分笔试
- 禾川科技科创板上市破发:大跌17% 公司市值近30亿
- 模型优化-梯度下降算法
- Python+OpenCv 标定相机参数的实现
热门文章
- kerberos 之TGS_REQ、TGS_REP
- 分布式事务解决方案(二)
- TypeScript error in node_modules/jest-diff/build/diffLines.d.ts
- 电脑硬盘右击计算机就卡死,win10总是莫名其妙卡死怎么解决
- 冬季高校寝室用电安全管理与防范
- 【obs】OBS Library D3D11 OpenGL wrapper
- https网站打不开如何解决
- Linux-hostname查看及修改
- 国产最强负载均衡器LVS(理论+实战)
- 清除office多余的激活信息