之前学习没有想透,最近交流时,在这个问题上磕绊了几次,打算仔细思考下。

关于机器学习中的线性和非线性,有两个聚焦点,一个是问题,一个是模型。
问题的线性非线性,指的是样本点的分布,是否能在输入空间上用线性超平面区分。
模型的线性非线性,是这次讨论的重点。

模型的非线性

基础数学说,线性指变量之间的数值关系,即满足成比例。因此,变量之间的多项式、指数等关系都算是非线性。
网上有一批文章认为,ML 模型的线性非线性,指模型参数之间的关系,即决策函数 y=w_1*x_1^2 + w_2*x_2^2 是线性模型,而 y=w_1^2*x_1 + w_2^2*x_2 是非线性模型。
我认为这是不对的。

ML 模型的的线性非线性,应该指特征变量之间的关系,即决策函数 y=w_1*x_1^2 + w_2*x_2^2 是非线性模型,而 y=w_1^2*x_1 + w_2^2*x_2 是线性模型。
实际上,并不会出现后一种决策函数,貌似没有哪种模型学到的决策函数会在参数上进行非线性变换,那么这种变换并不会在 loss function 的优化过程中起到作用,最终对学习到的 model 并不会产生影响,因此,后一种模型和 y=w_1*x_1 + w_2*x_2 并无二致。

谈谈 LR、SVM 和 MLP 中的非线性

LR,准确来说应该是广义线性模型。其决策面仍是线性的 y=w_1*x_1 + w_2*x_2,只不过在输出时,套用 sigmoid 函数,得到了分类的置信度。如果从最后的决策函数 f(x) = 1 / (1+exp(w_1*x_1 + w_2*x_2)) 来看,确实特征变量 x_1 和 x_2 之间由于 sigmoid 函数作用,呈现了非线性关系,但这种非线性并不是直接作用在输入特征空间的,而是对输出空间进行的非线性映射。

SVM,有线性和非线性版本。线性SVM,其模型本身就是在寻求一个超平面,只是策略是找到间隔最大的那个超平面。而非线性SVM,虽说在特征空间上仍是分类超平面,但是先采用了核技巧从输入空间向特征空间进行了非线性映射。

MLP,其嵌套函数的特点就反映了,它的非线性更像 LR ,即从每层来看,输入并没有进行 SVM 那样的非线性特征变换,但在输出时进行了非线性映射,那么多层重叠,也就实现了特征的非线性交叉。

ML 中的非线性

通过上面分析,就能看出,ML 模型的非线性,指的是特征之间的非线性关系。这种非线性的引入,目前来看有两种思路:

  • 一种是对输入特征进行非线性映射,如 SVM 的输入空间到特征空间的非线性高维映射
  • 一种是对输出结果进行非线性映射,如 LR 的输出加持 sigmoid

MLP 的非线性本质同 后一种,但由于多层作用,也相当于组合了两种思路。

回过头再来看看,问题的非线性通常需要求助于模型的非线性。但有些模型的非线性程度可能不够,不足以解决复杂的非线性问题。
MLP 不用担心,SVM 虽然不知道进行了怎样的特征映射,但内积回旋的非线性也是很强的,貌似 LR 就差了点。
LR 的非线性并没有直接对特征进行变换,非线性能力就弱了点。比如,原本距离决策面远的样本点,只是相对决策面的绝对距离经 sigmoid 变换被拉到了 0-1 之间,但样本点们相对决策面的相对距离(顺序)并没有改变,离得远的样本点在这种变换后还是远。

那么如果需要提高模型的非线性能力,该如何做呢?从上面的总结就可以看出来:

  • 要么看看对输出进行非线性映射如何
  • 要么看看能不能再对输入特征进行了非线性变换

以后一种来说,

  • 进行特征组合,即使是多样式组合也产生了非线性,sklearn 中的 PolynomialFeature 类就是讲原本的 d 维扩展到了 C_(q+d)^d 维
  • 引入核技巧,将低维输入映射到高维空间,产生非线性
  • 引入新的维度,比如对连续特征离散化,甚至是离散后进行组合

最后一种算是核技巧的本质,核技巧的非线性产生的根由是因为 n 维空间映射到 m>n 维,即增加表征的维度带来的非线性。

浅谈机器学习中的非线性相关推荐

  1. 欧几里得范数_浅谈机器学习中的范数

    机器学习中范数的广义定义: 一个范数是一个真实的向量空间V中的关于|| . ||的一个函数映射关系,其满足以下3个条件 (1)||x|| ≥ 0,当且仅当 x=0的时候等号成立 (2)||αx|| = ...

  2. 浅谈机器学习中的过拟合

    本篇博客主要是基于花书(古德费洛的<Deep Learning>)和西瓜书(周志华的<机器学习>)撰写的,其中插入了博主的一些个人见解,如有不对之处希望大家指出来一起来讨论一下 ...

  3. 浅谈机器学习中的特征缩放(feature scaling)

    引言 在运用一些机器学习算法的时候不可避免地要对数据进行特征缩放(feature scaling),比如:在随机梯度下降(stochastic gradient descent)算法中,特征缩放有时能 ...

  4. 浅谈机器学习中的QR分解

    1. QR 分解的形式 QR 分解是把矩阵分解成一个正交矩阵与一个上三角矩阵的积.QR 分解经常用来解线性最小二乘法问题.QR 分解也是特定特征值算法即QR算法的基础.用图可以将分解形象地表示成: 其 ...

  5. 浅谈机器学习之深度学习

    浅谈机器学习之深度学习 从人工智能到机器学习再到深度学习 人工智能是个很大的知识集合体,但目前有个和它关系最大的学科---机器学习 机器学习是一门多领域交叉学科,涉及概率论.统计学.逼近论.凸分析.算 ...

  6. 浅谈机器学习之数据集构建

    浅谈机器学习之数据集构建 ​ 正如大家现在知道的,深度学习模型(DL)和机器学习模型(ML)是数据驱动型任务,在近乎完美的数据集面前,模型间的细微差异可以忽略.但要获得覆盖目标场景所有特征的样本,不仅 ...

  7. 激活函数设计vhdl_浅谈神经网络中激活函数的设计

    激活函数是神经网络中非线性的来源,因为如果去掉这些函数,那么整个网络就只剩下线性运算,线性运算的复合还是线性运算的,最终的效果只相当于单层的线性模型. 那么,常见的激活函数有哪些呢?或者说,激活函数的 ...

  8. python中scipy.optimize_浅谈SciPy中的optimize.minimize实现受限优化问题

    问题描述:有一批样本x,每个样本都有几个固定的标签,如(男,24岁,上海),需要从中抽取一批样本,使样本总的标签比例满足分布P(x),如(男:女=49%:51%.20岁:30岁=9%:11%..... ...

  9. java 中的单元测试_浅谈Java 中的单元测试

    单元测试编写 Junit 单元测试框架 对于Java语言而言,其单元测试框架,有Junit和TestNG这两种, 下面是一个典型的JUnit测试类的结构 package com.example.dem ...

  10. mybatis与php,浅谈mybatis中的#和$的区别

    浅谈mybatis中的#和$的区别 发布于 2016-07-30 11:14:47 | 236 次阅读 | 评论: 0 | 来源: 网友投递 MyBatis 基于Java的持久层框架MyBatis 本 ...

最新文章

  1. 云计算机机房怎么样,如何知道云电脑配置多少?怎么选择云电脑机房?
  2. R构建多项式回归模型(Polynomial Regression)
  3. 使用osql执行sql脚本
  4. android 设置点击ProgressDialog外的区域不消失
  5. 面试题:聊聊Unix与Java的IO模型?
  6. python3函数调用时间_Python3 time clock()方法
  7. 读懂操作系统之虚拟内存(一)
  8. 为什么在子类中不重写超类的实例变量
  9. XAMPP报错:mysqli::real_connect(): (HY000/1045): Access denied for user ‘pma‘@‘localhost‘
  10. NTKO Weboffice打开文档格式错误的解决方案
  11. ansys18安装教程_ANSYS|ansys18.0完整安装过程及常见问题解决方案「图文」
  12. format mla_MLAFormatMLA格式解读
  13. oracle if语句使用方法,Oracle IF语句的使用
  14. 网易,这次你让粉丝们失望了
  15. 微型计算机显示器的标准接口,HJ/T 313-2006 环境标志产品技术要求 微型计算机、显示器...
  16. 2022中式烹调师(高级)考试题库及答案
  17. a计权声功率级计算公式_超高层建筑气动噪声总声压级和A计权声压级的计算
  18. Python爬虫:调用百度翻译接口实现中英翻译功能
  19. 计算机毕业设计之 医院管理系统
  20. 第九章 指针 【SEARCH】

热门文章

  1. 用阿里云商标注册流程步骤,以及有哪些商标延伸服务
  2. 【Java编程】写一个将华氏温度转换成摄氏温度的程序,转换的公式是:°F = (9/5)*°C + 32 其中C表示摄氏温度,F表示华氏温度。
  3. 企业终端安全应该包括哪几部分?
  4. STM32f4日记9之LD3320语音识别(您的私人语音助手MICRO)
  5. 中华民族(汉族及其他民族)起源
  6. C# - 此应用无法在你的电脑上运行
  7. AXURE RP 9 ——【中继器】
  8. MYSQL命令(超详细)
  9. “爱玛”等不达标电动自行车下架
  10. 每天一kernel:正太概率图