线性和多项式回归

在这一简单的模型中,单变量线性回归的任务是建立起单个输入的独立变量与因变量之间的线性关系;而多变量回归则意味着要建立多个独立输入变量与输出变量之间的关系。除此之外,非线性的多项式回归则将输入变量进行一系列非线性组合以建立与输出之间的关系,但这需要拥有输入输出之间关系的一定知识。训练回归算法模型一般使用随机梯度下降法(SGD)。

优点:

建模迅速,对于小数据量、简单的关系很有效;

线性回归模型十分容易理解,有利于决策分析。

缺点:

对于非线性数据或者数据特征间具有相关性多项式回归难以建模;

难以很好地表达高度复杂的数据。

神经网络由一系列称为神经元的节点通过内部网络连接而成,数据的特征通过输入层被逐级传递到网络中,形成多个特征的线性组合,每个特征会与网络中的权重相互作用。随后神经元对线性组合进行非线性变化,这使得神经网络模型具有对多特征复杂的非线性表征能力。神经网络可以具有多层结构,以增强对于输入数据特征的表征。人们一般利用随机梯度下降法和反向传播法来对神经网络进行训练,请参照上述图解。

优点:

多层的非线性结构可以表达十分复杂的非线性关系;

模型的灵活性使得我们不需要关心数据的结构;

数据越多网络表现越好。

缺点:

模型过于复杂,难以解释;

训练过程需要强大算力、并且需要微调超参数;

对数据量依赖大,但常规机器学习问题则使用较小量数据。

回归树和回归森林

让我们从最基本的概念出发,决策树是通过遍历树的分支并根据节点的决策选择下一个分支的模型。树型感知利用训练数据作为数据,根据最适合的特征进行拆分,并不断进行循环指导训练数据被分到一类中去。建立树的过程中需要将分离建立在最纯粹的子节点上,从而在分离特征的情况下保持分离数目尽可能的小。纯粹性是来源于信息增益的概念,它表示对于一个未曾谋面的样本需要多大的信息量才能将它正确的分类。实际上通过比较熵或者分类所需信息的数量来定义。而随机森林则是决策树的简单集合,输入矢量通过多个决策树的处理,最终的对于回归需要对输出数据取平均、对于分类则引入投票机制来决定分类结果。

优点:

具有很高的复杂度和高度的非线性关系,比多项式拟合拥有更好的效果;

模型容易理解和阐述,训练过程中的决策边界容易实践和理解。

缺点:

由于决策树有过拟合的倾向,完整的决策树模型包含很多过于复杂和非必须的结构。但可以通过扩大随机森林或者剪枝的方法来缓解这一问题;

较大的随机数表现很好,但是却带来了运行速度慢和内存消耗高的问题。

多项式拟合缺点_三种回归算法及其优缺点相关推荐

  1. 基于内容的推荐java代码_三种推荐算法简介:基于用户的协同过滤、基于物品的协同过滤、基于内容的推荐...

    1.推荐算法 1.1.协同过滤 协同过滤是目前应用最广泛的推荐算法,它仅仅通过了解用户与物品之间的关系进行推荐,而根本不会考虑到物品本身的属性. 可分成两类: 1.基于用户(user-based)的协 ...

  2. 多项式拟合缺点_机器学习——机器学习算法优缺点综述

    来源:数据派THU.七月在线 转自:Datawhale(Datawhale 目录 正则化算法(Regularization Algorithms) 集成算法(Ensemble Algorithms) ...

  3. 多项式拟合缺点_多项式拟合

    在网上看别人的心得 一 最小二乘法的基本原理 从整体上考虑近似函数同所给数据点(i=0,1,-,m)误差(i=0,1,-,m)的大小,常用的方法有以下三种:一是误差(i=0,1,-,m)绝对值的最 ...

  4. 多项式拟合缺点_曲线拟合方法的选择

    曲线拟合方法的选择 目    录 摘要 1 前言 2 1 问题提出 3 2 插值介绍 4 2.1拉格朗日公式求解 4 2.1.1 算法分析 5 2.1.2 程序设计 5 2.1.3 计算结果 8 2. ...

  5. python爬虫优势和缺点_三种分布式爬虫策略的优缺点

    三种分布式爬虫策略: (1)Slaver端从Master端拿任务(Request/url/ID)进行数据抓取,在抓取数据的同时也生成新任务,并将任务分配给Master端.Master端只有一个Redi ...

  6. 多项式拟合缺点_拟合多项式的最小二乘法

    T 20.5 32.7 51.0 73.0 95.7 R 765 826 873 942 1032 多项式拟合: 已知变量 x , y 之间的函数关系为: n n-1 1 2 n n+1 y=a x ...

  7. (含Python源码)Python实现K阶多项式的5种回归算法(regression)

    0.文章结构 为了方便客官根据需要取阅,节约时间,文章目录结构如下: 问题描述 理论部分:五种回归算法 两种Python读取文件的方法 Python实现五种回归算法 使用的工具箱 总结 1.问题描述 ...

  8. 常用的三种线性模型算法--线性回归模型、岭回归模型、套索回归模型

    常用的三种线性模型算法–线性回归模型.岭回归模型.套索回归模型 线性模型基本概念 线性模型的一般预测模型是下面这个样子的,一般有多个变量,也可以称为多个特征x1.x2.x3 - 最简单的线性模型就是一 ...

  9. python 三种聚类算法(K-means,AGNES,DBScan)

    python实现鸢尾花三种聚类算法(K-means,AGNES,DBScan) 更新时间:2019年06月27日 14:44:44   作者:weixin_42134141 这篇文章主要介绍了pyth ...

  10. 谱估计matlab,利用MATLAB工具箱比较三种谱估计算法

    总第175期2009年第1期 舰船电子工程 Ship Electr onic Engineering V o l.29No.1 96 利用MATLAB工具箱比较三种谱估计算法* 盖明明1)郗海龙2)姜 ...

最新文章

  1. 在react hook里使用mobx(配置mobx依赖)
  2. 如何从stackoverflow的api 中获取是数据_教你拼多多如何选款、测款,打造出爆款。...
  3. gson解析mysql城市json数据_Gson解析复杂的json数据
  4. git checkout -b mybranch和git checkout mybranch
  5. go 指针变量和普通变量的转化_7.8 C++指针变量的引用
  6. ABP vNext微服务架构详细教程——身份管理服务
  7. java使用缓冲区读取文件_在Java中使用Google的协议缓冲区
  8. Workbench has not been created yet
  9. 查看.Net Framework版本的方法
  10. (转)Java线程:新特征-线程池
  11. 理解eos区块链的eosio.token合约
  12. 小米5G手机为什么如此便宜?卢伟冰解释定价原因
  13. Pinczakko的AwardBIOS逆向工程指导
  14. 【VIP视频网站项目一】搭建视频网站的前台页面(导航栏+轮播图+电影列表+底部友情链接)
  15. Redis 做网页UV统计
  16. 泰勒公式到欧拉公式的推导
  17. C语言 程序的翻译 预处理 编译 汇编 链接 #define详解
  18. 使用MySQL可视化客户端,例如SQLyog,Navicat等,只编写SQL语句,使用2的N次方原理,快速初始化百万千万条数据
  19. 搭建服务器 运用阿里云DNS自己实现DDNS
  20. Delegate 基本概念

热门文章

  1. 盒子模型与PS基本操作
  2. win10如何调整计算机时间同步,Win10如何修改时间同步服务器?Windows时间同步出错解决方法...
  3. win7与internet时间同步出错_Windows7旗舰版系统同步internet时间总是提示同步时出错怎么办...
  4. IE7IE8兼容性设置_服务器端设定
  5. B/S系统界面设计与开发详解
  6. 流媒体传输协议(rtp/rtcp/rtsp/rtmp/mms/hls)
  7. 237. 删除链表中的节点
  8. 【设计模式】:单例设计模式深究
  9. P5144 蜈蚣 (线性DP)
  10. windows 网络监控_如何在Windows 10中监控网络使用情况