1.1 线性模型基础

1.1.1 线性模型基本形式

1.1.1.1 线性模型定义

线性模型(linear model):对于给定ddd个属性描述的实例x=(x1;x2;⋯;xd)x=(x_1;x_2;\cdots;x_d)x=(x1​;x2​;⋯;xd​),其中,xix_ixi​是xxx在第iii个属性上的取值,通过属性的线性组合来预测的函数叫线性模型。

非线性模型:在线性模型的基础上引入层级结构或者高维映射

1.1.1.2 线性模型的向量表示

f(x)=wTx+bf(x)=w^{\rm T}x+bf(x)=wTx+b
其中,w=(w1;w2;w3;…;wd)w=(w_1;w_2;w_3;\dots;w_d)w=(w1​;w2​;w3​;…;wd​)。
www表示的是特征向量的权重weight,bbb表示的是偏值bias

举例:在西瓜问题中,如何判断一个西瓜是否是好西瓜,则可以表示成线性模型: $$ f_{好瓜}(x)=\cdot x_{色泽}+0.5 \cdot x_{根蒂}+0.3\cdot x_{敲声}+1 $$

1.1.2 线性回归

1.1.2.1 线性回归的定义

给定数据集D={(x1,y1),(x2,y2),⋯,(xm,ym)}D=\{(x_1, y_1), (x_2, y_2), \cdots, (x_m, y_m)\}D={(x1​,y1​),(x2​,y2​),⋯,(xm​,ym​)},其中xi=(xi1;xi2;⋯;xid),yi∈Rx_i=(x_{i1};x_{i2};\cdots;x_{id}), y_i\in Rxi​=(xi1​;xi2​;⋯;xid​),yi​∈R,试图学习得到一个线性模型以尽可能准确的预计实值输出标记的模型叫线性回归模型(linear regression)

1.1.2.2 线性回归的核心问题

f(xi)=wxi+bf(x_i)=wx_i+b f(xi​)=wxi​+b

确定上式中www,bbb的值,使得f(xi)≃yif(x_i)≃y_if(xi​)≃yi​

目标:让均方误差最小化
设(w∗,b∗)(w^*, b^*)(w∗,b∗)为(w,b)(w,b)(w,b)的解,即:
(w∗,b∗)=arg⁡min⁡(w,b)∑i=1m(f(xi)−yi)2=arg⁡min⁡(w,b)∑i=1m(yi−wxi−b)2(w^*, b^*) = \arg \min_{(w, b)}\sum^m_{i=1}(f(x_i)-y_i)^2\\ = \arg\min_{(w, b)}\sum^m_{i=1}(y_i-wx_i-b)^2(w∗,b∗)=arg(w,b)min​i=1∑m​(f(xi​)−yi​)2=arg(w,b)min​i=1∑m​(yi​−wxi​−b)2

1.1.2.3 线性回归的解决方法——最小二乘法(least square method)

求解www和bbb使得函数
E(w,b)=∑i=1m(yi−wxi−b)2E_{(w, b)} = \sum^m_{i=1}(y_i-wx_i-b)^2 E(w,b)​=i=1∑m​(yi​−wxi​−b)2
最小化的过程,称为线性回归模型的最小二乘“参数估计”(parameter estimation).

将上式分别对www,bbb求偏导可得:
∂E(w,b)∂w=2(w∑i=1mxi2−∑i=1m(yi−b)xi)∂E(w,b)∂b=2(mb−∑i=1m(yi−wxi))\frac{\partial E_{(w, b)}}{\partial w} = 2\left(w\sum_{i=1}^mx_i^2 - \sum_{i=1}^m(y_i-b)x_i\right)\\[2ex] \frac{\partial E_{(w, b)}}{\partial b} = 2\left(mb-\sum_{i=1}^m(y_i-wx_i)\right) ∂w∂E(w,b)​​=2(wi=1∑m​xi2​−i=1∑m​(yi​−b)xi​)∂b∂E(w,b)​​=2(mb−i=1∑m​(yi​−wxi​))
分别令偏导数等于零,即:
∂E(w,b)∂w=0∂E(w,b)∂b=0\frac{\partial E_{(w, b)}}{\partial w} =0\\[2ex]\frac{\partial E_{(w, b)}}{\partial b} =0∂w∂E(w,b)​​=0∂b∂E(w,b)​​=0
即可得到www,bbb的最优解闭式:
w=∑i=1myi(xi−x‾)∑i=1mxi2−1m(∑i=1mxi2)w = \frac{\sum_{i=1}^my_i(x_i-\overline{x})}{\sum_{i=1}^mx_i^2-\frac{1}{m}\left(\sum_{i=1}^mx_i^2\right)} w=∑i=1m​xi2​−m1​(∑i=1m​xi2​)∑i=1m​yi​(xi​−x)​

b=1m∑i=1m(yi−wxi)b=\frac{1}{m}\sum_{i=1}^m(y_i-wx_i) b=m1​i=1∑m​(yi​−wxi​)

其中x‾=1m∑i=1mxi\overline{x}=\frac{1}{m}\sum_{i=1}^mx_ix=m1​∑i=1m​xi​为xix_ixi​的均值

多元线性回归(multivariate linear regression)与上述单变量线性回归类似,这里不再论述。

1.1 线性模型基础相关推荐

  1. 机器学习笔记(三)线性模型

    3.线性模型 3.1基本形式 线性模型(linearmodel)形式简单.易于建模,如果能把问题都用线性模型来刻画,那现今的世界就单调多了,好在我们的宇宙是如此的丰富,以至于需要通过更强大的非线性模型 ...

  2. 推荐系统系列教程之十四:经典模型融合方法----线性模型和树模型的组合拳

    编者按:之前推出了<推荐系统系列教程>,反响不错,前面已经推出了十三期,今天按约推出第十四期:经典模型融合办法----线性模型和树模型的组合拳.希望朋友们多点"在看", ...

  3. 线性模型优化:岭回归和Lasso回归

    文章目录 欠拟合和过拟合 过拟合特征 岭回归和Lasso回归 岭回归 Lasso回归 仿真实例 欠拟合和过拟合 此前已经介绍了线性模型LinearRegression的原理和具体实现.在代码验证阶段, ...

  4. 手把手教你用Python进行回归(附代码、学习资料)

    作者: GURCHETAN SINGH 翻译:张逸 校对:丁楠雅 本文共5800字,建议阅读8分钟. 本文从线性回归.多项式回归出发,带你用Python实现样条回归. 我刚开始学习数据科学时,第一个接 ...

  5. 强化学习在携程酒店推荐排序中的应用探索

    https://www.toutiao.com/a6708585355555111431/ 目前携程酒店绝大部分排序业务中所涉及的问题,基本可以通过应用排序学习完成.而其中模型训练步骤中所需的训练数据 ...

  6. vs合并项目_线性混合效应模型 VS 方差分析

    线性混合效应模型相比方差分析具有很多优点.为了让大家更直观的了解,我们来做一下两者的对比.基于模拟的方法,生成了以下数据dat_sim: 这种数据格式是长格式,也就是从实验软件导出来的那种数据格式.这 ...

  7. 推荐系统笔记(模型融合)

    思维导图: 推荐系统在技术实现上一般划分三个阶段:挖掘.召回.排序. 模型融合: 挖掘的工作就是对用户和物品做非常深入的结构化分析,对各个角度的特征都被呈现出来,并且建好索引,供召回阶段使用,大部分挖 ...

  8. Lesson 13.2 模型拟合度概念介绍与欠拟合模型的结构调整策略

    一.模型拟合度概念介绍与实验 1.测试集的"不可知"悖论   通过此前课程内容介绍,我们已经知道了机器学习模型主要通过模型在测试集上的运行效果来判断模型好坏,测试集相当于是&quo ...

  9. 干货 | 强化学习在携程酒店推荐排序中的应用探索

    宣云儿,携程酒店排序算法工程师,主要负责酒店排序相关的算法逻辑方案设计实施.目前主要的兴趣在于排序学习.强化学习等领域的理论与应用. 前言 目前携程酒店绝大部分排序业务中所涉及的问题,基本可以通过应用 ...

最新文章

  1. 自然语言处理(NLP)前沿进展报告
  2. Android Studio通过JNI调用NDK程序
  3. 一文读懂文本处理中的对抗训练
  4. 内部导线拉力测试_端子拉脱力的正确测试方法及标准
  5. 微信小程序中使用圆形倒计时实例
  6. 四、纤维素纤维使用P-N系阻燃剂协同作用的原理?
  7. 如何在优雅地Spring 中实现消息的发送和消费 1
  8. 反射和多态的实现原理详解以及区别
  9. cpu怎么超频_小白秒变高手 Intel酷睿CPU一键超频就是这么简单
  10. 关于 android 中 edittext 特殊字符过滤和字符长度限制的最优方法
  11. python最好的五个库_5 个Python 库,照亮你的机器学习之路
  12. 设计模式-第七篇之门面模式
  13. 支持java浏览器_如何为浏览器安装支持JAVA的插件
  14. 管理Linux软件包和进程
  15. sev2008服务器系统,在windows 2008 64位系统安装sql server 2000
  16. 2D地图tile纹理自动拼接算法
  17. 数据结构视频教程 -《[中山大学]算法与数据结构(C语言版)[胡青主讲]》
  18. IBM SPSS Statistics常用的相关性分析方法
  19. Android系统之制作开机LOGO
  20. 苹果屏幕尺寸_iPhone 12屏幕维修价格出炉,比iPhone 11贵多少?

热门文章

  1. 派生类的构造复制与析构
  2. bzoj 1673: [Usaco2005 Dec]Scales 天平(DFS)
  3. win7下U盘安装Ubuntu16.04双系统
  4. 图像仿射变换之倾斜的python实现
  5. 利用matlab自带函数快速提取二值图像的图像边缘 bwperim函数
  6. linux上安装drupal时出现Your PHP installation is too old. Drupal requires at least PHP 5.5.9.
  7. [Python] 切片函数:silce()
  8. python数据存储系列教程——python对象与json字符串的相互转化,json文件的存储与读取
  9. win10 Anaconda 安装教程
  10. 静电场求电场强度E和电势U的方法