3.1基本形式

给定属性示例 x = ( x 1 ; x 2 ; . . . x d ) x=(x_{1};x_{2};. ..x_{d}) x=(x1​;x2​;...xd​)其中 x i x_{i} xi​是 x x x在第 i i i个属
性上的取值,线性模型(linear model) 试图学得一个通过属性的线性组合来进行
预测的函数,即 f ( x ) = w 1 x 1 + w 2 x 2 + . . . + w d x d + b f(x)=w_{1}x_{1}+w_{2}x_{2}+...+w_{d}x_{d}+b f(x)=w1​x1​+w2​x2​+...+wd​xd​+b。 w w w和 b b b学习可得。

3.2线性回归

给定数据集 D = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x m , y m ) } D=\{(x_{1},y_{1}),(x_{2},y_{2}),...,(x_{m},y_{m})\} D={(x1​,y1​),(x2​,y2​),...,(xm​,ym​)},其中 x i = ( x i 1 ; x i 2 ; . . . x i d ) x_{i}=(x_{i1};x_{i2};. ..x_{id}) xi​=(xi1​;xi2​;...xid​), y i ∈ R y_{i}\in R yi​∈R,“线性回归” (linear regression) 试图学得一个线性模型以尽可能准确地预测实值输出标记。
一元线性回归
数据集D只有一个属性,其线性回归可写为 f ( x ) = w x i + b f(x)=w_{}x_{i}+b f(x)=w​xi​+b

  • 基于最小二乘法的参数估计
    基于均方误差最小化来进行模型求解的方法
    ( w ∗ , b ∗ ) = arg ⁡ min ⁡ ( w , b ) ∑ i = 1 m ( f ( x i ) − y i ) ) 2 = arg ⁡ min ⁡ ( w , b ) ∑ i = 1 m ( y i − w x i − b ) 2 \begin{align*} (w^{*},b^{*})=\arg\min\limits_{(w,b)}\sum_{i=1}^m(f(x_{i})-y_{i)})^{2} \\ =\arg\min\limits_{(w,b)}\sum_{i=1}^m(y_{i}-wx_{i}-b)^{2}\\ \end{align*} (w∗,b∗)=arg(w,b)min​i=1∑m​(f(xi​)−yi)​)2=arg(w,b)min​i=1∑m​(yi​−wxi​−b)2​
    求解 w w w和 b b b使得 E ( w , b ) = ∑ i = 1 m ( y i − w x i − b ) 2 E_{(w,b)}=\sum\limits_{i=1}^m (y_{i}-wx_{i}-b)^{2} E(w,b)​=i=1∑m​(yi​−wxi​−b)2最小化,对 E ( w , b ) E_{(w,b)} E(w,b)​求导得到
    ∂ E ( w , b ) ∂ w = 2 ( w ∑ i = 1 m x i 2 − ∑ i = 1 2 ( y i − b ) x i ) ∂ E ( w , b ) ∂ b = 2 ( m b − ∑ i = 1 2 ( y i − w x i ) ) \begin{align*} \frac{\partial E_{(w,b)}}{\partial w}=2(w\sum\limits_{i=1}^mx_i^2-\sum\limits_{i=1}^2(y_{i}-b)x_{i})\\ \frac{\partial E_{(w,b)}}{\partial b}=2(mb-\sum\limits_{i=1}^2(y_{i}-wx_{i}))\\ \end{align*} ∂w∂E(w,b)​​=2(wi=1∑m​xi2​−i=1∑2​(yi​−b)xi​)∂b∂E(w,b)​​=2(mb−i=1∑2​(yi​−wxi​))​
    令上面两条式子为0可得到 w w w和 b b b最优解的闭式解

w = ∑ i = 1 m y i ( x i − x ‾ ) ∑ i = 1 m x i 2 − 1 m ( ∑ i = 1 m x i ) 2 w=\frac{\sum\limits_{i=1}^my_{i}(x_{i}-\overline{x})}{\sum\limits_{i=1}^mx_i^2-\frac{1}{m}(\sum\limits_{i=1}^mx_{i})^{2}} w=i=1∑m​xi2​−m1​(i=1∑m​xi​)2i=1∑m​yi​(xi​−x)​
b = 1 m ∑ i = 1 m ( y i − w x i ) b=\frac{1}{m}\sum\limits_{i=1}^m(y_{i}-wx_{i}) b=m1​i=1∑m​(yi​−wxi​)
其中 x ‾ = 1 m ∑ i = 1 m x i \overline{x}=\frac{1}{m}\sum\limits_{i=1}^mx_{i} x=m1​i=1∑m​xi​

多元线性回归
数据集D有 d d d个属性,其线性回归可写为 f ( x i ) = w T x i + b f(x_{i})=w^{T}x_{i}+b f(xi​)=wTxi​+b

  • 基于最小二乘法的参数估计
    把 w w w和 b b b吸收入向量形式 w ^ = ( w , b ) \widehat{w}=(w,b) w =(w,b),维度为d+1,则属性的矩阵相应增加一列,即

    标签的向量可以表示为 y = ( y 1 ; y 2 ; . . . y m ) y=(y_{1};y_{2};. ..y_{m}) y=(y1​;y2​;...ym​),使得 arg ⁡ min ⁡ ( w , b ) ( y − X w ^ ) T ( y − X w ^ ) \arg\min\limits_{(w,b)}(y-X\widehat{w})^{T}(y-X\widehat{w}) arg(w,b)min​(y−Xw )T(y−Xw ),对 w ^ \widehat{w} w 求导得:

    ① X T X X^{T}X XTX为满秩矩阵或正定矩阵时,令上式为0可得
    w ^ ∗ ( X T X ) − 1 X T y {\widehat{w}}^{*}(X^{T}X)^{-1}X^{T}y w ∗(XTX)−1XTy
    ② X T X X^{T}X XTX不是满秩矩阵时有多个解,选择哪一个由归纳偏好决定,常见的做法是引入正则化项。

3.3对数几率回归

在线性回归模型下套用一个映射函数实现分类功能

上面使用得是对数几率函数,需要注意的是映射函数是单调可微的。

-使用极大似然函数估计 w w w和 b b b

3.4线性判别分析

它的核心思想是同类样本的投影点尽可能的近,异类样本的投影点尽可能远。

【西瓜书+南瓜书】学习笔记2相关推荐

  1. 机器学习【西瓜书/南瓜书】--- 第1章绪论(学习笔记+公式推导)

    目录 前言 主要符号表 1.1 引言 1.2 基本术语 1.3 假设空间 1.4 归纳偏好 前言 本博客为博主在学习 机器学习[西瓜书 / 南瓜书]过程中的学习笔记,每一章都是对<西瓜书> ...

  2. 机器学习【西瓜书/南瓜书】--- 第2章模型评估与选择(上)(学习笔记+公式推导)

    目录 前言 2.1 经验误差与过拟合 2.2 评估方法 2.2.1 留出法(hode−outhode-outhode−out) 2.2.2 交叉验证法(crossvalidationcross val ...

  3. 【组队学习】【35期】吃瓜教程——西瓜书+南瓜书

    吃瓜教程--西瓜书+南瓜书 航路开辟者:谢文睿.秦州 领航员:凌亮 航海士:谢文睿.秦州 基本信息 开源内容:https://github.com/datawhalechina/pumpkin-boo ...

  4. 【组队学习】【33期】吃瓜教程——西瓜书+南瓜书

    吃瓜教程--西瓜书+南瓜书 航路开辟者:谢文睿.秦州 领航员:潘磊 航海士:谢文睿.秦州 基本信息 开源内容:https://github.com/datawhalechina/pumpkin-boo ...

  5. 【组队学习】【32期】吃瓜教程——西瓜书+南瓜书

    吃瓜教程--西瓜书+南瓜书 航路开辟者:谢文睿.秦州 领航员:陈伟峰 航海士:谢文睿.秦州 基本信息 开源内容:https://github.com/datawhalechina/pumpkin-bo ...

  6. 秦州:西瓜书 + 南瓜书 吃瓜系列 14. 降维与度量学习(下)

    吃瓜教程--西瓜书+南瓜书 Datawhale南瓜书是经典机器学习教材<机器学习>(西瓜书)的公式推导解析指南,旨在让在学习西瓜书的过程中,再也没有难推的公式,学好机器学习. 内容属性:机 ...

  7. 秦州:西瓜书 + 南瓜书 吃瓜系列 13. 降维与度量学习(上)

    吃瓜教程--西瓜书+南瓜书 Datawhale南瓜书是经典机器学习教材<机器学习>(西瓜书)的公式推导解析指南,旨在让在学习西瓜书的过程中,再也没有难推的公式,学好机器学习. 内容属性:机 ...

  8. 【组队学习】【31期】 吃瓜教程——西瓜书+南瓜书

    吃瓜教程--西瓜书+南瓜书 航路开辟者:谢文睿.秦州 领航员:张海腾 航海士:谢文睿.秦州 基本信息 开源内容:https://github.com/datawhalechina/pumpkin-bo ...

  9. 【组队学习】【30期】吃瓜教程——西瓜书+南瓜书

    吃瓜教程--西瓜书+南瓜书 航路开辟者:谢文睿.秦州 领航员:邱振波 航海士:谢文睿.秦州 基本信息 开源内容:https://github.com/datawhalechina/pumpkin-bo ...

  10. 【组队学习】【29期】4. 吃瓜教程——西瓜书+南瓜书

    4. 吃瓜教程--西瓜书+南瓜书 航路开辟者:谢文睿.秦州 领航员:刘琳 航海士:谢文睿.秦州 基本信息 开源内容:https://github.com/datawhalechina/pumpkin- ...

最新文章

  1. 流媒体传输协议---RTP--基础
  2. 键空间通知(keyspace notification)
  3. plus 什么是mybais_【mybatis-plus】什么是乐观锁?如何实现“乐观锁”
  4. Require Busy dialog
  5. centos yum “The requested URL returned error: 404”错误
  6. 奇门对接需求设计_从2020《奇门遁甲》看网络电影精品化的“正确打开方式”...
  7. Git 正在吞噬世界!
  8. Linux内核分析-孟宁
  9. 前后端怎么连接_如何搭建前后端分离的测试平台
  10. bay——RAC 表空间时数据文件误放置到本地文件系统-介质恢复.txt
  11. 模拟电子技术 PN结的形成与工作原理 个人笔记
  12. ftp 227 entering passive mode
  13. 机器学习必备知识点 之 样本方差与实际方差
  14. Prometheus监控kubernetes
  15. wps英文参考文献怎么对齐_wps英文参考文献怎么对齐_【论文攻略】排版技巧——如何用 Word 编辑参考文献......
  16. c语言间隔符号的作用,C语言教学(二)常见的符号
  17. 电脑连接linux系统怎么样,如今连Linux都弄不懂-当时我如果那么学习培训电脑操作系统就好啦...
  18. 苏轼《定风波》词两首
  19. 台式计算机显示器品牌排行,现在电脑显示器什么品牌好?
  20. 控制台报错element: <Goods> - did you register the component correctly? For recursive components, make sur

热门文章

  1. 团购2015:去团购化 争做O2O平台
  2. CentOS7中mysql8安装以及配置远程连接
  3. MongoDB开发使用手册
  4. JavaScript中var、let和const的区别
  5. 【官方文档】Fluentd 通过 RPM 包安装在 Red Hat Linux
  6. Python 年月日、儒略日、年纪日互转函数
  7. Potplayer固定窗口尺寸
  8. [Microsoft] [ODBC驱动程序管理器] 未发现数据源名称并且未指定默认驱动程序 QODBC3:不能连接
  9. 2014年中秋节,北京哪里有相亲会?
  10. 1-2-07:打印ASCII码