墙裂推荐阅读:y的衍生物

关键词:最小二乘法;正则化;对数线性回归; y的衍生物

3.1 基本形式

假设样本x有d个属性,线性模型(linear model)试图学得一个通过属性的线性组合来进行预测的函数,即f(x)=w1x1+w2x2+⋅⋯+wdxd+bf(x)=w1x1+w2x2+⋅⋯+wdxd+bf(x)=w_{1}x_{1} + w_{2}x_{2}+\cdot \cdots +w_{d}x_{d}+b ,向量形式 f(x)=wTx+bf(x)=wTx+bf(x)=w^{T}x+b

3.2 线性回归

关键词:无序属性连续化。
对离散属性,若属性值之间存在“序”(order)关系,可通过连续化将其转化为连续值,例如二值属性身高的取值,“高”“矮”可和转化为{1.0 , 0}。 若属性值之间不存在序的关系,例如属性“瓜类”的取值为西瓜,南瓜,冬瓜,则可转化为(0,0,1),(0,1,0),(1,0,0)。

关键词:最小二乘法(least square method)。
基于均方误差最小化来进行模型求解的方法称为“最小二乘法”。在线性回归中,最小二乘法就是试图找到一条直线,使所有样本到直线上的欧氏距离之和最小。

关键词: 正则化(regularization)项。
假设解一个线性方程组,当方程数大于自由变量数时,是没有解的。反过来,当方程数小于自由变量数的时候,解就有很多个了。往往,我们会碰到这种情况,参数多,“方程”少的情况,那么有很多个w(权值向量)都能使均方误差最小,那么该选哪一个呢? 这就涉及到 归纳偏好问题了,常见的做法是引入正则化项。

关键词:对数线性回归(log-linear regression);y的衍生物
把线性回归模型简写为:f(x)=wTx+bf(x)=wTx+bf(x)=w^{T}x+b ,当我们希望线性模型的预测值逼近真实标记y,这样就是线性模型。那可否令模型的预测值毕竟y的衍生物呢? 作者的这一描述实在太妙了!y的衍生物,通俗易懂! 假设y的衍生物是 y的对数即lny,那么就可以得到对数线性回归模型:lny=wTx+blny=wTx+blny=w^{T}x+b , 也就是让模型 去逼近 lny,而不是y。也可以对lny=wTx+blny=wTx+blny=w^{T}x+b 做一下变换就变成了 y=ewTx+by=ewTx+by=e^{w^{T}x+b},也可以理解为让 ewTx+bewTx+be^{w^{T}x+b} 去逼近y。形式上还是线性回归的,但实质上已是在求取输入空间到输出空间的非线性函数映射。如图:

来思考一个问题
想从线性模型出发,去扩展线性模型,就是让线性模型f(x)=wTx+bf(x)=wTx+bf(x)=w^{T}x+b 去拟合y的衍生物,那么我们常说的逻辑回归(对数几率回归)是怎么从线性模型演变而来的呢?是让wTx+bwTx+bw^{T}x+b 去拟合哪一种“y的衍生物” 什么呢?这个可以思考思考后,请看下篇:逻辑回归

【机器学习-西瓜书】三、线性回归;对数线性回归相关推荐

  1. 小白学机器学习西瓜书-第三章对数几率回归

    小白学机器学习西瓜书-第三章对数几率回归 3.3 对数几率回归 3.3.1 对数几率函数 3.3.1 估计参数 上一部分我们介绍了线性回归,包括简单的二元回归和多元回归,这两个主要解决的是拟合预测的问 ...

  2. 周志华-机器学习西瓜书-第三章习题3.3 编程实现对率回归

    本文为周志华机器学习西瓜书第三章课后习题3.3答案,编程实现对率回归,数据集为书本第89页的数据 使用tensorflow实现过程 # coding=utf-8 import tensorflow a ...

  3. 机器学习西瓜书(周志华)第七章 贝叶斯分类器

    第七章 贝叶斯分类器 1. 贝叶斯决策论 1.1 先验分布 1.2 后验分布 1.3 似然估计 1.4 四大概率在贝叶斯分类中指代含义 1. 朴素贝叶斯 7. 课后练习参考答案 1. 贝叶斯决策论 贝 ...

  4. 机器学习西瓜书-1-2章

    学习目标: 概览机器学习西瓜书 1.2章 学习内容: 第一章 绪论 1.1 基本术语 1.2 假设空间 1.3 归纳偏好 1.4 发展历程 第二章 模型评估与选择 2.1 经验误差与过拟合 2.2 评 ...

  5. 机器学习西瓜书南瓜书 神经网络

    机器学习西瓜书&南瓜书 神经网络 1. 神经元模型 神经网络:由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实事件物体所做出的交互反应. 神经网络最基本的成分 ...

  6. 【吃瓜教程】周志华机器学习西瓜书第三章答案

    线性模型结构梳理 3.1 试析在什么情形下式3.2中不必考虑偏置项b 答案一: 偏置项b在数值上代表了自变量取0时,因变量的取值: 1.当讨论变量x对结果y的影响,不用考虑b: 2.可以用变量归一化( ...

  7. 机器学习-西瓜书、南瓜书第三章

    线性模型 基本形式 一.线性回归 回归任务最常用的性能度量是均方误差,因为均方误差有比较好的几何意义,对应了最常用的**"欧氏距离",最小二乘法就是基于均方误差进行模型求解的. 求 ...

  8. 机器学习-西瓜书第一、二章

    第一章:绪论 基本概念 数据集:所有数据的集合 训练集:训练样本的集合 属性(特征):某事物或对象在某方面表现的性质 属性值:属性的取值 属性空间/样本空间/输入空间:属性张成的空间 泛化能力:学得模 ...

  9. 机器学习西瓜书学习——绪论

    在我们日常生活中,我们有时候会根据自己的生活经验,对即将发生的事进行预估.当我们有了足够多的经验,我们就可以对一些情况做出有效的决策.比如说"朝霞不出门 晚霞行千里",就是根据我们 ...

  10. 机器学习-西瓜书、南瓜书第六章

    支持向量机 支持向量机(Support Vector Machine),简称SVM,是一种经典的二分类模型,属于监督学习算法. 一.间隔与支持向量 支持向量机的目标是确定一个对样本的分类结果最鲁棒的线 ...

最新文章

  1. Python高级技巧:用一行代码减少一半内存占用!
  2. Swift之高德地图自定义标注弹出气泡样式
  3. Java:POI方式实现Word转html/htm
  4. HTML实现跳转到页面指定位置
  5. 洛谷 P1024 一元三次方程求解
  6. 用Transformer完全代替CNN:AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE
  7. 牛客练习赛71E-神奇的迷宫【点分治,NTT】
  8. 学习日常笔记day11cookie及session
  9. python-同步(互斥)锁、递归锁、同步条件(event)
  10. 图 矩阵 两点间有m的路径 矩阵乘法_代数图论I: 基本理论和无向图的同调
  11. 阿里云linux主机更新hostname
  12. ASP.NET MVC 不能加载项目的解决办法
  13. 3、RH850端口说明及及复用功能配置
  14. Access入门之索引查询
  15. 常见物联网通信技术概览(全集)
  16. 服务器装系统就蓝屏怎么办,安装系统出现蓝屏,怎么办?
  17. Application Server was not connected Unable to ping server at localhost:1099
  18. 【题解】[CQOI2009] 循环赛
  19. 冯诺依曼计算机结构的中心,冯·诺依曼计算机是以什么为中心的
  20. 迄今最精准人脸数字模型,任意 2D 照片转换逼真3维人脸(转)

热门文章

  1. DirectX9.03D Direct3D初始化
  2. 怎么用eclipse修改web工程的访问路径
  3. python第六篇文件处理类型
  4. [USACO4.1]麦香牛块Beef McNuggets By cellur925
  5. CSS定位属性(position)
  6. 数据库优化之mysql【转】
  7. Linux环境安装配置Swftools
  8. ubuntu 命令记忆
  9. java GC的优化
  10. spring.xml从外部文件引入数据库配置信息