一、基本形式

一个示例具有d个属性x=(x1,x2...xd)。我们试图学习一个预测函数,即:

线性模型有很好的可解释性,直观地看出哪个属性的重要程度。

二、线性回归

1、代价函数(cost function)

利用最小二乘法进行参数估计:

更一般的情形是,样本有d个属性描述,试图学得:

这称为“多元线性回归”。同样利用最小二乘法。将b吸收进w的向量中,数据集D是一个m*(d+1)大小的矩阵X,每行对应一个实例,每行最后一个元素为1:

此时的误差函数

此为Frobenius范数:

常用来衡量矩阵的大小。类似向量的L2范数。当XTX为满秩矩阵或正定矩阵时:

然而,现实生活中XTX往往不是满秩矩阵,有些问题中属性的个数会超过我们的样例个数,导致会解出多个w,他们都能使均方误差最小化,选择哪一个就取决于学习算法的归纳偏好。常见的做法就是引入正则化。

三、广义线性模型

他们在形式上仍然是线性回归,但是实际上可以求取输入空间到输出空间的非线性函数映射。

对数几率回归就是其中的一种。它基于对数几率函数:

带入广义线性模型的通式得到:

变化成:

将y视为样本x作为正例的可能性,则1-y是其反例可能性,两者的比值是:

称上式为“几率(odds)”,对几率取对数得到的是“对数几率(log odds 亦称logit)”:

对数几率回归实际上是一种分类学习方法。对参数w和b的计算可以使用“极大似然法”。于是,重写上式得:

显然有:

       

得到我们的对数似然函数:

令:p1=p(y=1|x),p0=p(y=0|x),重写似然项:

其中x'和β是之前说过的吸收了b的w向量(增广矩阵),带入对数似然函数:

推导过程:

然后取反,那么,最大化log likelihood就相当于最小化上式。可以使用经典的数值优化算法,例如梯度下降法,牛顿法等。

转载于:https://www.cnblogs.com/melina-zh/p/9760943.html

西瓜笔记(五上)--线性模型相关推荐

  1. 吴恩达《机器学习》学习笔记五——逻辑回归

    吴恩达<机器学习>学习笔记五--逻辑回归 一. 分类(classification) 1.定义 2.阈值 二. 逻辑(logistic)回归假设函数 1.假设的表达式 2.假设表达式的意义 ...

  2. StackExchange.Redis学习笔记(五) 发布和订阅

    StackExchange.Redis学习笔记(五) 发布和订阅 原文:StackExchange.Redis学习笔记(五) 发布和订阅 Redis命令中的Pub/Sub Redis在 2.0之后的版 ...

  3. ROS学习笔记五:理解ROS topics

    ROS学习笔记五:理解ROS topics 本节主要介绍ROS topics并且使用rostopic和rqt_plot命令行工具. 例子展示 roscore 首先运行roscore系列服务,这是使用R ...

  4. 《MFC游戏开发》笔记五 定时器和简单动画

    本系列文章由七十一雾央编写,转载请注明出处. http://blog.csdn.net/u011371356/article/details/9332377 作者:七十一雾央 新浪微博:http:// ...

  5. sv_labs学习笔记——sv_lab5_上(System Verilog)

    本节将介绍lab5的第一部分,主要总结一般设计学习与思考的方式与需要着重学习的点,同时以lab5作为参考,分析数据流流向,验证组件的通信与抽象化,实现的整体思路. sv_labs学习笔记--sv_la ...

  6. 【CS231n】斯坦福大学李飞飞视觉识别课程笔记(四):图像分类笔记(上)

    [CS231n]斯坦福大学李飞飞视觉识别课程笔记 由官方授权的CS231n课程笔记翻译知乎专栏--智能单元,比较详细地翻译了课程笔记,我这里就是参考和总结. [CS231n]斯坦福大学李飞飞视觉识别课 ...

  7. 《MSSQL2008技术内幕:T-SQL语言基础》读书笔记(上)

    索引: 一.SQL Server的体系结构 二.查询 三.表表达式 四.集合运算 五.透视.逆透视及分组 六.数据修改 七.事务和并发 八.可编程对象 一.SQL Server体系结构 1.1 数据库 ...

  8. Python学习笔记五:控制语句

    Python学习笔记五:控制语句 Pycharm 开发环境的下载安装配置_项目管理 控制语句 Pycharm 开发环境的使用 Pycharm 下载和安装 激活和选择不同UI 风格 创建项目和初始化配置 ...

  9. 论文阅读笔记(五)——狐猴识别系统:一种便于狐猴个体识别的面部识别系统

    论文阅读笔记(五)--狐猴识别系统:一种便于狐猴个体识别的面部识别系统 论文简介 论文中文翻译:狐猴识别系统:一种便于狐猴个体识别的面部识别系统 论文名称:<LemurFaceID: a fac ...

最新文章

  1. Altium Designer修改3D视图时PCB板的颜色
  2. 每日一皮:当我突然有一个很棒的调试想法...
  3. 极虎病毒创造四个“之最”
  4. BS的data-toggle/data-target
  5. java 二进制 归属权限_【Java EE 学习 75 上】【数据采集系统第七天】【二进制运算实现权限管理】【权限分析和设计】...
  6. 清除Linux终端命令的历史记录
  7. Windows Phone 7 Silverlight控件展示(含34个控件)
  8. 应用程序的SQL查询原理
  9. 变位齿轮重合度计算公式_求变位齿轮的变位系数计算公式。
  10. WordPress仿站工具构建网页时踩坑
  11. CDA Level1 考试心得
  12. 网吧的监控系统和服务器如何连接,网吧监控系统安装解决方案
  13. python修改pdf文字_以编程方式更改PDF中文本的字体颜色
  14. 到全国各省市关于公务员考试的信息
  15. 股票交易成本有哪些费用?
  16. FlowNet:使用卷积网络学习光流
  17. 科普 | 什么是ChatGPT?试用ChatGPT,ChatGPT的启示!
  18. 公众号被处罚后排名下滑
  19. 计算机核心期刊排名及投稿经验
  20. Linux学习(四)

热门文章

  1. vue3 中使用动画技术
  2. java增强connection类_关于DriverManager.getConnection()里的增强实现
  3. sql sum求和 值小于不显示_mysql中sum求和等类似方法关于null值的处理
  4. java generatedvalue_java-@GeneratedValue和@GenericGen之间的区别
  5. column分栏布局只是文字布局吗_CSS3 column 分栏
  6. R语言︱噪声数据处理、数据分组——分箱法(离散化、等级化)
  7. SAS 9.4 的sid问题解决方案汇总(头疼...)
  8. 随笔︱MRO-Microsoft R Open使用心得与相应内容总结
  9. 数据结构与算法14-栈和队列练习题
  10. anguar4 共享服务在多个组件中数据通信