http://blog.csdn.net/ppn029012/article/details/8908104

机器学习 --- 2. 从最大似然再看线性回归(转)

分类: 数学 机器学习2013-05-10 00:34 3672人阅读 评论(15) 收藏 举报
MLE机器学习

目录(?)[+]

从最大似然再看线性回归

1. 线性回归的回顾

上一节我们尝试解决“房价与房子大小”之间关系的时候,使用了线性回归去拟合一个线性的方程,使得这个线性方程与所获得的房价房大小数据最大限度地吻合。

所以,我们的问题的解决思路是,

  • 把数据当成事实

  • 用一个特定的模型(e.g.线性方程或非线性方程)去匹配数据

这些数据被当成了上帝,而让我们用模型去匹配他们。数据就是事实,当误差很大时,只能说明模型不够好,仍需努力来匹配我们的数据。

2. 换个角度看线性回归

刚才是数据是事实,换个角度来看,数据应该是事实的一个表现。也就是”房价数据”应该是“房价与房子大小关系”的一个表现。现在假设北京某地房价和房子大小之间关系已经确定了

房价=房子大小*500,

但是我们不知道,现在拿到了5个数据,

(500, 1),   (502, 1), (1510, 3), (1120, 2), (1500, 2). 会发现这5个数据并不符合关系。这是为什么,这是因为这些数据里面并不仅仅包含了"房价”与"房子大小”之间的关系,还很可能包含了, "房价”与“新旧”,“房屋”与“朝向”,“房屋”与“小区环境”...等等各种因素,而且这些因素很可能是可以观察到,也有可能是观察不到的。

所以说想完美准确的预测房价与房子大小的关系是有可能的!! 只要找出所有影响房价的因素.

找到所有影响房价的因素这是不可能的!! 所以我们可能勉为其难,只需要一个最近似的关系就好了,所以只要把其他因素都看成是一些与房子大小无关的小噪声就好了。于是,

y就是我们的房价,f(x)就是房价与房子大小之间的关系,\epsilon就是一些与房子大小无关的小噪声,当然,因为\epsilon是一个随机的东西,我们可以用随机变量E来表示它,

3.最大似然

无论如何, 现在我们有了一串X,Y,就可以尝试地找出一个最有可能的f(x)去拟合数据了。

什么叫最有可能?

假如有M个f(x), 那么我们需要评估哪个模型最有可能产生这一串数据D (Y, X). 可能性应该用概率来表示,

是f(x)的参数, 如果这些数据与数据之间是独立的,就有

下面这个方程,表示了模型产生数据X,Y的可能性

因为X,Y已经确定了,现在要使得可能性最大,我们只能通过调整的值了。

对任意一个数据,(xi, yi),我们可以计算

现在要计算一个模型产生数据的可能性,我们只要知道这个模型预测值与实际值之间的误差,和这个噪声随机变量E的分布就可以了。

解决最大似然问题的流程

到这,问题已经可以解决了,也就是,对于已有的数据D(X,Y)和任意一个参数为的f(x),找到最好的参数我们需要,

  1. 选择一个模型f(x), 和初始化其参数

  2. 估测噪声随机变量E的分布情况(e.g. 均匀分布,高斯分布...), 得到Likelihood表达式

  3. 计算Likelihood函数, 并调整使得Likelihood达到最大

调整的方法可以使用像前一章中介绍的“导数下降法”,当然也可以直接找极值点(导数为0)来得到其极大极小值。

Likelihood 函数会随着模型f(x)的选择和噪声随机变量E的选择出现不同的情况。下面就由我展示一下,最大似然怎么与前面两位回归(线性回归(Linear Regression)和分类回归(Logistic Regression))联系起来的吧!

4. 最大似然变身线性回归

这时候,模型我选 f(x) = ax + b,  噪声随机变量 E一个正态分布N(0,2).

要让Likelihood最大,只需要把最小化就好了。啊啊啊!这个公式熟悉么? 这正是前面线性回归的cost函数吗?原来线性回归只是最大似然的一种特殊情况!

5. 最大似然与分类

这时候,模型我选f(x)=, 这时随机噪声变量的分布就不再是高斯分布了,是一个极其复杂的分布。但是幸运的是,我们可以得到Likelihood的表达式, 因为

统一一下这个式子,

于是有,

最后可以看到,这个Likelihood函数变成了,分类回归中的cost函数的取负。所以最大化Likelihood就等同于最小化分类回归中的cost函数。

以上两类问题,线性回归和分类回归,都可以由最大似然估计法推导而来,说明了最大似然估计法是一种更普适的描述模型匹配的方法。

机器学习 --- 2. 从最大似然再看线性回归(转)相关推荐

  1. 从最大似然再看线性回归

    原址 1. 线性回归的回顾 上一节我们尝试解决"房价与房子大小"之间关系的时候,使用了线性回归去拟合一个线性的方程,使得这个线性方程与所获得的房价与房大小数据最大限度地吻合. 所以 ...

  2. 《机器学习笔记(三):多元线性回归与正态分布最大似然估计》

    回归问题普遍讨论的是多元线性回归,考虑多个特征可以得到更精确的模型,这其中涉及中心极限定理,正态分布,概率密度函数和最大似然估计. (一)背景--多元线性回归 1.概念 本质上就是算法(公式)变换为了 ...

  3. 吴恩达《机器学习》学习笔记二——单变量线性回归

    吴恩达<机器学习>学习笔记二--单变量线性回归 一. 模型描述 二. 代价函数 1.代价函数和目标函数的引出 2.代价函数的理解(单变量) 3.代价函数的理解(两个参数) 三. 梯度下降- ...

  4. OpenCV学习笔记(四十一)——再看基础数据结构core OpenCV学习笔记(四十二)——Mat数据操作之普通青年、文艺青年、暴力青年 OpenCV学习笔记(四十三)——存取像素值操作汇总co

    OpenCV学习笔记(四十一)--再看基础数据结构core 记得我在OpenCV学习笔记(四)--新版本的数据结构core里面讲过新版本的数据结构了,可是我再看这部分的时候,我发现我当时实在是看得太马 ...

  5. 吴恩达《机器学习》学习笔记四——单变量线性回归(梯度下降法)代码

    吴恩达<机器学习>学习笔记四--单变量线性回归(梯度下降法)代码 一.问题介绍 二.解决过程及代码讲解 三.函数解释 1. pandas.read_csv()函数 2. DataFrame ...

  6. 十年之后,再看数据湖

    假如有这样一种解决方案,能帮助企业实现不同数据从获取.存储,到处理再到分析这样全生命周期的管理,同时支持批量历史数据和实时流数据的处理. 想必,这对于急于向数字化,甚至是智能化转型,并渴望从数据中挖掘 ...

  7. qtdesigner怎么实现菜单栏跳转_3种公众号菜单栏设置类型,手把手教你做,不会的话那就再看一遍...

    常见的菜单栏设置怎么去设置呢?在我们的公众号左侧的菜单栏中,你可以找到我们的自定义菜单,这个功能,点击进去之后,你就可以看到菜单的内容,它可以有三种类型可选:一种叫发送消息,一种叫跳转网页,一种叫跳转 ...

  8. 长得类似铁甲小宝的机器人_铁甲小宝:小时候只顾看机器人忽略重点,长大后再看:是我太天真...

    铁甲小宝:小时候只顾看机器人忽略重点,长大后再看:是我太天真 铁甲小宝相亲大家都是看过的,作为早期的三大人特摄之一,铁甲小宝针对的完全就是儿童,小时候我们也是很喜欢这部作品,只是现在在荧幕上已经很难看 ...

  9. 机器学习 回归篇(1)——多元线性回归

    机器学习 回归篇(1)--多元线性回归 摘要 线性回归简介 python实现 运行结果及可视化 摘要 本文介绍了最基础的回归问题--多元线性回归,并通过python进行实现及可视化展示运行结果. 线性 ...

  10. android 智能指针的学习先看邓凡平的书扫盲 再看前面两片博客提升

    android 智能指针的学习先看邓凡平的书扫盲 再看前面两片博客提升 转载于:https://www.cnblogs.com/jeanschen/p/3507512.html

最新文章

  1. 使用Vue动态生成form表单的实例代码
  2. unix,linux,windows 哪个更好,更适合做服务器
  3. 第14章 结构和其他数据形式 14.12 typedef 简介
  4. 如何在mac上面看充电器的瓦数!
  5. 通俗易懂。HTTP请求行、请求头、请求体、响应行、响应头、响应体详解
  6. python中的不可变类型和可变类型
  7. Intellij Idea插件利器推荐大全
  8. leetcode238-除自身以外数组的乘积
  9. 没有计算机基础可以学python-Python入门必看篇(面向小白)想学Python只看这一篇就够了...
  10. 09: xmltodict 模块将xml格式转成json格式
  11. C#读写三菱Fx PLC 使用Fx 串口协议 读写Fx3U设备
  12. 自学-Linux-老男孩Linux77期-day5
  13. 梦幻西游手游服务器维护公告,《梦幻西游手游》10月5日维护公告 部分区服合并...
  14. python中字典的get函数是什么意思_python字典get()方法用法分析
  15. select2中文帮助文档_5款实用办公app , 石墨文档、收趣 | 发现有趣app
  16. 如何启用Ubuntu 18.04的鼠标键
  17. Spring的bean定义 2 : 通用bean定义逻辑 -- AbstractBeanDefinition
  18. 太厉害了!java老版手机游戏下载
  19. 小小滑块可笑可笑-安卓滑块验证码通杀方案研究(3)
  20. Python文本分析(精读笔记1)

热门文章

  1. Oracle 安装报错 [INS-06101] IP address of localhost...
  2. # 8.19考试总结
  3. Spring MVC-学习笔记(1)认识spring mvc
  4. spring-第十五篇之AOP面向切面编程之AspectJ框架简单应用
  5. 如何利用MongoDB打造TOP榜小程序
  6. PowerDesigner数据模型(CDM—PDM)
  7. Apache 的知识点
  8. 在Java中导出word、excel格式文件时JSP页面头的设置
  9. 一个rsync自动备份并发信通知的shell脚本
  10. JavaScript自学笔记 第5次