目录

1)Learning is Impossible

2)Probability to the Rescue

3)Connection to Learning

4)Connection to Real Learning


上节课我们主要介绍了机器学习问题的类型,主要是二元分类和回归问题。本节课,我们将学习机器学习的可行性,讨论我们研究的问题是否可以使用机器学习来解决。


注:本节课内容有点稍稍难理解。

1)Learning is Impossible

首先,我们看下面这样一个游戏。下面六6个九方格,根据这6个样本我们来推断出右边的九方格的标签是(-1)还是(+1)?可以看出,根据不同的特征进行分类,得到的结果完全不同。所有的分类可以说是合理的,也可以说是不合理的。

再来看一个例子,下图中输入特征是二进制形式。训练样本有5个,那么根据已有的样本输出,假设有8个hypothesis。这8个hypothesis对5个训练样本的分类效果完全正确,但是在另外3个数据上,表现有好有坏。

这个例子告诉我们,我们似乎不能在D以外的数据中准确预测目标。这就告诉我们没有任何一个算法可以在任何领域总是产生最准确的学习器。我们平时听到一个算法“很好”,也只是针对具体问题的具体应用。机器学习没有放之四海皆有效的算法。


2)Probability to the Rescue

从上一节得出结论:在训练集D以外的数据上,机器学习是很难做到正确预测和分类的。但还是有一些工具能够帮助我们做出合理的推论。

看下面一个例子,一个罐子中装满了橙色和绿色的小球。我们能否推断出橙色球的比例u?统计学的做法是这样的:随机取出N个样本,计算N各样本中橙色球的比例v,就估计橙色球的比例为v。


3)Connection to Learning

我们把上节的内容和机器学习联系起来。

  • 机器学习的hypothesis就是我们要求得橙色球概率。
  • 橙色球表示h(x)和f不相等;
  • 绿色求表示h(x)和f相等。
  • 罐子里的玻璃球就是我们的样本空间X,
  • 从罐子中取出N个球相当于训练样本D,样本都是独立同分布的。

我们引入两个值。分别表示样本中,h(x)与y不相等的概率和实际样本中不相等的概率。


4)Connection to Real Learning

假设我们有多个hypothesis。对不同的数据集,表现有好有坏。我们认为对应的数据集是BadData。我们规定对于所有的hypothesis数据集都是好的,数据集D才是好的。

如果hypothesis的个数M是有限的,N足够大,那么通过演算法A任意选择一个g。都有

下图是我们的学习流程图。

本节课我们学到了:

4)机器学习基石笔记 Lecture4:Feasibility of Learning相关推荐

  1. 林轩田机器学习基石笔记3—Types of Learning

    上节课我们主要介绍了解决线性分类问题的一个简单的方法:PLA.PLA能够在平面中选择一条直线将样本数据完全正确分类.而对于线性不可分的情况,可以使用Pocket Algorithm来处理.本节课将主要 ...

  2. 机器学习基石笔记 Lecture 1: The Learning Problem

    Lecture 1: The Learning Problem what is machine learning? 人类的学习: 机器学习: why use machine learning? 机器具 ...

  3. 机器学习基石笔记5——为什么机器可以学习(1)

    转载请注明出处:http://www.cnblogs.com/ymingjingr/p/4271742.html 目录 机器学习基石笔记1--在何时可以使用机器学习(1) 机器学习基石笔记2--在何时 ...

  4. 1)机器学习基石笔记Lecture1:The Learning Problem

    网上关于机器学习的课程有很多,其中最著名的是吴恩达老师的课程,最近又发现了NTU林轩田老师的<机器学习基石>课程,这门课也很好.课程总共分为4部分,总共分为16节课,今天来记录第一节课. ...

  5. 机器学习基石第一讲:the learning problem

    博客已经迁移至Marcovaldo's blog (http://marcovaldong.github.io/) Andrew Ng的Machine Learning比較简单,已经看完.林田轩的机器 ...

  6. 机器学习基石笔记(三):学习的类型

    文章目录 Lecture 3: Types of Learning Learning with Different Output Space $Y$ Fun Time Learning with Di ...

  7. 机器学习基石笔记(六):泛化理论

    文章目录 Lecture 6: Theory of Generalization Restriction of Break Point Fun Time Bounding Function: Basi ...

  8. 3)机器学习基石笔记 Lecture3:Types of Learning

    目录 1)Learning with Different Output Space Y 2)Learning with Different Data Label 3)Learning with Dif ...

  9. 2)机器学习基石笔记Lecture2:Learning to Answer Yes/No

    目录 0.上节回顾 1. Perceptron Hypothesis Set 2. Perceptron Learning Algorithm(PLA)(重点) 3. Guarantee of PLA ...

最新文章

  1. 一份邀请函引发的中国芯片新猜想
  2. iOS ----------怎么修改xcode默认打开方式
  3. 好文章系列(都是网上非常好的文章)
  4. 威盾VIACONTROL远程监控注册机及试用手记
  5. Linux 与 Windows 计算文件夹大小
  6. 偏相关分析在python上的实现(支持栅格数据)
  7. 【源码】基于粒子群算法的MPPT跟踪
  8. 单点登录系统设计分析
  9. Eplan 3D安装板布局步骤(快速上手)
  10. alc662声卡注入id_ALC662声卡Linux提取文件.doc
  11. 界门纲目科属种的英文——学生物的基础
  12. 指纹登录 TouchID FaceID
  13. yolov5方框的颜色及粗细更改
  14. ORA-27072、ORA-27072错误解析
  15. 安科瑞配电列头柜产品XXX数据中心案例分享
  16. chrome源代码目录结构简介(版本4.1.249.1059)
  17. IS_ERR()宏是什么意思
  18. PyTorch中nn.ReLU(inplace=True)中inplace=True有什么用
  19. 高山养羊也可以运用GPS卫星定位系统
  20. 计算机复试问题总结(一)

热门文章

  1. android 组件化_Android 组件化路由框架设计(仿Arouter)
  2. html代码 打开本地文件,打开本地HTML文件
  3. 1037C. Equalize
  4. php 显示当前年月日时分秒,php 获取当前前后年、月、星期、日、时分秒的时间...
  5. java延迟覆盖_高效Java第九条覆盖equals时总要覆盖hashCode
  6. RT-Thread I2C设备驱动框架的对接使用
  7. 3-5 单链表分段逆转 (20 分)
  8. 【复习】使用 SQLiteDatabase 操作 SQLite 数据库
  9. 交叉渡线道岔规格_交叉渡线铁路道岔的型号及选用
  10. mysql skip_counter_mysql的三个故障解决小结