吴恩达的课程会很偏于用实例来掌握理论知识,不过看着还是有些云里雾里,倒是杉山将的《图解机器学习》介绍得更易懂些。

在此进行结合学习。

杉山将是这么通俗地定义监督学习、无监督学习和强化学习,它们是机器学习的主要种类:
  • 监督学习:

有求知欲的学生从老师那里获取知识、信息,老师提供对错指示、告知最终答案的学习过程。在机器学习里,学生对应于计算机,老师则对应于周围的环境。 根据在学习过程中所获得的经验、技能,对没有学习过的问题也可以做出正确解答,使计算机获得这种泛化能力,是监督学习的最终目标。

监督学习,在手写文字识别、声音处理、图像处理、垃圾邮件分类与拦截、网页检索、基因诊断以及股票预测等各个方面,都有着广泛的引用。

这类机器学习的典型任务包括:预测数值型数据的回归、预测分类标签的分类、预测顺序的排序等。

简单而言,就是初高中时上课,老师上课教知识点讲过程,学生不仅学会了,还能够举一反三。

  • 无监督学习:

在没有老师的情况下,学生自学的过程。

在机器学习里,基本都是计算机在互联网中自动收集信息,并从中获取有用信息。无监督学习不仅仅局限于解决像监督学习那样的有明确答案的问题,因此,它的学习目标可以不必十分明确。

无监督学习在人造卫星故障诊断、视频分析、社交网站解析和声音信号解析等方面大显身手的同时,在数据可视化以及作为监督学习方法的前处理工具方面,也有广泛的应用。

这类机器学习的典型任务有聚类、异常检测等。

  • 强化学习

是指在没有老师提示的情况下,自己对预测的结果进行评估的方法。通过这样的自我评估,学生为了获得老师的最高嘉奖而不断地进行学习。

强化学习被认为是人类主要的学习模式之一。

强化学习,在机器人的自动控制、计算机游戏中的人工智能、市场战略的最优化等方面均有着广泛应用。

在强化学习中经常会用到回归、分类、聚类和降维等各种各样的机器学习算法。

监督学习和无监督学习中的典型任务
  • 回归:把实函数在样本点附近加以近似的有监督的函数近似问题;
  • 分类:对于指定的模式进行识别的有监督的模式识别问题;
  • 异常检测:寻找输入样本中所包含的异常数据的问题;
  • 聚类:与分类问题相同,也是模式识别问题,但是属于无监督学习的一种;
  • 降维:从高维度数据中提取关键信息,将其转换为易于计算的低维度问题进而求解的方法。

第三节:听吴恩达讲监督学习

假设想要预测房价

前不久,一个学生从俄勒冈的波特兰市收集数据,假设绘制了一个数据集,如下所示:

  • 横轴:不同房子的平方英尺
  • 纵轴:代表房子价格,单位是千美元

那么,假设你的朋友有一栋 750 平方英尺的房子,他想要卖掉这个房子,想知道能卖多少钱,学习算法能如何帮助我们?

吴恩达表示,学习算法能做到的一件事就是,根据数据画一条直线,或者说就是用一条直线拟合数据,基于此可以推测房子大概能卖 15 万美元:


不过,这并不是能使用的唯一的学习算法,还有一个更好的:例如除了用一条直线拟合数据,还可以用二次函数或二阶多项式(即二次方程)来拟合数据会更好。

根据二次方程的曲线,如下所示,我们可以在这个点推测出,能卖接近 20 万美元。


那么,摆在面前的有两种方案,如何选择,如何决定?是用直线还是用二次函数来拟合数据?后面会具体讨论。

监督学习是指我们给算法一个数据集,其中包含了正确答案。

在这个例子中,我们给出了一个房价数据集,在这个数据集中每个样本,我们都给出正确的价格,即这个房子的实际卖价。算法的目的就是给出更多的正确答案,例如为朋友想要卖掉的这所房子给出估价。

用更专业的术语定义,这就是「回归问题」。

这里的回归问题指的是:我们想要预测连续的数值输出(即价格),一般房子的价格会记到美分,因此价格实际上是一个离散值,但通常我们认为房价是一个实数、标量或连续值。「回归」这个术语是指我们设法预测连续值的属性。

第二个例子:推测肿瘤良性与否

假设你想看医疗记录,并且设法预测乳腺癌是恶性的还是良性的。假设有人发现了一个乳腺肿瘤,恶性的就是有害并十分危险,良性的就是无害的。我们来看收集到的数据集,假设在数据集中,横轴是肿瘤的尺寸,纵轴 0 和 1 分别代表 No 和 Yes,即不是或是恶性肿瘤,恶性(1),良性(0)。

假设我们的数据集就像这样 —— 在 0 的位置有 5 个样本,在 1 的位置也有 5 个样本。

这时,有个朋友很不幸地患了乳腺肿瘤,假设她的乳腺肿瘤的大小可能在下图这个值的附近,机器学习的问题就是,你能否估计出肿瘤是良性还是恶性的概率?用更专业的术语来讲,这就是一个分类问题。

吴恩达《机器学习系列课程》学习笔记(二):监督学习相关推荐

  1. 吴恩达机器学习系列课程--个人笔记

    网址:https://www.bilibili.com/video/av50747658/ (b站找的有中文字幕的视频) 第一周 一.引言 1.1 欢迎 1.2 机器学习是什么 1.3 监督学习 1. ...

  2. 下载量过百万的吴恩达机器学习和深度学习笔记更新了!(附PDF下载)

    今天,我把吴恩达机器学习和深度学习课程笔记都更新了,并提供下载,这两本笔记非常适合机器学习和深度学习入门.(作者:黄海广) 0.导语 我和同学将吴恩达老师机器学习和深度学习课程笔记做成了打印版,放在g ...

  3. 吴恩达机器学习系列课程笔记——第十一章:机器学习系统的设计(Machine Learning System Design)

    11.1 首先要做什么 https://www.bilibili.com/video/BV164411b7dx?p=65 在接下来的视频中,我将谈到机器学习系统的设计.这些视频将谈及在设计复杂的机器学 ...

  4. 吴恩达机器学习系列课程笔记——第十六章:推荐系统(Recommender Systems)

    16.1 问题规划 https://www.bilibili.com/video/BV164411b7dx?p=96 在接下来的视频中,我想讲一下推荐系统.我想讲推荐系统有两个原因: 第一.仅仅因为它 ...

  5. 吴恩达机器学习系列课程笔记——第五章:Octave教程(Octave Tutorial)

    提示:这章选学,可以去学python,第六节可以看看. 5.1 基本操作 https://www.bilibili.com/video/BV164411b7dx?p=26 本章学习以种编程语言:Oct ...

  6. 吴恩达机器学习系列课程笔记

    视频资源获取:https://www.bilibili.com/video/BV164411b7dx?p=1 有监督学习:给算法包含正确答案的数据集,算法的任务就是根据数据集给出更多的正确答案. 回归 ...

  7. Machine Learning - Coursera 吴恩达机器学习教程 Week1 学习笔记

    机器学习的定义 Arthur Samuel 传统定义 Arthur Samuel: "the field of study that gives computers the ability ...

  8. Machine Learning - Coursera 吴恩达机器学习教程 Week5 学习笔记

    神经网络的代价函数 定义 L = 神经网络总层数 sl = 第l层的单元数(不包含bias unit) K = output units/classes的数量 普通逻辑回归代价函数: 神经网络代价函数 ...

  9. 吴恩达机器学习系列课程作业ex3 matlab实现

    目录 Matlab实现: lrCostFunction.m oneVsAll.m predictOneVsAll.m predict.m Matlab实现: lrCostFunction.m func ...

  10. 吴恩达机器学习系列理论加实践(二 、单变量线性回归及matlab实践)

    二.单变量线性回归 2.1模型表示 同样以之前的房屋价格预测实例开始: 通过学习算法利用训练集训练模型h,对于新输入的数据size of house就可以输出其预测值price: 如何表达这个模型h: ...

最新文章

  1. 霸榜COCO和Cityscapes!南理工CMU提出极化自注意力,更精细的双重注意力建模结构
  2. 【Linux】一步一步学Linux——visudo命令(104)
  3. DEBUG_NEW和THIS_FILE
  4. c++ 两个多边形区域重叠_2018 年英国中级数学挑战赛中的多边形问题
  5. seaborn pairplot ax_强者致胜 AX电竞叛客RTX3070显卡发布_
  6. 刚刚,任正非为姚安娜商标事件道歉
  7. [计蒜客]T1853 非常男女
  8. 人只会听到他想听的话——与领导甲的一次谈话
  9. 计算机c盘坏了,电脑c盘损坏,怎样修复?
  10. 基于Qt的抽奖小程序
  11. Office2010安装相关问题及解决方法
  12. 如何用WGDI进行共线性分析(三)
  13. Office之word如何把尾注的上标加括号,尾注里的上标改为普通数字
  14. 20145306 信息安全系统设计基础 第五周博客总结
  15. 回顾过去,展望未来 —— web唐和诚
  16. Java 小型图书馆管理系统
  17. C语言LMS双麦克风消噪算法,基于两个时域LMS算法双麦克风系统分析.doc
  18. Distill文章-A gentle introduction to graph Neural Networks(图神经网络是怎么构造的)
  19. 将项目上传至GitHub
  20. 采用预训练模型来训练新的模型

热门文章

  1. 计算机在识字教学中的应用,信息技术在小学语文低年级识字教学中的运用(刘琳、罗冬晴)...
  2. DSP仿真器(SEED-XDS510plus在CCS5.5上的安装)
  3. 计算机速录专业论文,试论现代汉语拼音在计算机速录技术中的应用
  4. Nginx总结(2)—Nginx的反向代理
  5. Android自定义View绘制流程
  6. Android 声音录制音量调节
  7. 使用 NSIS 制作软件安装包
  8. 金融基础概念--股票
  9. JavaScript---解决单击、双击鼠标冲突
  10. win10输入法不显示候选词框解决方法