吴恩达《机器学习》学习笔记一

  • 一、 什么是机器学习?
  • 二、监督学习
  • 三、无监督学习

初识机器学习
这是个人学习吴恩达《机器学习》课程的一些笔记,供自己和大家学习提升。第一篇内容较少,日后继续加油。

课程链接:https://www.bilibili.com/video/BV164411b7dx?from=search&seid=5329376196520099118

一、 什么是机器学习?

机器学习一直没有一个官方固定的定义。但课中给出了两种解释,个人认为非常经典,易于理解。

定义一:Field of study that gives computers the ability to learn without being explicitly programmed.—— Arthur Samuel(1959) 即无需明确编程,就使得计算机有学习能力的研究领域。

值得一提的是,阿瑟.塞缪尔(Arthur Samuel)在此之前(1952年)研发出了第一个计算机跳棋程序,它是世界上第一个可以自主学习的程序。通过和该跳棋程序不断的下棋,使得该程序的跳棋技巧不断得到提升,最终甚至超过了人类水平,这是机器学习早期一个非常经典的案例。

定义二:A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E. 即计算机程序从经验E上学习来处理任务T,且P为性能评估,如果在T上,由P衡量的性能随着经验E的学习而提高,这就是机器学习。

下面看一个课中给出的定义二的例子:

这是一个邮件分类问题,基于已知邮件是否为垃圾邮件的信息,来优化邮件分类系统。此处选项一:把邮件分类为垃圾或正常邮件是机器学习的T;选项二:观察你标记的邮件是垃圾还是正常是机器学习的E;选项三:正确分类邮件的数量是机器学习的P。

此外,机器学习有其分类,主要分为如下三类:

机器学习分类 具体算法举例
监督学习 线性回归、SVM、决策树等
无监督学习 聚类、密度估计等
其他:强化学习、推荐系统等 -待学习-

所以下面分别讨论了基本的监督学习和无监督学习。

二、监督学习

监督学习的特点是,学习数据都是有标注的。如经典的房价预测案例,它的数据集中数据样本不仅给出了各自的属性值,还给出了具体的房价大小,而这个房价大小就是所谓的标注,也就是需要预测的属性,模型从带有标注的数据中学习,随后对新的数据预测其标签值。如下图所示是房价预测的一个示例。

图中为简单起见,只考虑了房子的一个属性:面积(feet2),而实际还需要考虑很多其他属性如:朝向、地段等。红色的×表示已知的一批带有标注的数据,要从这些数据中学习得一种模型,使得后续预测的值比较真实,红色的直线是一次函数模型,蓝色的曲线是更复杂的模型,目标都是尽可能地模拟所有数据模型选择的好坏,也会对预测有很大的影响(此处蓝色的模型看起来要比红色的好)。若已得到一个模型,则新给出一个输入如:房屋面积为750feet2,根据模型则可以得到预测房价为多少。

此外,房价预测也是回归问题的一个实例,所谓回归,就是预测值是连续值,此处房价是一个连续值,所以是一个回归问题。
与此对应,若预测值是离散的,则被称为分类问题,如上述提到的邮件分类,预测值只有垃圾邮件和正常邮件两个值。如下图所示,是根据肿瘤尺寸这个属性来对乳腺肿瘤进行分类的数据,标签值只有0(良性)和1(恶性)两种。

往往不止通过一个属性进行学习,还可能通过细胞尺寸均匀度、细胞形状均匀度、患者年龄等许多属性来进行学习。

三、无监督学习

无监督学习与监督学习相对,当学习数据不带有标签时,就可以看成是无监督学习,也可以理解为没有正确答案的学习。无监督学习在做的,更多的是找出数据之间的相似相关性。如下图所示,x1和x2是数据的两个属性,数据不带有标签,无监督学习会寻找数据之间的相似性,将无标注的数据划分为一个个的簇。

吴恩达《机器学习》学习笔记一——初识机器学习相关推荐

  1. 吴恩达深度学习笔记——结构化机器学习项目(Structuring Machine Learning Projects)

    深度学习笔记导航 前言 传送门 结构化机器学习项目(Machine Learning Strategy) 机器学习策略概述 正交化(orthogonalization) 评价指标 数字评估指标的单一性 ...

  2. 吴恩达深度学习笔记(四)

    吴恩达深度学习笔记(四) 卷积神经网络CNN-第二版 卷积神经网络 深度卷积网络:实例探究 目标检测 特殊应用:人脸识别和神经风格转换 卷积神经网络编程作业 卷积神经网络CNN-第二版 卷积神经网络 ...

  3. Machine Learning(吴恩达) 学习笔记(一)

    Machine Learning(吴恩达) 学习笔记(一) 1.什么是机器学习? 2.监督学习 3.无监督学习 4.单变量线性回归 4.1代价函数 4.2 梯度下降 5.代码回顾 最近在听吴恩达老师的 ...

  4. 吴恩达深度学习 | (15) 结构化机器学习项目专项课程第二周学习笔记

    课程视频 第二周PPT汇总 吴恩达深度学习专项课程共分为五个部分,本篇博客将介绍第三部分结构化机器学习项目专项的第二周课程:机器学习(ML)策略(2) . 目录 1. 进行误差分析 2. 清除标注错误 ...

  5. 799页!吴恩达深度学习笔记.PDF

    吴恩达深度学习课程,是公认的最优秀的深度学习课程之一,目前没有教材,只有视频,本文提供完整笔记下载,这本笔记非常适合和深度学习入门. 0.导语 黄海广博士和同学将吴恩达老师深度学习视频课程做了完整的笔 ...

  6. 吴恩达深度学习笔记——卷积神经网络(Convolutional Neural Networks)

    深度学习笔记导航 前言 传送门 卷积神经网络(Convolutional Neural Networks) 卷积神经网络基础(Foundations of Convolutional Neural N ...

  7. 吴恩达深度学习笔记——神经网络与深度学习(Neural Networks and Deep Learning)

    文章目录 前言 传送门 神经网络与深度学习(Neural Networks and Deep Learning) 绪论 梯度下降法与二分逻辑回归(Gradient Descend and Logist ...

  8. 【深度学习】吴恩达深度学习-Course3结构化机器学习项目-第一周机器学习(ML)策略(1)作业

    题目仅含中文!! 视频链接:[中英字幕]吴恩达深度学习课程第三课 - 结构化机器学习项目 参考链接: [中英][吴恩达课后测验]Course 3 - 结构化机器学习项目 - 第一周测验 吴恩达< ...

  9. 吴恩达深度学习笔记1-Course1-Week1【深度学习概论】

    2018.5.7 吴恩达深度学习视频教程网址 网易云课堂:https://mooc.study.163.com/smartSpec/detail/1001319001.htm Coursera:htt ...

  10. 吴恩达深度学习笔记_Github标星过万的吴恩达机器学习、深度学习课程笔记,《统计学习方法》代码实现,可以在线阅读了!...

    吴恩达机器学习.深度学习,李航老师<统计学习方法>,可以说是机器学习入门的宝典.本文推荐一个网站"机器学习初学者",把以上资源的笔记.代码实现做成了网页版,可以在线阅读 ...

最新文章

  1. 今天有点时间,想写一个小说,说说面向对象的故事,主人是人类!(一)
  2. 人工智能:第二章 知识表示方法
  3. gitlab图形化使用教程(测试过)
  4. 深度学习优化算法实现(Momentum, Adam)
  5. POI API 创建Excel 文档
  6. 解决Winform应用程序中窗体背景闪烁的问题
  7. eclipse deploy path 修改
  8. [原译]一步步教你制作WPF圆形玻璃按钮
  9. CPDA数据分析师:一个完整的数据分析流程
  10. 爬虫 第七讲 MongoDB
  11. 1.3经济金融基础之金融市场
  12. 疯狂Python讲义学习笔记(含习题)之网络编程
  13. movie起居类分类词汇
  14. 聊一下盲盒app开发 盲盒小程序开发
  15. 最小二乘法线性拟合和2次曲线拟合算法
  16. 如何成为一名合格的DBA
  17. 荒野白牡丹都有啥功效,白茶知名品牌有哪些
  18. 树莓派新手使用iobroker日志三(米家全家桶加入iobroker)
  19. 显示器接口_显示器上的Type-C接口 可能绝大多数人都不知道这么大作用
  20. 书法练字帖纸——井字格是不一样的格

热门文章

  1. mysql slow log 分析工具_mysql slow log分析工具的比较
  2. 图深度学习前沿工作汇总与解析
  3. Spring Boot中使用Spring-data-jpa让数据访问更简单、更优雅
  4. 论文浅尝 | 利用推理链进行视觉问题回答
  5. 领域应用 | 深度学习在知识图谱构建中的应用
  6. 德勤预判:2022技术七大趋势
  7. 2知识图谱的生命周期
  8. 国科大高级人工智能2-人工神经网络(MLP、Hopfield)
  9. 仅模糊背景图像而不是前面的文本
  10. 对汉诺塔递归算法的理解(图解,附完整代码实现)