写在前面

在学习Python的时候同步进行吴恩达的机器学习,就像啃书一样,有些视频也需要啃下来。为了之后更好的烟酒生活,为了更舒服地融入新的环境中,那就加油吧!吴恩达机器学习共112章,按一天2节的进度,56天可以学完,余之游将至此始,恶能无记?壬寅三月也。

DAY 1

什么是机器学习?

计算机程序从经验 E 中学习解决某个任务 T,进行某一性能度量 P,通过 P 测定在 T 上的表现因 E 而提高。(重要的三元素:任务T + 经验E + 性能P)

最主要的两类机器学习算法:

  • 监督学习: 简单来说,就是我们会教计算机做某件事情
  • 无监督学习:我们让计算机自己学习
  • 其它还有:强化学习、推荐系统

监督学习(分类、回归、有标签)

指的是给定算法一个数据集,其中包含了正确答案,算法的目的是给出更多的正确答案
案例1——房价预测)—连续值预测正确值

更专业的术语来说,这是一个回归问题
这里的回归问题指的是:我们想要预测连续的数值输出(即价格),一般房子的价格会记到美分,因此价格实际上是一个离散值,但通常我们认为房价是一个实数、标量或连续值。「回归」这个术语是指我们设法预测连续值的属性

案例2——肿瘤预测)—离散值预测正确值

更专业的术语来说,这是一个分类问题:
0—良性肿瘤 / 1—恶性肿瘤
当然也可用下方的在一条横轴上用不同类型的符号表示。,但上述2个均只考虑了肿瘤的大小来判断良性恶性

这一种有年龄和肿瘤大小2个属性,机器学习能做的就是在中间划出一条分割线来区分是否为良性的肿瘤。

概括一下:

本节课讨论了监督学习,想法是在监督学习中,对于每一个数据集中的每个样本,我们想要算法预测,并得出“正确答案”,像房子的价格、肿瘤是恶性还是良性的。
我们也讨论了回归问题,回归指的是我们的目标,是预测一个连续值输出
我们还讨论了分类问题,其目的是预测离散值输出

DAY 2

在监督学习中,每个样本都被标明为(labled)阳性样本或者阴性样本,我们已被清楚的告知了什么是正确答案(即肿瘤是良性还是恶性)。

而对于无监督学习来说,数据集具有相同标签或者没有标签,即我们不知道什么是正确答案。我们只被告知这里有一个数据集,需要在其中找到某种结构来适配这些数据

聚类算法

对于给定的数据集,无监督学习算法可能将该数据集分成两个不同的簇,这就是聚类算法 clustering algorithm

案例:谷歌新闻(通过聚类生成新闻专题)

除此以外,聚类算法还广泛用于基因检测组织大型计算机群(便于协同工作)、社交网络(哪些和你是一类人)、市场分割(把客户划分为不同细分市场)、天文数据分析(星系形成论)等

鸡尾酒会算法问题

有一个宴会,一屋子的人,因为有许多人在同时说话,有许多声音混杂在一起,你几乎很难听清你面前的人说的话。假设一个鸡尾酒会只有两个人同时说话,我们将两个麦克风放在房间里,且这两个麦克风与两个人的距离不同,每个麦克风记录了来自两人声音的不同组合。我们能做的就是把这两个录音交给一种无监督学习算法,称为 “鸡尾酒会算法 cocktail party algorithm”,让算法帮你找出数据的结构,该算法就会分离出这两个被混叠在一起的声音。

鸡尾酒会算法的 Matlab 实现:

quiz习题

第 1 题
一个计算机程序从经验E中学习任务T,并用P来衡量表现。并且,T的表现P随着经验E的增加而提高。
假设我们给一个学习算法输入了很多历史天气的数据,让它学会预测天气。什么是P的合理选择?

A. 计算大量历史气象数据的过程
B. 以上都不
C. 正确预测未来日期天气的概率
D. 天气预报任务

第 2 题
假设你正在做天气预报,并使用算法预测明天气温(摄氏度/华氏度),你会把这当作一个分类问题还是一个回归问题?

A. 分类
B. 回归

第 3 题
假设你在做股市预测。你想预测某家公司是否会在未来7天内宣布破产(通过对之前面临破产风险的类似公司的数据进行训练)。你会把这当作一个分类问题还是一个回归问题?

A. 分类
B. 回归

第 4 题
下面的一些问题最好使用有监督的学习算法来解决,而其他问题则应该使用无监督的学习算法来解决。以下哪一项你会使用监督学习?(选择所有适用的选项)在每种情况下,假设有适当的数据集可供算法学习。

A. 根据一个人的基因(DNA)数据,预测他/她的未来10年患糖尿病的几率

B. 根据心脏病患者的大量医疗记录数据集,尝试了解是否有不同类患者群,我们可以为其量身定制不同的治疗方案

C. 让计算机检查一段音频,并对该音频中是否有人声(即人声歌唱)或是否只有乐器(而没有人声)进行分类

D. 给出1000名医疗患者对实验药物的反应(如治疗效果、副作用等)的数据,发现患者对药物的反应是否有不同的类别或“类型”,如果有,这些类别是什么

第 5 题
哪一个是机器学习的合理定义?

A. 机器学习从标记的数据中学习
B. 机器学习能使计算机能够在没有明确编程的情况下学习
C. 机器学习是计算机编程的科学
D. 机器学习是允许机器人智能行动的领域

参考答案:
1、C
2、A
3、B
4、AD
5、B
(答案仅供参考,若有不同意见欢迎评论区留言指出,感谢!)

# 吴恩达 · 机器学习笔记(① Introduction to Machine Learning)相关推荐

  1. 全球名校AI课程库(2)| 吴恩达 · 机器学习专项课程『Machine Learning』

  2. 吴恩达机器学习笔记第一周

    第一周 吴恩达机器学习笔记第一周 一. 引言(Introduction) 1.1 欢迎 1.2 机器学习是什么? 1.3 监督学习 1.4 无监督学习 二.单变量线性回归(Linear Regress ...

  3. 【经典】吴恩达——机器学习笔记001

    [经典]吴恩达--机器学习笔记001 机器学习(Machine Learning)笔记001 学习地址:[中英字幕]吴恩达机器学习系列课程 文字版参考及PPT来源:Coursera-ML-Andrew ...

  4. 吴恩达机器学习笔记整理(Week6-Week11)

    1. Week 6 1.1 应用机器学习的建议(Advice for Applying Machine Learning) 1.1.1 决定下一步做什么 到目前为止,我们已经介绍了许多不同的学习算法, ...

  5. 吴恩达机器学习笔记整理(Week1-Week5)

    吴恩达机器学习笔记整理 1. Week1 1.1 什么是机器学习(What is Machine Learning) 1.2机器学习算法分类 1.3 单变量线性回归(Linear Regression ...

  6. 吴恩达机器学习笔记55-异常检测算法的特征选择(Choosing What Features to Use of Anomaly Detection)

    吴恩达机器学习笔记55-异常检测算法的特征选择(Choosing What Features to Use of Anomaly Detection) 对于异常检测算法,使用特征是至关重要的,下面谈谈 ...

  7. 吴恩达机器学习笔记:(四)矩阵、多元梯度下降

    吴恩达机器学习笔记 矩阵基础知识 矩阵逆运算 矩阵的转置 实践乘法 多元梯度下降 特征缩放 学习率α 矩阵基础知识 矩阵逆运算 矩阵的转置 实践乘法 多元梯度下降 特征缩放 学习率α 学习率的选择:

  8. 吴恩达机器学习笔记:(一)机器学习方法简介

    吴恩达机器学习笔记 Supervised Learning(监督学习) Unsupervised Learning(无监督学习) clustering 聚类算法 market segments 市场细 ...

  9. 吴恩达机器学习笔记week8——神经网络 Neutral network

    吴恩达机器学习笔记week8--神经网络 Neutral network 8-1.非线性假设 Non-linear hypotheses 8-2.神经元与大脑 Neurons and the brai ...

  10. 【Nan‘s 吴恩达机器学习笔记】第八、九章 神经网络

    [Nan's 吴恩达机器学习笔记]第八.九章 神经网络 神经网络(Neural Networks) 8.1 非线性假设 8.2 模型表示 前向传播算法(Forward Propagation) 8.3 ...

最新文章

  1. Nginx初学第一步
  2. 【算法】快速排序/数组第K小的元素
  3. linux下后缀为so的文件怎么打开,linux中.so后缀的文件怎么使用啊
  4. Android官方开发文档Training系列课程中文版:通知用户之更新或移除通知
  5. android 输入法sd卡,如何android扫描SD卡列出大文件
  6. 编写高质量JavaScript代码绳之以法(The Essentials of Writing High Quality JavaScript)翻译...
  7. java对象的状态由什么表示_持久化层的Java对象可处于哪些状态?这些状态有哪些特征?...
  8. VMware Workstation 16.1 macOS unlocker 3.0.3
  9. 2017cad光标大小怎么调_2017版CAD画直线时怎么设置光标处有显示长度和角度的?...
  10. 垃圾邮件过滤python_手把手教你用 python 和 scikit-learn 实现垃圾邮件过滤-阿里云开发者社区...
  11. web渗透的信息收集
  12. vscode 升级时失败 win10
  13. WIN7系统做NTP服务器,大师教您win7系统搭建ntp服务器的图文技巧
  14. android 状态栏高度多少像素,Android之获取屏幕的尺寸像素及获取状态栏标题栏高度...
  15. 自己动手实现俄罗斯方块
  16. 灯塔资产系统(ARL)部署
  17. 《计算机组成原理》——计算题
  18. redis命令之set和zset的操作
  19. PHP的isset和empty的区别
  20. c语言*p和**p,c语言分析(*p)++和*p++的不同含义

热门文章

  1. 今天,王坚正式把“杭州城市大脑”作为礼物献给世界
  2. 【数据分析46讲】基础篇
  3. Python编程从入门到实践第五章部分习题
  4. 网络安全学习:系统基础命令操作
  5. NIST伪随机测试出现igamc:UNDERFLOW的原因以及测试文件的格式
  6. 旅游企业该怎么进行网络品牌推广呢?如何宣传和规划旅游商品?
  7. 冷战与战后东亚国际秩序:影响及后果
  8. 一个P,V操作的习题
  9. python之路--生成器
  10. WINUSB STM32移植参考