←上一篇 ↓↑ 下一篇→
2.10 是否要使用端到端的深度学习 回到目录 1.1 计算机视觉

总计

习题

为了帮助你练习机器学习的策略,本周我们将介绍另一个场景,并询问你将如何行动。我们认为这个在机器学习项目中工作的“模拟器”将给出一个任务,即领导一个机器学习项目可能是什么样的! 您受雇于一家初创公司,制造自动驾驶汽车。您负责检测图像中的道路标志(停车标志、人行横道标志、施工先行标志)和交通信号(红绿灯)。目标是识别每张图像中的这些对象。例如,上面的图像包含人行横道标志和红色交通灯

第 86 题

您的100,000张带标签的图片是使用您汽车的前置摄像头拍摄的,这也是你最关心的数据分布,您认为您可以从互联网上获得更大的数据集,即使互联网数据的分布不相同,这也可能对训练有所帮助。你刚刚开始着手这个项目,你做的第一件事是什么?假设下面的每个步骤将花费大约相等的时间(大约几天)。

A.花几天时间去获取互联网的数据,这样你就能更好地了解哪些数据是可用的。

B.花几天的时间检查这些任务的人类表现,以便能够得到贝叶斯误差的准确估计。

C.花几天的时间使用汽车前置摄像头采集更多数据,以更好地了解每单位时间可收集多少数据。

D.花几天时间训练一个基本模型,看看它会犯什么错误。

第 87 题

您的目标是检测道路标志(停车标志、行人过路标志、前方施工标志)和交通信号(红灯和绿灯)的图片,目标是识别这些图片中的哪一个标志出现在每个图片中。 您计划在隐藏层中使用带有ReLU单位的深层神经网络。

对于输出层,使用Softmax激活将是输出层的一个比较好的选择,因为这是一个多任务学习问题,对吗?

A.对 B.不对

第 88 题

你正在做误差分析并计算错误率,在这些数据集中,你认为你应该手动仔细地检查哪些图片(每张图片都做检查)?

A.随机选择10,000图片

B.随机选择500图片

C.500张算法分类错误的图片

D.10,000张算法分类错误的图片

第 89 题

在处理了数据几周后,你的团队得到以下数据:

100,000 张使用汽车前摄像头拍摄的标记了的图片。 900,000 张从互联网下载的标记了道路的图片。

每张图片的标签都精确地表示任何的特定路标和交通信号的组合。 例如, y(i)=[10010]y^{(i)}=\left[ \begin{matrix} 1\\0\\0\\1\\0 \end{matrix}\right]y(i)=⎣⎢⎢⎢⎢⎡​10010​⎦⎥⎥⎥⎥⎤​ 表示图片包含了停车标志和红色交通信号灯。

因为这是一个多任务学习问题,你需要让所有 y(i)y(i)y(i)y(i)y(i)y(i) 向量被完全标记。 如果一个样本等于 [1?01?]\left[ \begin{matrix} 1\\?\\0\\1\\? \end{matrix}\right]⎣⎢⎢⎢⎢⎡​1?01?​⎦⎥⎥⎥⎥⎤​ 那么学习算法将无法使用该样本,是正确的吗?

A.对 B.不对

第 90 题

你所关心的数据的分布包含了你汽车的前置摄像头的图片,这与你在网上找到并下载的图片不同。如何将数据集分割为训练/开发/测试集?

A.将10万张前摄像头的图片与在网上找到的90万张图片随机混合,使得所有数据都随机分布。 将有100万张图片的数据集分割为:有60万张图片的训练集、有20万张图片的开发集和有20万张图片的测试集。

B.将10万张前摄像头的图片与在网上找到的90万张图片随机混合,使得所有数据都随机分布。将有100万张图片的数据集分割为:有98万张图片的训练集、有1万张图片的开发集和有1万张图片的测试集。

C.选择从互联网上的90万张图片和汽车前置摄像头的8万张图片作为训练集,剩余的2万张图片在开发集和测试集中平均分配。

D.选择从互联网上的90万张图片和汽车前置摄像头的2万张图片作为训练集,剩余的8万张图片在开发集和测试集中平均分配。

第 91 题

假设您最终选择了以下拆分数据集的方式:

您还知道道路标志和交通信号分类的人为错误率大约为0.5%。以下哪项是对的?(选出所有正确项)

A.由于开发集和测试集的错误率非常接近,所以你过拟合了开发集。

B.你有很大的数据不匹配问题,因为你的模型在训练-开发集上比在开发集上做得好得多。

C.你有很大的可避免偏差问题,因为你的训练集上的错误率比人为错误率高很多。

D.你有很大的方差问题,因为你的训练集上的错误率比人为错误率要高得多。

E.你有很大的方差问题,因为你的模型不能很好地适应它从来没有见过,但是来自训练集同一分布的数据

第 92 题

根据上一个问题的表格,一位朋友认为训练数据分布比开发/测试分布要容易得多。你怎么看?

A.你的朋友是对的。(即训练数据分布的贝叶斯误差可能低于开发/测试分布)。

B.你的朋友错了。(即训练数据分布的贝叶斯误差可能比开发/测试分布更高)。

C.没有足够的信息来判断你的朋友是对还是错。

D.无论你的朋友是对还是错,这些信息都对你没有用。

第 93 题

您决定将重点放在开发集上, 并手动检查是什么原因导致的错误。下面是一个表, 总结了您的发现: 开发集总误差 14.3% 由于数据标记不正确而导致的错误 4.1% 由于雾天的图片引起的错误 8.0% 由于雨滴落在汽车前摄像头上造成的错误 2.2% 其他原因引起的错误 1.0%

在这个表格中,4.1%、8.0%这些比例是占总开发集的比例(不仅仅是您的算法错误标记的样本),即大约8.0 / 14.3 = 56%的错误是由于雾天的图片造成的。

从这个分析的结果意味着团队最先做的应该是把更多雾天的图片纳入训练集,以便解决该类别中的8%的错误,对吗?

A.错误,因为这取决于添加这些数据的容易程度以及您要考虑团队认为它会有多大帮助。

B.是的,因为它是错误率最大的类别。正如视频中所讨论的,我们应该对错误率进行按大小排序,以避免浪费团队的时间。

C.是的,因为它比其他的错误类别错误率加在一起都大(8.0 > 4.1+2.2+1.0)。

D.错误,因为数据增强(通过清晰的图像+雾的效果合成雾天的图像)更有效。

第 94 题

你可以买一个专门设计的雨刮,帮助擦掉正面相机上的一些雨滴。 根据上一个问题的表格,您同意以下哪些陈述?

A.对于挡风玻璃雨刷可以改善模型的性能而言,2.2%是改善的最大值。

B.对于挡风玻璃雨刷可以改善模型的性能而言,2.2%是改善最小值。

C.对于挡风玻璃雨刷可以改善模型的性能而言,改善的性能就是2.2%。

D.在最坏的情况下,2.2%将是一个合理的估计,因为挡风玻璃刮水器会损坏模型的性能。

第 95 题

您决定使用数据增强来解决雾天的图像,您可以在互联网上找到1,000张雾的照片,然后拿清晰的图片和雾来合成雾天图片,如下所示:

你同意下列哪种说法?(选出所有正确项)

A.只要你把它与一个更大(远大于1000)的清晰/不模糊的图像结合在一起,那么对雾的1000幅图片就没有太大的过拟合的风险。

B.将合成的看起来像真正的雾天图片添加到从你的汽车前摄像头拍摄到的图片的数据集对与改进模型不会有任何帮助,因为它会引入可避免的偏差。

C.只要合成的雾对人眼来说是真实的,你就可以确信合成的数据和真实的雾天图像差不多,因为人类的视觉对于你正在解决的问题是非常准确的。

第 96 题

在进一步处理问题之后,您已决定更正开发集上错误标记的数据。 您同意以下哪些陈述? (选出所有正确项)

A.您不应更正训练集中的错误标记的数据, 因为这不值得

B.您应该更正训练集中的错误标记数据, 以免您训练集与开发集差距更大

C.您不应该更正测试集中错误标记的数据,以便开发和测试集来自同一分布

D.您还应该更正测试集中错误标记的数据,以便开发和测试集来自同一分布

第 97 题

到目前为止,您的算法仅能识别红色和绿色交通灯,该公司的一位同事开始着手识别黄色交通灯(一些国家称之为橙色光而不是黄色光,我们将使用美国的黄色标准),含有黄色灯的图像非常罕见,而且她没有足够的数据来建立一个好的模型,她希望你能用转移学习帮助她。

你告诉你的同事怎么做?

A.她应该尝试使用在你的数据集上预先训练过的权重,并用黄光数据集进行进一步的微调。

B.如果她有10,000个黄光图像,从您的数据集中随机抽取10,000张图像,并将您和她的数据放在一起,这可以防止您的数据集“淹没”她的黄灯数据集。

C.你没办法帮助她,因为你的数据分布与她的不同,而且缺乏黄灯标签的数据。

D.建议她尝试多任务学习,而不是使用所有数据进行迁移学习。

第 98 题

另一位同事想要使用放置在车外的麦克风来更好地听清你周围是否有其他车辆。 例如,如果你身后有警车,你就可以听到警笛声。 但是,他们没有太多的训练这个音频系统,你能帮忙吗?

A.从视觉数据集迁移学习可以帮助您的同事加快步伐,多任务学习似乎不太有希望。

B.从您的视觉数据集中进行多任务学习可以帮助您的同事加快步伐,迁移学习似乎不太有希望。

C.迁移学习或多任务学习可以帮助我们的同事加快步伐。

D.迁移学习和多任务学习都不是很有希望。

第 99 题

要识别红色和绿色的灯光,你一直在使用这种方法:

(A)将图像 xxx 输入到神经网络,并直接学习映射以预测是否存在红光(和/或)绿光 yyy 。

一个队友提出了另一种两步的方法:

(B)先要检测图像中的交通灯(如果有),然后确定交通信号灯中照明灯的颜色。

在这两者之间,方法B更多的是端到端的方法,因为它在输入端和输出端有不同的步骤,这种说法正确吗?

A.对 B.不对

第 100 题

上一题中,A方法似乎比B方法更有效,如果你有一个__

A.大训练集 B.多任务学习的问题 C.偏差比较大的问题 D.高贝叶斯误差的问题

86-100题 答案

86.D 87.B 88.C 89.B 90.C 91.BC 92.C 93.A 94.A 95.C 96.AD 98.A 99.D 99.B 100.A


←上一篇 ↓↑ 下一篇→
2.10 是否要使用端到端的深度学习 回到目录 1.1 计算机视觉

2.11 总结-深度学习第三课《结构化机器学习项目》-Stanford吴恩达教授相关推荐

  1. 3.11 总结-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 3.10 候选区域 回到目录 4.1 什么是人脸识别? 总结 习题 第 121 题 现在你要构建一个能够识别三个对象并定位位置的算法,这些对象分别是:行人(c=1),汽车(c ...

  2. 3.11 结论和致谢-深度学习第五课《序列模型》-Stanford吴恩达教授

    结论和致谢 (Conclusion and thank you) 恭喜你能走到这一步,在最后这节视频中,只想做个总结,并给你一些最后的想法. 我们一起经历了一段很长的旅程,如果你已经学完了整个专业的课 ...

  3. 0.0 目录-深度学习第五课《序列模型》-Stanford吴恩达教授

    文章目录 目录 第五课 第四课 第三课 第二课 第一课 目录 第五课 <序列模型> 笔记列表 Week 1 循环序列模型 Week 1 传送门 -> 1.1 为什么选择序列模型 1. ...

  4. 0.0 目录-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

    文章目录 第五课 第四课 第三课 第二课 第一课 第五课 <序列模型> 笔记列表 Week 1 循环序列模型 Week 1 传送门 -> 1.1 为什么选择序列模型 1.2 数学符号 ...

  5. 2.11 计算机视觉现状-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 2.10 数据扩充 回到目录 2.12 总结 计算机视觉现状 (The State of Computer Vision) 深度学习已经成功地应用于计算机视觉.自然语言处理. ...

  6. 3.4 改进集束搜索-深度学习第五课《序列模型》-Stanford吴恩达教授

    改进集束搜索 (Refinements to Beam Search) 上个视频中, 你已经学到了基本的束搜索算法(the basic beam search algorithm),这个视频里,我们会 ...

  7. 4.1 什么是人脸识别-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 3.11 总结 回到目录 4.2 One-Shot 学习 什么是人脸识别 (What is face recognition?) 欢迎来到第四周,即这门课卷积神经网络课程的最 ...

  8. 2.2 经典网络-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 2.1 为什么要进行实例探究? 回到目录 2.3 残差网络 经典网络 (Classic Networks) 这节课,我们来学习几个经典的神经网络结构,分别是LeNet-5.A ...

  9. 1.7 单层卷积网络-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 1.6 三维卷积 回到目录 1.8 简单卷积网络示例 单层卷积网络 (One Layer of a Convolutional Network) 今天我们要讲的是如何构建卷积 ...

  10. 1.2 边缘检测示例-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 1.1 计算机视觉 回到目录 1.3 更多边缘检测内容 边缘检测示例 (Edge Detection Example) 卷积运算是卷积神经网络最基本的组成部分,使用边缘检测作 ...

最新文章

  1. akaze特征匹配怎么去掉不合适的点_单应性矩阵应用基于特征的图像拼接
  2. JSValidation 配置文件
  3. oracle 计划名称,甲骨文修改合作伙伴计划 分为四个级别
  4. android 重装sdk或者系统的时模拟器出现can open ****
  5. 转-用qemu-nbd实现mount虚拟硬盘到Host上的功能
  6. NXP KW38蓝牙开发(一)入门第一课:官网蓝牙广播和连接例程,NMI禁止
  7. python是什么类型的编程语言-Python是一种什么样的编程语言?解释?编译?汇编?机械?...
  8. PingingLab传世经典系列《CCNA完全配置宝典》-2.9 OSPF基本配置
  9. 入门 | 从文本处理到自动驾驶:机器学习最常用的50大免费数据集
  10. IntelliJ IDEA主题修改
  11. 【ECharts教程】在实战中学习(超炫酷的数据可视化大屏)
  12. 重邮第八届ACM大赛-决赛题解报告
  13. 学习编程悟出8个字《精辟》!
  14. 第六节NoSQL+时序数据库+RabbitMQ安装
  15. PDF的文档转成HTML乱序,PDF文档怎么转换成HTML文件?用迅捷PDF转换器就不难!
  16. 基于面板数据的熵值法介绍与实现
  17. 编写高质量的代码——从命名入手
  18. 人工智能的三个层次:运算智能,感知智能,认知智能
  19. 网吧看电影你们都用什么IT网站看网吧电影会员免费免VIP的那种
  20. LeetCode—494. 目标和(Target Sum)——分析及代码(Java)

热门文章

  1. javascript中Math.random()产生随机数总结
  2. 斯坦福2014机器学习笔记五----正则化
  3. Linux基础-yum软件包管理
  4. linux centos 7安装 apache php 及mariadb
  5. SPSS单一样本的T检验
  6. Android进阶笔记09:Android 万能适配器
  7. spring事务的传播特性
  8. 北邮校园网自动登录 python
  9. 基于Mahout的电影推荐系统
  10. UA MATH567 高维统计专题2 Low-rank矩阵及其估计3 Rank RIP