说明

该文为笔者在微信公众号:吴恩达deeplearningai 所推送《机器学习训练秘籍》系列文章的学习笔记,公众号二维码如下,1到15课课程链接点这里

该系列文章主要是吴恩达先生在机器学习方面的经验分享和基础教程,每一章十分短小,旨在让我们能在碎片化的时间中一点点熟悉机器学习的相关知识。

想看该系列文章英文版最新章节的同学请点击这里进行邮件订阅

第1至15章

1、2、3、决策方案很重要

-方案示例:
1、获取更多的数据,即收集更多猫的图片

2、收集更加多样化的训练数据集,比如处于不常见位置的猫的图片,颜色奇异的猫的图片,以及使用不同相机参数拍摄的猫的图片

3、通过增加梯度下降(gradient descent)的迭代次数,使算法训练得久一些

4、尝试一个拥有更多层(layer)/更多隐藏元(hidden units)/更多参数(parameters)的,规模更大的神经网络

5、尝试加入正则化(例如 L2 正则化)

6、改变神经网络的架构(激活函数,隐藏元数量等等)

...

选择以上合理的决策方案很重要.

4、机器学习现在发展迅速的原因

-有两个主要因素推动着近期的发展:
1、数据可用性(data availability):采集数据的设备越来越多,数据量越来越大
2、计算规模(computational scale):在近些年前,我们才开始能够使用现有的海量数据集来训练规模足够大的神经网络。

-旧的学习算法似乎并不知道要如何来处理如今这个规模量级的数据。

-在小数据集条件下,传统算法是否会表现得更好,取决于人们如何进行特征工程。

-神经网络提高性能方式:

(i) 训练大型的神经网络

(ii) 拥有海量的数据

5、并发集和测试集

-数据集一般包含正样本和负样本

-机器学习中的普遍做法是使用 70% / 30% 的比例来随机划分出训练集和测试集

-图片质量会比较影响训练和识别结果。

-训练集(training set)用于运行你的学习算法。

-开发集(development set)用于调整参数,选择特征,以及对学习算法作出其它决定。有时也称为留出交叉验证集(hold-out cross validation set)。

-测试集(test set)用于评估算法的性能,但不会据此决定使用什么学习算法或参数。

-开发集和测试集的使命就是引导你的团队对机器学习系统做出最重要的改变。(合理地设置开发集和测试集,使之近似模拟可能的实际数据情况,并处理得到一个好的结果。)

6、开发集和测试集应该服从同一分布

7、开发集和测试集应有多大

-当数据量特别特别大的时候,开发集和测试集的规模并不是越大越好。

8、使用单值评估指标进行优化

-查准率(Precision,又译作精度):预测结果为某类的样本中,实际为该类的比例。

-查全率(Recall,又译作召回率):某类的样本中,被正确识别为该类的比例。
-F1 Score为上述的平均值,使用加权平均求出单值指标更方便

9、优化指标和满意度指标

-准确率(accuracy)、运行时间(running time)、假正例率(false positive rate)和假反例率(false negative rate)等

10、通过开发集和度量指标加速迭代

-在建立一个机器学习系统时,我往往会这样:
1、尝试一些关于系统构建的想法(idea)。
2、使用代码(code)实现想法。
3、根据实验(experiment)结果判断想法是否行得通。(第一个想到的点子一般都行不通!)在此基础上学习总结,从而产生新的想法,并保持这一迭代过程。

-拥有开发集和度量指标,可以使你更快地检测出哪些想法给系统带来了小(或大)的提升 ,从而快速确定要继续研究或者是要放弃的方向。

11、12、何时修改开发集、测试集和度量指标

-开发集和测试集必须分布相同,否则有可能过拟合

-对假正例进行严重惩罚

-要对系统周期性得进行评估

-(i) 如果你在开发集上过拟合,则获取更多的开发集数据。
-(ii) 如果开发集和测试集的数据分布和实际关注的数据分布不同,则获取新的开发集和测试集。
-(iii) 如果评估指标不能够对最重要的任务目标进行度量,则需要修改评估指标。

13、快速构建并迭代你的第一个系统

-先快速构建一个最基础的系统,后面慢慢改,一般第一个都是有问题

14、15、误差分析:根据开发集样本评估多个想法

-误差分析(Error Analysis) 指的是检查算法误分类的开发集样本的过程,以便你找到造成这些误差的原因。

-对出错的开发集样本进行一定量的收集分析

-出错的这些样本中,观察其中某一类的比例(如果识别猫的系统,将狗误认为猫,而狗在这些误分类的样本中的比例),如果比例较小(eg.5%)有可能就为该项目的上限,不用在意,因为即使针对狗进行特定的改进,可能也只是会对总识别率提升一点点;如果比例较大,进行改进后就可以显著增加识别率

-误差分析并不会产生一个明确的数学公式来告诉你什么任务的优先级最高。你还需要考虑在不同类别上的预期进展以及解决每个类别所需的工作量。

-作者十分强调优先级问题,看来是看过太多的人做无用功了,他在视频中就经常提到:去一家公司参观,团队花6个月来排查解决的一个问题,他一眼就看出是哪个参数的问题。

---恢复内容结束---

转载于:https://www.cnblogs.com/nightmoonzjm/p/9182614.html

笔记:《机器学习训练秘籍》——吴恩达deeplearningai微信公众号推送文章相关推荐

  1. 笔记:《机器学习训练秘籍》-吴恩达deeplearningai微信公众号推送文章

    说明 该文为笔者在微信公众号:吴恩达deeplearningai 所推送<机器学习训练秘籍>系列文章的学习笔记,公众号二维码如下,1到15课课程链接点这里 该系列文章主要是吴恩达先生在机器 ...

  2. “吴恩达deeplearningai”微信公众号上线,将发布《机器学习训练秘籍》

    去年 6 月,吴恩达宣布 deeplearning.ai 创业项目,8 月,该项目揭晓:一套由 5 门课组成的深度学习系列课程 -- Deep Learning Specialization,旨在推广 ...

  3. 重磅 |“吴恩达deeplearningai”官方微信公众号已经上线!

    从去年8月份开始,AI界大IP吴恩达在coursera上开设了由5们课组成的深度学习专项课程,掀起了一股人工智能深度学习热潮.这里附上deeplearning.ai的官网: deeplearning. ...

  4. 运营笔记:老板最不关心的就是微信公众号外包报价表!

    运营笔记:老板最不关心的就是微信公众号外包报价表! 其实老板最不关心的就是微信公众号外包报价表,真正关心的是外包到底有没有效果. 价格是次要,效果才排第一,这个是永远不变的法则. 作为老板,有可能最不 ...

  5. 斯坦福大学机器学习课程资料-吴恩达老师主讲(2008版)

    吴恩达老师于08年在斯坦福大学开办的机器学习课程,本站将课程视频.讲义.笔记分享下,这个课程的视频比较模糊,有大量的数学推导,有点难度,建议有一定数学基础的同学学习,初学者请绕道. 吴恩达老师后来推出 ...

  6. 深度学习笔记目录大全(吴恩达)--终于有翻译版本了

    第一门课 神经网络和深度学习(Neural Networks and Deep Learning) 第一周:深度学习引言(Introduction to Deep Learning) 1.1 欢迎(W ...

  7. 机器学习(Machine Learning) - 吴恩达(Andrew Ng) 视频笔记

    背景:写于20190408,大概一周前我已经看到了P47 8-4 - Model Representation II 视频链接:https://www.bilibili.com/video/av991 ...

  8. 机器学习入门(吴恩达)——单变量线性回归

    2.1模型表示 从线性回归算法开始学起,从一个预测住房价格的例子开始,需要一个数据集(包含住房价格),根据不同房子尺寸的大小所出售的价格,画出数据集如下图 要想知道多大的房子可以出售什么价格,就需要构 ...

  9. 吴恩达《机器学习训练秘籍》:7 条关于项目实践的实用建议

    翻译 | shawn 出品 | 人工智能头条(公众号ID:AI_Thinker) <机器学习训练秘籍>(Machine Learning Yearning)是吴恩达的新作,主要讲的是如何应 ...

最新文章

  1. 【Spark Summit East 2017】Spark SQL:Tungsten之后另一个可以达到16倍速度的利器
  2. 【GDOI2016模拟3.16】幂(容斥 + 模型复杂转化)
  3. python构造icmp数据包_如何在python中构造ICMP数据包
  4. 大话数据结构:散列表
  5. 22(2)序列化以及反序列化
  6. 计算机二级python选择题题库_2018年计算机二级python题库精编(1)
  7. 计算机桌面上的声音图标没了怎么办,Win7电脑右下角声音图标不见了怎么办?...
  8. (转)c++模版:包含模型、显式实例化、分离模型
  9. 华硕服务器主板型号命名规则,华硕ROG系列主板命名规则详解_华硕 Maximus V Formula_主板评测-中关村在线...
  10. 微信网页开发(1)--微信网页与普通网页区别
  11. 汽车“缺芯”的挑战与机遇
  12. bzoj5145 [Ynoi2018]未来日记 (多校第4场1013 Yuno and Claris)
  13. FFmpeg学习(三)-- libavutil 代码组成
  14. java rrd 读取_rrd4j的使用详解1–数据保存入rrd文件 | 学步园
  15. Zabbix3.4 通过163邮箱发送邮件监控报警
  16. 单页应用 多页应用的区别
  17. 笨小孩投资理财-价值投资该看的书籍
  18. 维克森林大学计算机专业,维克森林大学研究生读几年?
  19. 软件系统分析与设计 | UMLet建模
  20. 黑马52期学后总结笔记(十)

热门文章

  1. is running 8724480B beyond the ‘PHYSICAL‘ memory limit.
  2. 「CSS」文本编排相关的CSS属性设置
  3. Metaverse 元宇宙入门-08-Content, Services, and Asset Businesses in the Metaverse 元界中的内容、服务和资产业务
  4. linux中怎么修改用户组名,Linux 下如何修改用户名(同时修改用户组名和家目录)...
  5. 【岩熹攻略】议息大会后,国庆主题迎布局良机!
  6. 存储器读写c语言程序,单片机IIC接口存储器AT24C04的读写和显示程序(详细注释)...
  7. BIM技术越发成熟,项目利润从哪来?
  8. Linux安装Docker(亲测有效)
  9. 元素的alt和title有什么异同?
  10. 前端js和python后端的结合