进行误差分析

比如说图片识别的机器学习算法,可能会有一些图片被错误的识别了。我们要想提高准确率,可以先去分析一下到底有哪种图片被错误的的识别了。比如说有100张图片被错误的识别了,我们可以对这100张图片进行分类,看哪些图片被错误的识别成了猫哪些图片被错误的识别成了狗。或者是哪些图片,因为比较模糊儿被错误的识别。于是,我们就可以针对这些被错误识别的图片,进行个性化的优化来提高准确率。

这是对于提高准确率来说,十分重要的过程。

清楚标注错误的数据

我们知道深度学习是一种监督学习算法,这样就会涉及到人工标注的数据集。如果人来操作,那么就有可能数据标注错误。虽然是小概率事件,但是偶尔也会发生。如果用错误的数据集来训练,是否会产生不良影响呢?

深度学习算法对于这一点的鲁棒性是比较强的。只要数据集够大,即使有一点的数据标注错误也不会有太大影响。只要这些错误样本离随机错误不太远,那么放着这些错误不管可能也没问题,而不要花太多时间修复它们。

我这里先警告一下,深度学习算法对随机误差很健壮,但对系统性的错误就没那么健壮了。所以比如说,如果做标记的人一直把白色的狗标记成猫,那就成问题了。因为你的分类器学习之后,会把所有白色的狗都分类为猫。但随机错误或近似随机错误,对于大多数深度学习算法来说不成问题。

如果你还记得设立开发集的目标的话,开发集的主要目的是,你希望用它来从两个分类器A和B中选择一个。所以当你测试两个分类器A和B时,在开发集上一个有2.1%错误率,另一个有1.9%错误率,但是你不能再信任开发集了,因为它无法告诉你这个分类器是否比这个好,因为0.6%的错误率是标记出错导致的。

现在如果你决定要去修正开发集数据,手动重新检查标签,并尝试修正一些标签,这里还有一些额外的方针和原则需要考虑。首先,我鼓励你不管用什么修正手段,都要同时作用到开发集和测试集上,我们之前讨论过为什么,开发和测试集必须来自相同的分布。开发集确定了你的目标,当你击中目标后,你希望算法能够推广到测试集上,这样你的团队能够更高效的在来自同一分布的开发集和测试集上迭代。

吴教主深度学习和神经网络课程总纲

3.2.1 造成误差的原因分析相关推荐

  1. SELECT TOP 1 比不加TOP 1 慢的原因分析以及SELECT TOP 1语句执行计划预估原理

    现实中遇到过到这么一种情况: 在某些特殊场景下:进行查询的时候,加了TOP 1比不加TOP 1要慢(而且是慢很多)的情况, 也就是说对于符合条件的某种的数据,查询1条(符合该条件)数据比查询所有(符合 ...

  2. dcs world f15c教学_DCS信号干扰原因分析及解决方法,收藏备用!

    原标题:DCS信号干扰原因分析及解决方法,收藏备用! 导 读 随着我国工业的发展,对工业控制系统自动化水平的要求也在不断提高,为了满足自动化控制的要求,DCS系统已经广泛运用于工业自动化控制.因此,D ...

  3. 伺服和步进电机运行产生位置偏差的原因分析?

    来源:网络 偏位问题,是使用步进或伺服电机的设备制造厂在设备装机调试,以及设备使用过程中,所面临的常见问题之一.出现偏位可能是机械装配不当造成,可能是控制系统与驱动器信号不匹配,也可能是设备内电磁干扰 ...

  4. 【Ethercat CSP控制模式下电机卡顿原因分析及解决方法】

    Ethercat CSP控制模式下电机卡顿原因分析及解决方法 ethercat总线经过近十年的发展,逐渐成为国际上最广泛应用的实时以太网总线之一.国外商业化的ethercat主站价格昂贵,国内尚未有全 ...

  5. 拉绳位移编码器造成误差的原因向大家分享一下

    拉绳位移编码器造成误差的原因向大家分享一下 拉绳位移编码器在测量输出信号时可以得到运动物体的位移.方向或速度.当运动发生时,拉绳子拉伸和收缩.内部弹簧确保拉绳的拉力保持不变.测量输出信号可以得到运动物 ...

  6. 单片机不起振原因分析(转)

    1.单片机晶振不起振原因分析 遇到单片机晶振不起振是常见现象,那么引起晶振不起振的原因有哪些呢? (1) PCB板布线错误: (2) 单片机质量有问题: (3) 晶振质量有问题: (4) 负载电容或匹 ...

  7. 【linux】ARM开发板上设置RTC时间,断电重启后,设置失效的原因分析

    问题描述 linux中使用date设置时间后用hwclock -w同步到RTC,断电重启后,有时会失效 原因分析 保存时间戳 1.使用命令关机(halt)会调用rc0.d中的脚本: 2.使用命令重启( ...

  8. Lua(Codea) 中 table.insert 越界错误原因分析

    2019独角兽企业重金招聘Python工程师标准>>> Lua(Codea) 中 table.insert(touches, touch.id, touch) 越界错误原因分析 背景 ...

  9. SAP MM ME21N 创建PO时报错 - Net price in CNY becomes too large – 之原因分析

    SAP MM ME21N 创建PO时报错 - Net price in CNY becomes too large – 之原因分析 昨天笔者在微信公众号里发布了一篇文章<SAP MM ME21N ...

最新文章

  1. Java 未死,依然很牛逼!
  2. 在自行车论坛看到的有趣帖子
  3. 200819C阶段一C++面向对象的编程思想
  4. hdu2115: I Love This Game
  5. 内核的Makefile与Kconfig关系解析
  6. sql server2008禁用远程连接
  7. ubuntu 16.04 远程挂载硬盘
  8. activity mq shared filesystem 部署
  9. 计算机辅助翻译 教学大纲,《计算机辅助翻译》本科课程教学大纲翻译本科
  10. Node之HTTPS客户端
  11. Nodejs BFF 开发 8 个月的心路历程
  12. 对话李国权:新加坡为什么能成为全球Web3.0创业的节点?
  13. wps2016向程序发送命令_解决excel弹出“向程序发送命令时出现问题”的方法
  14. 解决 login.live.com onedrive.live.com 等微软国外网站打不开问题
  15. C++笔记:奇葩排序之猴子排序、珠排序、面条排序
  16. 这几个免费PPT模板、素材库,你绝对不能错过
  17. typescript全局安装卸载以及npm相关问题
  18. 汇编指令学习(CMP,TEST)
  19. 1.Java内存区域与Java对象
  20. 考研概率论与数理统计

热门文章

  1. excel最常用的八个函数_Excel最常用的几个函数,我都帮你整理好了!
  2. WebService中使用自定义类的解决方法(5种)
  3. php 二叉树 与赫夫曼树
  4. Linux学习笔记——例说makefile 综合案例
  5. RedHat 7配置FTP服务
  6. [ JS 进阶 ] Ajax 详解 (2) :XHR 实例 GET 和 POST 异步和同步
  7. 【wikioi】1022 覆盖(匈牙利)
  8. java实现选择排序
  9. 新型机器人模拟蜻蜓飞行可以乱真!
  10. Oracle创建dblink和同义词小记