点上方计算机视觉联盟获取更多干货

仅作学术分享,不代表本公众号立场,侵权联系删除

转载于:新智元

AI博士笔记系列推荐

周志华《机器学习》手推笔记正式开源!可打印版本附pdf下载链接

「clean code」是机器学习的基础,在公开的数据集取得更好的效果也是发表论文的基础。

众所周知的是,公开数据集并不都是完美的,或多或少都存在标签错误的问题。之前的工作主要关注「训练数据集」中的错误,忽视了「测试数据集」的错误。

MIT在arxiv上传了一篇论文,研究了10个流行的数据集,借助Amazon的众包平台Machine Turk来检验错误率。

通过算法识别并人工验证,发现确实普遍存在标签错误,10个数据集的平均错误率为3.4%

MNIST也会出错?

即使是久经沙场,被无数论文作为基准测试过的MNIST数据集,在测试集中也包含15个(人工验证过的)标签错误。

不过大部分错误都属于有争议的结果,手写体写出来和看起来确实存在较大差距,例如0和6。

CIFAR-100迷惑性的标签

通过自然语言来定义标签,一个问题就是语言的「歧义性」。

下面三张标签中,图一过于抽象,并没有看出来是大象或是什么其他物种。

第二幅图被标注为「碗」,而被纠正为「茶杯」。cup与bowl之间的区别在于用途、大小。而根据图中比例来说,并无法分辨是碗还是杯子。

图三小编觉得更像是桌子,一个带花纹的桌子,可能纠正错了。

QuickDraw数据集有10%都是错的?

QuickDraw共包含了五千万幅画,其中抽样测试集错误率约为10%,也就是说五百万个样例都是错误的。

例如下图中,眼睛被标注为了老虎,灯泡被标注为鳄鱼皮。

第三幅图笔画过于简单,想象空间比较大,数据集给出的标签是落地灯,众包人员认为是回旋镖,但还有许多其他的答案,例如大雁或者其他的具有翅膀的动物。

还有其他离谱的标注,天使被标注成三角形,鸟标注为火炉,苹果标注为衬衫,差的有点大吧?只能说标注人员脑洞开的真的很大!

ImageNet也有5.83%不可信赖

ImageNet的错误分类有许多是动物类的,需要标注人员具有专业知识,能够准确区分各个动物。

花鸡、松鸦、夜莺之间的区分,对于小编来说太难了。

跑车和赛车之间的区别还是比较大的,图一难道不是「玩具车」?

纠正标签有什么作用?

图(a)显示,移除更多的错误标签,能够线性地提高ResNet-18的准确率。

图(b)和图(c)说明,当纠正更多的错误标签时,准确率也会上升。

当数据集中错误标签被纠正后,不同模型之间的排名也会发生较大变化。

人工标注是一个既客观又主观的事情,人在做图像识别任务的时候,也无法达到100%的准确率,错误无可避免。

训练集的错误标签同样会影响到模型在测试集上的表现,错误的标记可能会导致科研人员得出模型在现实世界中性能更佳的错误结论,从而破坏了机器学习系统的基准测试结果。

如何建立一个可依赖的公开数据库,或依赖半监督算法来有效清洗数据,也许是下一步研究方向。

参考资料:

https://l7.curtisnorthcutt.com/label-errors

end

我是王博Kings,一名985AI博士,华为云专家/CSDN博客专家,单个AI项目在Github上获得了2000标星,为了方便大家交流,附上了联系方式。

这是我的私人微信,还有少量坑位,可与相关学者研究人员交流学习 

目前开设有人工智能、机器学习、计算机视觉、自动驾驶(含SLAM)、Python、求职面经、综合交流群扫描添加CV联盟微信拉你进群,备注:CV联盟

王博Kings 的公众号,欢迎关注,干货多多

王博Kings的系列手推笔记(附高清PDF下载):

博士笔记 | 周志华《机器学习》手推笔记第一章思维导图

博士笔记 | 周志华《机器学习》手推笔记第二章“模型评估与选择”

博士笔记 | 周志华《机器学习》手推笔记第三章“线性模型”

博士笔记 | 周志华《机器学习》手推笔记第四章“决策树”

博士笔记 | 周志华《机器学习》手推笔记第五章“神经网络”

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(上)

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(下)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(上)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(下)

博士笔记 | 周志华《机器学习》手推笔记第八章集成学习(上)

博士笔记 | 周志华《机器学习》手推笔记第八章集成学习(下)

博士笔记 | 周志华《机器学习》手推笔记第九章聚类

博士笔记 | 周志华《机器学习》手推笔记第十章降维与度量学习

博士笔记 | 周志华《机器学习》手推笔记第十一章特征选择与稀疏学习

博士笔记 | 周志华《机器学习》手推笔记第十二章计算学习理论(上)

博士笔记 | 周志华《机器学习》手推笔记第十二章计算学习理论(下)

博士笔记 | 周志华《机器学习》手推笔记第十三章半监督学习

博士笔记 | 周志华《机器学习》手推笔记第十四章概率图模型

点个在看支持一下吧

ImageNet标签竟然部分有误!数据集MNIST也会出错?相关推荐

  1. (预处理合集)手写数据集MNIST(2)——Spyder

    文章目录 版本工具 下载数据集 从keras内置直接载入 查看数据集基本性质 预处理 降维.归一 标签独热编码 数据集增强 图片取样 图片处理原理 图像亮度增强 图像色度增强 图像对比度增强 图像锐度 ...

  2. tensorflow入门数据集:mnist详解

    文章目录 python处理二进制 mnist介绍 mnist显示 方法一:读取解压后的原始文件 方法二:使用TensorFlow封装代码读取 需求一:同时显示图片和标签,验证图片和标签一一对应 需求二 ...

  3. imagenet标签制作

    1.Imagenet 标签为 .txt 名字 类别(从一开始) 用于分类的数据集 ,基于原文件格式是 train下->1.类别名字文件夹放同类的图片 import numpy as np imp ...

  4. 通过置换标签的方式给数据集加噪声

    这次我所介绍的噪声添加方法是针对带标签的数据集,通过置换标签类别的方式实现. 比如,标签中有0.1两个类别,所加噪声占整个数据集的比例为20%,那么我们会将20%的0标签换成1,将20%的1标签置换成 ...

  5. 【keras】python mnist_mlp.py下载数据集mnist.npz失败的解决

    环境 环境:ubuntu 16.04 LTS(ubuntu-16.04.4-server-amd64)     已安装:tensorflow, theano, keras, anaconda 要解决的 ...

  6. 6. 手写数字图片数据集MNIST

    MNIST数据集(http://yann.lecun.com/exdb/mnist/) 手写数字图片数据集,存在60000个训练样本,10000个测试样本.每个样本为一个28X28像素的图片. 主要包 ...

  7. Python神经网络编程:手写数字的数据集MNIST

    识别人的笔迹这个问题相对复杂,也非常模糊,因此这是一种检验人工智能的理想挑战.这不像进行大量数字相乘那样明确清晰. 让计算机准确区分图像中包含的内容,有时也称之为图像识别问题.科学家对这个问题进行了几 ...

  8. matlab 对mnist手写数字数据集进行判决分析_Python神经网络编程:手写数字的数据集MNIST...

    识别人的笔迹这个问题相对复杂,也非常模糊,因此这是一种检验人工智能的理想挑战.这不像进行大量数字相乘那样明确清晰. 让计算机准确区分图像中包含的内容,有时也称之为图像识别问题.科学家对这个问题进行了几 ...

  9. 怎么拿img标签的data_PASCAL VOC数据集-分割标签索引颜色对照及程序

    作者:陈洪瀚 /洪瀚笔记知乎专栏 摘要:介绍了PSACAL VOC分割标签的索引格式,用图表详细展示索引值和对应的颜色和类别:然后使用python程序分别调用opencv和pillow库如何快速读取索 ...

最新文章

  1. 盘点大数据生态圈,那些繁花似锦的开源项目
  2. python小课文件_[Python]小甲鱼Python视频第028课(文件:因为懂你,所以永恒)课后题及参考解8...
  3. SQLServer数据库,表内存,实例名分析SQL语句
  4. python调用程序call_call在Python中改进数列的实例讲解
  5. (转)Python3异常-AttributeError: module 'sys' has no attribute 'setdefaultencoding
  6. service mysql k8s_Kubernetes(k8s)中文文档 名词解释 Services_Kubernetes中文社区
  7. 【React】JSX
  8. LINUX/MAC的rpath,搜索依赖库时从哪里开始
  9. 谷歌浏览器的笔记在哪里_selenium学习笔记之启动谷歌浏览器
  10. 极大似然估计方法(Maximum Likelihood Estimate Method)
  11. GNS3模拟思科三层交换机(排错细节)
  12. 卡巴斯基激活码 卡巴斯基2010激活码下载
  13. 如何确定一台电脑配置的高低
  14. 如何用QT做串口调试助手Qseriaport类的使用
  15. 光端机、光纤收发器与光猫三者之间的区别介绍
  16. cocos creator尝试使用tween的几种新实现方案
  17. STM32 SPI 软件NSS和硬件NSS解读
  18. 【Python百日进阶-数据分析】Day137 - plotly旭日图:go.sunburst()实例
  19. 万米高空的太平洋上,我想跟老婆视个频
  20. ps转换html适应网页尺寸,【ps制作网页页面】ps图像如何生成html?如何将PS制作的网页效果图变成可用的网页?PC端UI设计尺寸规范?...

热门文章

  1. 累计增量备份策略_数据安全与备份解决方案ZDLRA快速恢复
  2. html 只能输入正数,vue 限制input只能输入正数
  3. 哪些手机支持android q,安卓Q首批升级名单公布,华为终于有一款机型支持原生...
  4. php5.0 添加接口,Thinkphp5.0模型---插入数据
  5. vue密码强度提示条
  6. 计算机鼠标说课,信息技术课程(鼠标)全套讲课说课材料
  7. mysql 名次语法规则_基于sql语句的一些常用语法积累总结
  8. 在easyui中如何使用ajax请求数据,Ajax 中正常使用jquery-easyui (转)
  9. AD原理图进阶设计1
  10. dynamic programming 学习