点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入!

理解新测试环境下的分类器决策是一个重要的问题,通常的做法是在已标记的测试集上对分类器进行评估。然而,在实际运用场景下,图像的类别标签通常很难获得且获取成本很高,尤其是测试环境在不断地变化。这引起一个自然的问题:给定一个训练好的分类器,我们能不能直接在未标记测试集上评估其准确性?在这项工作中,我们以多任务的方式训练语义分类和旋转预测。在一系列数据集上,我们报告了一个有趣的发现,即语义分类准确度与旋转预测任务的准确度呈强线性关系((Pearson’s Correlation r>0.88)。这一发现使我们能够利用线性回归器从旋转预测的准确性来估计分类器的性能,而旋转预测不需要人工标注且可以通过自由生成的方式在无标签的测试集上获得。

本期AI TIME PhD直播间我们邀请到澳洲国立大学博士生——邓维建,为我们带来报告分享《旋转预测能够告诉我们分类器准确度的哪些信息?》

邓维建:

澳洲国立大学博士三年级在读博士,在Prof. Stephen Gould和Dr. Liang Zheng指导下进行模型泛化能力研究。

个人主页:https://weijiandeng.xyz/

01

 背  景 

当我们将人脸识别部署在机场的时候,或者将3D目标检测部署在一个新城市的时候,由于模型面对的是一个全新且无标注的测试环境,因此我们无法采用具体的指标来衡量模型的准确度。而重新对新的测试数据进行标注的工作量巨大,这就引出了一个比较有意思的问题:如何估计分类器在无标签测试集上的准确率。

在本文工作中我们探究如何利用自监督信息来估计分类器的准确率。我们采用了一个多任务学习的架构,即一个神经网络做两个任务,第一个任务是旋转角度的预测,第二个任务是图像分类预测。

当我们训练好这个多任务网络之后,给定三个测试集,可获得模型在上面旋转预测准确率和分类预准确率。我们发现如果模型在测试集上的旋转预测性能好,那分类性能也好。值得注意的是旋转任务是一个自监督任务,旋转任务的角度标签是人为设置的,因此不用后期人为标注。如果旋转预测精度与分类精度相关,我们可以在任何测试集上自由获取其旋转标签并计算其精度,然后我们可以根据旋转预测精度预测分类器性能。

为此,我们进行相关性分析:首先收集了来自不同分布的测试集集合,然后计算多任务网络在这些测试集合上的图像分类准确率和旋转预测准确率。最后,我们根据不同测试集合上两个任务的性能来进行相关性分析。

那么如何得到不同的测试集合呢?我们利用图像变换的方式,比如旋转、平移、光照变化、颜色扰动等,而且图像变换后数据的标签不会改变。

下面是旋转预测和图像分类预测相关性分析的结果,从实验结果可得这两个任务具有较强的相关性,Pearson系数高于0.88。

另外,我们还通过实验验证了更换不同的网络架构,旋转预测和图像分类预测仍然具有很强的相关性,如下图所示。

值得注意的是,旋转预测只有四个角度,因此该任务是一个四分类问题。当图像分类任务类别数较多之后,二者相关性又是怎么变化的呢?我们引入了CIFAR-100(100类)数据集进行实验,结果显示虽然两个任务的相关性较CIFAR-10(10类)上有所下降,但仍属于一个较高的相关性。

此外,我们还在Tiny-ImageNet(200类)上进行了相关性实验,实验结果显示两个任务的相关性仍然处于一个较高的水平。

根据相关性分析的发现,我们可以训练一个线性回归器,该回归器的输入是旋转预测任务的性能,输出是分类器性能的估计。通过这个回归器我们可以评估一个模型在新的测试场景下的分类性能了。

03

 实  验 

数据集设置:

利用Training set训练神经网络,在Seed set合成测试集合,基于合成测试集训练线性回归器,在Test set上估计训练好的线性回归器性能。

评价指标:均方误差(RMSE)

实验结果:

两个直观的基准方法:

(1)如果softmax输出的最大值(预测分数)大于,我们认为该样本分类正确;

(2)如果softmax输出的熵值(熵分数)低于T2,我们认为该样本分类正确。

我们提出的线性回归器在所有测试集上实现了相当好的估计。这说明我们可以通过旋转预测这一自监督任务来估计分类器在无标签测试集合上的性能。

论文链接:https://arxiv.org/pdf/2106.05961.pdf

代码链接:https://weijiandeng.xyz/Rotation

点击“阅读原文”,即可观看本场回放

整理:爱 国

审核:邓维建

AI TIME欢迎AI领域学者投稿,期待大家剖析学科历史发展和前沿技术。针对热门话题,我们将邀请专家一起论道。同时,我们也长期招募优质的撰稿人,顶级的平台需要顶级的你!

请将简历等信息发至min.gao@aminer.cn!

微信联系:AITIME_HY

AI TIME是清华大学计算机系一群关注人工智能发展,并有思想情怀的青年学者们创办的圈子,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法、场景、应用的本质问题进行探索,加强思想碰撞,打造一个知识分享的聚集地。

更多资讯请扫码关注

我知道你在看

点击“阅读原文”查看精彩回放

干货!旋转预测能够告诉我们分类器准确度的哪些信息?相关推荐

  1. 把树分成森林 matlab,20170106RF_Matlab 随机森林指的是利用多棵树对样本进行训练并预测的一种分类器,包括两个方面:数据的随 269万源代码下载- www.pudn.com...

    文件名称: 20170106RF_Matlab下载  收藏√  [ 5  4  3  2  1 ] 开发工具: matlab 文件大小: 441 KB 上传时间: 2017-01-06 下载次数: 0 ...

  2. uci数据集中的缺失数据_从uci早期糖尿病风险预测数据集中创建分类器

    uci数据集中的缺失数据 To begin we must first go and download the dataset from the UCI dataset repository. The ...

  3. 干货 | 时间序列预测类问题下的建模方案探索实践

    作者 | 陆春晖 责编 | Carol 出品 | AI科技大本营(ID:rgznai100) 背景 时间序列类问题是数据分析领域中一类常见的问题,人们有时需要通过观察某种现象一段时间的状态,来判断其未 ...

  4. 如何实现智能排班?Udesk沃丰科技WFO客服工作量预测算法告诉你

    商业领域经常会涉及时间序列数据分析需求,例如:餐馆在一年中不同季节的销售情况预测,市场里生鲜商品的供应变化,或者企业售后服务随着节日大促到来的高峰需求变化等等.这些数据,都呈现着非常明显的随时间发生的 ...

  5. 【干货】CRM大牛告诉你,Salesforce到底是个什么鬼?

    本期主题 | Salesforce到底是个什么鬼 分享嘉宾 | 裘思博 Celnet雨花石创始人&合伙人 文字整理 | 莜筱 入群请联系管理员 37℃ 微信号:erhuoyimei 裘思博 本 ...

  6. 浙江交通用大数据预测堵车 告诉你如何跑的快

    半个小时后出发到中关村,请根据当时的路况规划线路."这个问题估计会难倒所有导航软件,难点在于谁也不知道半个小时后中关村大街堵不堵,该不该绕道. 但大数据可以.浙江省交通运输厅正在开展一项新的 ...

  7. 干货!用大白话告诉你什么是Mock测试

    初识mock 作为一个动词,mock是模拟.模仿的意思:作为一个名词,mock是能够模仿真实对象行为的模拟对象. 在软件测试中,mock所模拟的对象是什么呢? 它一定不是我们所测试的对象,而是 SUT ...

  8. 2022年风力发电预测数据集(100多w条数据信息(间隔10min),9多w条数据信息(间隔15min),含数据集来源及详细说明)

    风电预测(WPF)旨在准确估计风电场在不同时间尺度上的风能供应.风电是一种清洁安全的可再生能源,但不能持续生产,导致高波动性.这种可变性可能对将风力发电并入电网系统提出重大挑战.为了保持发电和消费之间 ...

  9. “遗传算法优化BP神经网络预测城市公交系统车站客流量”客流数据信息怎么写...

    遗传算法是一种进化计算算法,它可以用来优化BP神经网络的预测能力.在这个问题中,遗传算法可以用来优化预测城市公交系统车站客流量的BP神经网络.关于客流数据信息,可以收集每个车站的客流量数据,包括进站客 ...

最新文章

  1. pywin32的安装
  2. input文件上传代码片段
  3. word修改公式中的部分字体
  4. IO口复用时钟的配置
  5. hibernate的查询方式
  6. [整理]使用POI操作Excel相关知识~
  7. python ppt_从 Python 中学习 PPT 制作技巧
  8. 《即兴演讲》学习总结
  9. 今天不写技术文章,摘一篇好文,呵呵(95%中国民营企业家富不过三代 子女教育存失误)
  10. Elasticsearch:Elastic可观测性 - 运用 pipeline 使数据结构化
  11. 小型水果店开业活动,水果店刚开业怎么做活动
  12. 软件开发中 常见英文文档 缩写(转)
  13. 抖音短视频怎样引流?有哪些方法?
  14. oracle heavy swapping,WARNING: Heavy swapping observed on system in last 5 mins
  15. 记一次解密微信聊天数据库并Python格式化处理XML
  16. Python在Windows下使用ez_setup.py安装pip
  17. 《目标检测蓝皮书》第2篇 深度学习基础
  18. createjs php通信,createjs与animateCC协作教程5(必看)
  19. Qt:55---QT创建和使用静态链接库(.lib、.a)
  20. linux基础命令集.,Linux学习:Linux基础命令集(1)

热门文章

  1. html另存为对话框,前端实现弹出“另存为”对话框的三种方式
  2. java中的解耦_java-了解如何解耦
  3. ShardingSphere 5.2.1 发布|新增系统库、强制分片路由、一致性校验
  4. php杂谈【基础篇】之_7.PHP涉及的所有英文单词
  5. PCLint使用介绍
  6. mysql学习日常操作
  7. sendgrid_电子邮件即服务第2部分:Sendgrid,Mailgun和邮戳
  8. 索尼计算机bios正确设置,索尼笔记本电脑怎么进入Bios,小编教你如何四步完成
  9. 刑侦 技侦 警种
  10. 电脑连接wifi怎么显示宽带连接服务器,电脑中只显示宽带连接不显示wifi是怎么回事...