摘要

在许多图像识别任务中,对几何变换的不变性是自动分类器非常理想的特性。然而,目前尚不清楚最先进的分类器在多大程度上对旋转和平移等基本变换保持不变。这主要是由于缺乏适当测量这种不变性的通用方法。在本文中,我们提出了一种系统方法来量化任何分类器的几何变换不变性。我们的关键思想是将评估分类器不变性的问题转化为the computation of geodesics along the manifold of transformed images。我们提出了基于efficient Fast Marching算法的Manitest方法来计算分类器的不变性。我们的新方法特别量化了the importance of data augmentation for learning invariance from data, and the increased invariance of convolutional neural networks with depth。We foresee that the proposed generic tool for measuring invariance to a large class of geometric transformations and arbitrary classifiers will have many applications for evaluating and comparing classifiers based on their invariance, and help improving the invariance of existing classifiers.

1 简介

由于最近在计算机视觉和机器学习领域进行的大量的研究工作,目前最先进的图像分类系统在某些数据集上的精度已接近人类视觉系统[18,33]。现在我们需要回答的一个问题就是人类视觉系统和最先进的分类器之间还有什么区别。这篇文章我们重点讨论一个关键区别,即几何变换不变性问题。虽然人类视觉系统在一定程度上对几何变换是不变的,但我们还不清楚自动分类器是否具有相同的不变特性。最近的工作[22,30]概述了不变性在分类器中的重要性,并通过使用适当的距离度量调整分类规则[11,16,29,36]或改进用于分类的特征[1,4,24],提出了变换不变性分类的有效解决方案。为了验证这些新的设计选择,并了解如何进一步提高分类器的不变性,开发通用方法来正确测量分类器对数据样本几何变换的鲁棒性变得非常原始。之前的工作提出了评估分类器不变性的方法,可以通过简单图像中的受控变化[3],也可以通过对流行神经网络结构特征的特定测试[13]。然而,这些以前的研究是有限的,因为它们仅限于一维变换(例如,仅旋转)、特定类型的分类器(例如,神经网络)或简单图像(例如,正弦图像),并且基于启发式驱动量。测量不变性的另一种方法是用变换后的图像生成数据集,并测量这些数据集上分类器的准确性[19,21,31]。这是多么费劲,需要构建一个新颖、设计良好的数据集,以便在一个共同点上比较所有分类器。

Manitest: Are classifiers really invariant?论文解读相关推荐

  1. 【尺度不变性】An Analysis of Scale Invariance in Object Detection – SNIP 论文解读

    [尺度不变性]An Analysis of Scale Invariance in Object Detection – SNIP 论文解读 前言 本来想按照惯例来一个overview的,结果看到1篇 ...

  2. CVPR2020论文解读:CNN合成的图片鉴别

    CVPR2020论文解读:CNN合成的图片鉴别 <CNN-generated images are surprisingly easy to spot- for now> 论文链接:htt ...

  3. 收藏指数爆表!CVPR 2018-2019几十篇优质论文解读大礼包! | 技术头条

    点击上方↑↑↑蓝字关注我们~ 「2019 Python开发者日」,购票请扫码咨询 ↑↑↑ 作者 | Olga Liakhovich 译者 | AI科技大本营编译志愿者团队 编辑 | Jane 出品 | ...

  4. AutoDL论文解读(二):基于遗传算法的典型工作

    自动化机器学习(AutoML)最近变得越来越火,是机器学习下个发展方向之一.其中的神经网络结构搜索(NAS)是其中重要的技术之一.人工设计网络需要丰富的经验和专业知识,神经网络有众多的超参数,导致其搜 ...

  5. cnn生成图像显著图_CVPR2020论文解读:CNN合成的图片鉴别

    CVPR2020论文解读:CNN合成的图片鉴别 <CNN-generated images are surprisingly easy to spot... for now> 论文链接:h ...

  6. 自监督学习(Self-Supervised Learning)多篇论文解读(下)

    自监督学习(Self-Supervised Learning)多篇论文解读(下) 之前的研究思路主要是设计各种各样的pretext任务,比如patch相对位置预测.旋转预测.灰度图片上色.视频帧排序等 ...

  7. 自监督学习(Self-Supervised Learning)多篇论文解读(上)

    自监督学习(Self-Supervised Learning)多篇论文解读(上) 前言 Supervised deep learning由于需要大量标注信息,同时之前大量的研究已经解决了许多问题.所以 ...

  8. 可视化反投射:坍塌尺寸的概率恢复:ICCV9论文解读

    可视化反投射:坍塌尺寸的概率恢复:ICCV9论文解读 Visual Deprojection: Probabilistic Recovery of Collapsed Dimensions 论文链接: ...

  9. 从单一图像中提取文档图像:ICCV2019论文解读

    从单一图像中提取文档图像:ICCV2019论文解读 DewarpNet: Single-Image Document Unwarping With Stacked 3D and 2D Regressi ...

  10. 点云配准的端到端深度神经网络:ICCV2019论文解读

    点云配准的端到端深度神经网络:ICCV2019论文解读 DeepVCP: An End-to-End Deep Neural Network for Point Cloud Registration ...

最新文章

  1. 世界首个2nm制程芯片公布!这次IBM跑在了台积电三星英特尔前面
  2. 光流 速度_[论文笔记] FlowNet 光流估计
  3. 线程模型、pthread 系列函数 和 简单多线程服务器端程序
  4. C++成员变量初始化顺序问题
  5. 如何删除Windows 7的保留分区
  6. .NET版Web后台快速开发框架 Coldairarrow
  7. SpringCloud创建Eureka模块
  8. 黑马程序员-Map集合
  9. CES Asia专题|VR、AR硬件一箩筐,迭代升级亮点不多
  10. 浅析微信支付:1前篇大纲
  11. Eclipse-cdt 配合 gdbserver 进行 arm 程序远程调试 上
  12. 有价值的产品=设计思维+精益创业+敏捷方法
  13. 365天口才训练计划
  14. 用VMware安装Windows 8.x虚拟机镜像系统详细流程
  15. Android 360度全景图片 源码
  16. vscode及typro快捷键
  17. php面包屑源码,推荐两款好用的WordPress面包屑插件
  18. 解决win10自带播放器 HEVC视频扩展 需付费方法
  19. 2017acl---Learning Cognitive Features from Gaze Data for Sentiment and Sarcasm Classification笔记
  20. 图像拼接(十):OPenCV stitching和stitching_detailed

热门文章

  1. java中包定义_java中包的定义与使用
  2. android 权限管理详解,EasyPermissions源码浅析
  3. Android ViewDragHelper的简单分析(一)
  4. Gson之TypeAdapter的工作原理分析(1)
  5. 如何定义一个类对象并用next()的方法使用_python零基础必读--可迭代对象、迭代器与生成器...
  6. ble主服务的uuid 是一致的吗_nrf52832 开发之添加DFU服务
  7. python中列表去重有哪几种方法_python列表里的字典元素去重
  8. x1电源灯一直闪_小器鬼LED平板灯 | 明亮好光,洁净好家
  9. 怎么查询sybase money列数据长度_用PBI分析上市公司财务数据(一)
  10. python列表排序sort_python列表排序方法reverse、sort、sorted