点击上方“视学算法”,选择加"星标"或“置顶

重磅干货,第一时间送达

行早 发自 凹非寺
量子位 | 公众号 QbitAI

这回域外物体检测方向出了一个新模型VOS,合作团队来自威斯康星大学麦迪逊分校,论文已收录到ICLR 2022中。

这一模型在目标检测和图像分类上均达到目前最佳性能,FPR95指标比之前最好的效果还降低了7.87%之多。

要知道深度网络对未知情况的处理一直是个难题。

例如在自动驾驶中,识别已知物体(例如汽车、停车标志)的检测模型经常“指鹿为马”,对域外物体(OOD)会产生高置信度的预测。

就像下图中的一头驼鹿,在Faster-RCNN模型下被识别成了行人,还有89%的置信度。

因此域外物体的检测无疑成为了AI安全方面一个很重要的话题。

我们来看看这个模型是怎么对域外物体做出判断的。

VOS如何检测域外物体

在理解VOS之前,不得不提一下域外物体检测困难的原因。

其实也很好理解,毕竟神经网络只是学习训练和测试时的数据,遇到没见过的东西时自然不认识。

为了解决这个问题,得想办法让网络认识“未知”的事物。这怎么办?

VOS想到的办法是,给模型模拟一个域外物体用来学习。

例如下图中的检测情况,其中三团灰点是我们的目标。在没有模拟域外物体时(左),模型只能在大范围内圈住目标。

而在用模拟域外物体训练后(右),模型可以紧凑准确的锁定目标,形成更合理的决策边界。

而一旦目标锁定更精确,只要在这个范围之外,其他物体就可以都判为域外物体。

基于这个想法,VOS的团队构建了这样的框架:

以一个Faster-RCNN网络为基础,在分类头中加入一部分模拟域外物体的数据,和训练集中的数据放在一起,共同构建标准化的不确定性损失函数。

而这些模拟域外物体的数据从哪里来呢?在结构图中可以看出,这些点都来自目标区域(蓝色圆点、黄色方点和绿色三角点)周围,也就是低似然区域。

最后根据置信度的计算,蓝色代表目标检测数据,绿色代表域外物体。

以此判断出图像中的车和驼鹿。

再和许多其他域外物体检测方法做一下比较,就可以看出VOS的优势。

各项指标中箭头向下代表该项数据越小越好,反之代表该项越大越好。

其中FPR95这项最为突出,描述的是OOD样本分类正确率在95%时,OOD样本被错分到ID样本中的概率。

这项成绩相较于之前最好的成绩降了7.87%。

与现有的其他方法相比,也展现出了VOS的优势。

它作为一个通用学习框架,可以适用于目标检测和图像分类两种任务。而之前的方法主要靠图像分类来驱动。

目前该模型已经在GitHub上开源。

作者简介

该模型主要由杜学峰、蔡沐等人提出。

杜学峰本科毕业于西安交通大学,目前在威斯康星大学麦迪逊分校攻读CS博士。

主要研究方向是可信机器学习,包括域外物体检测、对抗鲁棒性、噪声标签学习等。

蔡沐,本科也毕业于西安交通大学,目前为威斯康星大学麦迪逊分校CS博二学生。

研究兴趣集中在深度学习、计算机视觉,尤其是三维场景理解(点云检测)和自监督学习。

该篇论文的通讯作者是Sharon Yixuan Li,目前在威斯康星大学麦迪逊分校任计算机科学助理教授,之前还曾在Facebook AI任研究员。

参考链接:

[1]https://twitter.com/martin_gorner/status/1489671903727915008
[2]https://arxiv.org/abs/2202.01197
[3]https://sites.google.com/view/mucai
[4]https://www.linkedin.com/in/xuefeng-du-094723192/details/experience/
[5]https://github.com/deeplearning-wisc/vos

点个在看 paper不断!

ICLR 2022:AI如何识别“没见过的东西”?相关推荐

  1. ICLR 2022:​PiCO,基于对比消歧的偏标签学习 丨AI Drive

    偏标签学习 (Partial Label Learning, PLL) 是一个经典的弱监督学习问题,它允许每个训练样本关联一个候选的标签集合,适用于许多具有标签不确定性和歧义的的现实世界数据标注场景. ...

  2. 特斯拉AI高管都推荐的张量工具,开源了三年后终于中顶会了! | ICLR 2022 Oral

    博雯 发自 凹非寺 量子位 | 公众号 QbitAI 那个在GitHub标星4.3k的张量操作工具Einops,在开源三年后终于中了顶会! 这是一个统一的.通用的操作张量结构的方法,基于爱因斯坦求和约 ...

  3. ICLR 2022 | 绝艺学会打麻将,腾讯AI Lab提出全新策略优化算法ACH

    感谢阅读腾讯AI Lab微信号第144篇文章.本文介绍「绝艺」在二人麻将游戏环境取得的进展,相关算法及benchmark已开源,论文被机器学习国际顶会 ICLR 2022 接收. 「绝艺」是腾讯AI ...

  4. ICLR 2022 | Facebook AI提出解决表示学习坍塌问题新方法

    Facebook AI团队在ICLR 2022发表了一篇文章,针对表示学习中的坍塌问题,提出了VICREG方法,通过variance.invariance.covariance三种loss的结合约束自 ...

  5. 活动明天见 | DataFunSummit 2022 AI基础软件架构峰会圆桌会

    11月16日晚 19:30-21:00,第四范式技术副总裁.OpenMLDB 项目发起人郑曌受邀主持DataFunSummit 2022 AI基础软件架构峰会圆桌会,将与各位资深专家在线上做深度的交流 ...

  6. 【2022 CCF BDCI 文心大模型创意项目】没见过雪的我们

    一· 前言 呜呜呜有多少南方的孩子还没见过雪呢?反正我是没见过. 真的好想看看诗中"千里冰封,万里雪飘""忽如一夜春风来,千树万树梨花开""大雪压青松 ...

  7. ICLR 2022 | 在注意力中重新思考Softmax,商汤提出cosFormer实现多项SOTA

    ©作者 | 李文 单位 | 中南大学 研究方向 | 自然语言处理 最近读了一篇 ICLR 2022 的论文,对于 attention-softmax 的计算复杂度有了一定的了解,下面是对论文的翻译和笔 ...

  8. ICLR 2022入选论文线上分享预告:一作解读,不容错过

    01 ICLR介绍 ICLR,全称为International Conference on Learning Representations(国际学习表征会议),自2013年成立至今仅九年的时间,它已 ...

  9. ICLR 2022 | 颠覆传统!大规模图像检索系统首次引入「热刷新」模型升级!腾讯清华大学新作...

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 作者:腾讯ARC Lab & 腾讯OVB-AI技术中心 颠覆传统「冷刷新」模型升级范式,腾讯 ARC ...

最新文章

  1. python列表修改数据_使用列表理解修改数据框架列
  2. 最早做无糖茶的统一茶里王,是怎样错过年轻人的?
  3. 【小白学PyTorch】11.MobileNet详解及PyTorch实现
  4. uva1616二分加误差处理
  5. Tiny框架2.0版火热推出
  6. opencv python教程简书_OpenCV-Python系列二:常用的图像属性
  7. Linux基础_Hadoop环境搭建必备
  8. 内存管理:Linux Memory Management:MMU、段、分页、PAE、Cache、TLB
  9. 毕业设计论文封面模板
  10. matlab钢材切割,一种基于MATLAB的钢材裂纹扩展速率试验数据处理方法
  11. 实行计算机远程网上录取.啥意思,河北高考今年继续实行计算机远程网上录取...
  12. airtest自动化测试
  13. 中小企业网站建设方案
  14. 50个漂亮的页面导航设计
  15. 电视墙解码服务器不在线,超高清电视墙服务器
  16. log4j自定义新的级别
  17. Windows7下新建记事本的四种编码方式
  18. Tex资料及问题解决方案汇总
  19. scala类的介绍与操作02
  20. 指针真得比数组快吗?函数调用会拖慢程序多少?++i 比i = i+1 快吗?

热门文章

  1. 每天写的叫工作日志,每周写的总结叫周报,每月写的叫月报
  2. COJN 0575 800601滑雪
  3. 区别:电感、磁珠和零欧电阻的作用
  4. linux网卡绑定脚本
  5. windows线程同步-原子操作-Interlocked系列函数(用户模式)
  6. POJ 1966 Cable TV Network【无向图点连通度 最小割 E-K算法求最大流】
  7. LeetCode实战:格雷编码
  8. LeetCode实战:字符串相加
  9. 算法基础知识科普:8大搜索算法之AVL树(上)
  10. 整理了 65 个 Matplotlib 案例,这能不收藏?