点击我爱计算机视觉标星,更快获取CVML新技术


乾明 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

镜子里的人,是人吗?对于计算机视觉系统来说:是。

大部分系统也不考虑镜子因素,它们很难分清楚镜中人。

镜子作为日常生活中非常重要的物体无处不在,不仅能够反射光线,能呈现出周围物体或者场景的镜像。

这就导致计算机视觉系统或者机器人一旦遇到有镜子的场景,性能就会大幅下降,可以说是遇到了克星。

怎么办?来自大连理工、鹏城实验室和香港城市大学的研究团队提出了一个方法。

他们发表了一篇名为Where Is My Mirror?的论文,已经被ICCV2019收录。

在这篇论文中,他们构建了一个大规模的镜像数据集,并提出了一种从输入图像中分割镜子的新方法。

不仅能够准确识别并分割出场景中的镜子,还能够消除由于镜子反射所导致的对于场景的错误理解,并帮助一些计算机视觉任务(例如深度估计和目标检测)提升鲁棒性。

他们说,这是首个解决镜子分割的方法,经过大量的实验表明,性能表现比最先进的检测和分割方法都要好。

未来,他们的目标是检测出现在城市街道上的镜子,这对户外执行的视觉任务——自动驾驶和无人机导航——都有助益。

Where Is My Mirror?

对于计算机视觉系统来说,镜子反射的内容与镜子外部的内容(即周围环境)非常相似,它们很难区分出来,更不用说从一个背景中自动分割镜子了。

从这点来看,系统是比不上人的。大多数人类,通常能很好地察觉镜子的存在。

向人类学习,成了这篇论文的突破点。研究人员观察到,人们识别镜像中的内容,通常会从边界入手,观察其不连续性。

因此,这个问题的一个直接的解决方案,是应用低层次的特征,比如颜色和纹理变化,来检测镜子边界。

但如果一个镜子前面有物体遮挡,这个方法就不管用了,比如这样的情况:

单靠检测镜子边界很难将对象的反射与对象本身分离开,也需要语义,即上下文对比信息来进行进行分割。

基于此,研究人员从两个方面来解决镜子分割问题:数据和神经网络。

自建数据集

因为这一领域之前并未有太多人关注,自然也没有可用数据集。

于是他们就自己动手,创建数据集MSD,包含4018对包含镜子和相应的手动注释的蒙版图像。

其中,有3677张来自室内场景,341张来自室外场景,基本上涵盖了生活中常见的出现镜子的场景:化妆台、装饰品、浴室、路面镜子、卧室、办公室、花园、街道和停车场。

最后有3063张图像用于训练,955张图像用于测试。

怎么找镜子?

论文中提出的镜子分割网络MirrorNet的架构,以单幅图像为输入,通过特征提取网络(FEN)提取多层特征。

然后,将最深层的、语义丰富的特征输入到所提出的上下文对比特征提取(CCFE)模块中,学习上下文对比特征,通过检测对比出现的分界线,用初始的粗糙的镜子分割图来定位镜子。

这一镜子分割图作为注意力图,用于抑制非镜子区域上一层 FEN 特征的特征噪声,使上一层能够集中学习候选镜子区域的鉴别特征。

通过这种方式,MirrorNet逐步利用上下文对比信息以从粗到精的方式细化镜子区域。最后,对最粗的网络输出进行上行采样,得到原始的图像分辨率作为输出。

镜子在这里

自建数据集提出的MirrorNet效果怎么样?

研究人员采用了相关领域中常用的5个度量(即语义分割、显著目标检测和阴影检测) ,对镜子分割性能进行定量评估。

比较对象也都是目标分割领域先进的模型,比如Mask RCNN、R3Net等等。

从这些指标来看,MirrorNet表现都是最佳。

一次跨越南北的合作

这一论文来自大连理工、鹏城实验室和香港城市大学,是一次跨越南北的合作。

第一作者有两位,分别是杨鑫和梅海洋。

杨鑫,大连理工大学计算机学院副教授、博士生导师、学校学科办建设副主任。本科毕业于吉林大学计算机学院,于浙江大学-美国加州大学戴维斯分校计算机学院进行博士生联合培养,获工学博士学位,香港城市大学博士后。

梅海洋,大连理工大学在读博士生,本科也毕业于大连理工大学。研究兴趣为图像处理、计算机视觉和深度学习。

梅海洋介绍称,他们团队围绕镜子,用了一年半的时间进行课题调研、确定问题、制作数据集、设计模型、优化模型,研究成果最终被ICCV2019接收。

后续将围绕城市间建筑表面的镜子来展开研究,以此来进一步扩展问题,缓解各种场景下镜子对于其他视觉任务的影响,提高应用价值。

最后,梅海洋说,关于这一研究的数据集和代码将会开源,希望广大的研究者们能够一起加入到这个问题的研究中~

如果你对这一研究感兴趣,请收好传送门:
https://mhaiyang.github.io/ICCV2019_MirrorNet/index.html

—  —


图像分割交流群

关注最新最前沿的图像分割、实例分割、全景分割技术,扫码添加CV君拉你入群,(如已为CV君其他账号好友请直接私信)

(请务必注明:分割)

喜欢在QQ交流的童鞋,可以加52CV官方QQ群:805388940。

(不会时时在线,如果没能及时通过验证还请见谅)


长按关注我爱计算机视觉

ICCV 2019 | 首个镜子分割网络问世,大连理工、鹏城实验室、香港城大出品相关推荐

  1. 首个镜子分割网络问世,大连理工、鹏城实验室、香港城大出品 | ICCV 2019

    乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 镜子里的人,是人吗?对于计算机视觉系统来说:是. 大部分系统也不考虑镜子因素,它们很难分清楚镜中人. 镜子作为日常生活中非常重要的物体无处 ...

  2. 天津大学计算机网络专业排名,2019计算机考研天津大学先进网络技术与应用重点实验室简介...

    2019考研复习正在紧张的进行中,为了更好的帮助同学们学习.中公小编为大家整理了"2019计算机考研天津大学先进网络技术与应用重点实验室简介"的相关信息,解决各位考生的疑惑,提醒大 ...

  3. 天津大学计算机网络研究所,计算机#2019计算机考研究生天津大学先进网络技术与应用重点实验室简介...

    类目:三人行考研网>计算机>正文 时间:2020-07-27 18:30:302019考研复习正在紧张的进行中,为了更好的帮助同学们学习.三人行小编为大家整理了"2019计算机考 ...

  4. ICCV 2019 Oral | 解读北大提出的期望最大化注意力网络EMANet

    点击我爱计算机视觉标星,更快获取CVML新技术 本文经机器之心(微信公众号:almosthuman2014)授权转载,禁止二次转载. 导读:本文作者为52CV分割群里一位技术大佬,论文中将期望最大化机 ...

  5. 让机器也拥有品味!时尚图像补全网络FiNet| ICCV 2019 Oral

    点击我爱计算机视觉标星,更快获取CVML新技术 本文对ICCV 2019 Oral 论文 FiNet: Compatible and Diverse Fashion Image Inpainting进 ...

  6. ICCV 2019 | 微软开源无监督学习的医学图像配准方法:递归级联网络

    点击我爱计算机视觉标星,更快获取CVML新技术 编者按:目前,深度学习正广泛应用于医学图像配准领域.无监督机器学习方法能够广泛利用临床中产生的大量原始.无标注医学图像,然而现有算法对于变形大.变化复杂 ...

  7. ICCV 2019 | 旷视研究院提出文字检测新方法:像素聚合网络PAN

    本文介绍ICCV 2019 旷视研究院提出任意形状文字检测模型:像素聚合网络 PAN,它考虑了任意文字识别过程中速度与精度的权衡,在大幅提升识别性能的同时也显著降低了计算量,成为当前该领域最佳方法. ...

  8. ICCV 2019 | 清华等联合提出高精度、高效率点云3D重建网络框架PointMVSNet

    点击我爱计算机视觉标星,更快获取CVML新技术 机器之心发布 作者:Rui Shen.Songfang Han.Jing Xu.Hao Su 本文介绍了一种基于点云的 MVS 神经网络框架 Point ...

  9. ICCV 2019 | ActivityNet 挑战赛冠军方案—时序动作提名,边界匹配网络详解

    点击我爱计算机视觉标星,更快获取CVML新技术 本文作者为百度视觉技术部林天威,转载自知乎Video Analysis 论文笔记专栏: https://zhuanlan.zhihu.com/p/754 ...

最新文章

  1. MyEclipse10整合Axis2插件
  2. 【 MATLAB 】序列运算之序列移位的函数实现
  3. python-面向对象
  4. Spring boot 字符集编码
  5. Node.js 框架设计及企业 Node.js 基础建设相关讨论
  6. creator 静态属性_CocosCreator cc.class声明类
  7. Spring Data JPA 常用 CRUD 操作汇总 及 关联关系( 操作 h2 内存数据)
  8. html 广告加载页面,JS广告代码延迟加载或是最后加载加快页面载入
  9. harmonyos2.0是什么,HarmonyOS 2.0 Beta是什么?HarmonyOS 2.0 简介
  10. Meet Hadoop
  11. MAC地址和IP地址
  12. shell 变量五 字符串掐头去尾
  13. android 关机闹钟 实现,android 关机闹钟
  14. AppCan开发框架
  15. 20级网络学生---循环
  16. 常见商品期货量化易略
  17. python简单游戏程序-python基础练习之几个简单的游戏
  18. 哪里可以免费下载适合Mac版苹果电脑端解压缩软件
  19. Arduino学习笔记(5)-- 步进电机转速和方向控制
  20. X86 第一条CPU指令及BIOS Shadow

热门文章

  1. Namomo Spring Camp Div2 Week1 - 第五次打卡
  2. c语言 printf_C语言(4) 屏幕输出指令printf
  3. python 拟牛顿法 求非线性方程_C语言实现迭代法求非线性方程的根
  4. python 路径格式化_Python Black 一键格式化美化代码
  5. html5 数据初始化,使用HTML5中的element.dataset操作自定义data-*数据
  6. showmount -e (CVE-1999-0554) NFS漏洞解决方案
  7. php点击按钮跳转页面heeader,php - 通过FPDF生成后插入水印并打印PDF - SO中文参考 - www.soinside.com...
  8. 传感器工作原理_光电式速度传感器的工作原理
  9. 南师大计算机毕设,南京师范大学是名牌大学吗?南师大毕业当老师难吗?
  10. python 雪花id_基于python实现雪花算法过程详解