乾明 发自 凹非寺 量子位 报道 | 公众号 QbitAI

镜子里的人,是人吗?对于计算机视觉系统来说:是。

大部分系统也不考虑镜子因素,它们很难分清楚镜中人。

镜子作为日常生活中非常重要的物体无处不在,不仅能够反射光线,能呈现出周围物体或者场景的镜像。

这就导致计算机视觉系统或者机器人一旦遇到有镜子的场景,性能就会大幅下降,可以说是遇到了克星。

怎么办?来自大连理工、鹏城实验室和香港城市大学的研究团队提出了一个方法。

他们发表了一篇名为Where Is My Mirror?的论文,已经被ICCV2019收录。

在这篇论文中,他们构建了一个大规模的镜像数据集,并提出了一种从输入图像中分割镜子的新方法。

不仅能够准确识别并分割出场景中的镜子,还能够消除由于镜子反射所导致的对于场景的错误理解,并帮助一些计算机视觉任务(例如深度估计和目标检测)提升鲁棒性。

他们说,这是首个解决镜子分割的方法,经过大量的实验表明,性能表现比最先进的检测和分割方法都要好。

未来,他们的目标是检测出现在城市街道上的镜子,这对户外执行的视觉任务——自动驾驶和无人机导航——都有助益。

Where Is My Mirror?

对于计算机视觉系统来说,镜子反射的内容与镜子外部的内容(即周围环境)非常相似,它们很难区分出来,更不用说从一个背景中自动分割镜子了。

从这点来看,系统是比不上人的。大多数人类,通常能很好地察觉镜子的存在。

向人类学习,成了这篇论文的突破点。研究人员观察到,人们识别镜像中的内容,通常会从边界入手,观察其不连续性。

因此,这个问题的一个直接的解决方案,是应用低层次的特征,比如颜色和纹理变化,来检测镜子边界。

但如果一个镜子前面有物体遮挡,这个方法就不管用了,比如这样的情况:

单靠检测镜子边界很难将对象的反射与对象本身分离开,也需要语义,即上下文对比信息来进行进行分割。

基于此,研究人员从两个方面来解决镜子分割问题:数据和神经网络。

自建数据集

因为这一领域之前并未有太多人关注,自然也没有可用数据集。

于是他们就自己动手,创建数据集MSD,包含4018对包含镜子和相应的手动注释的蒙版图像。

其中,有3677张来自室内场景,341张来自室外场景,基本上涵盖了生活中常见的出现镜子的场景:化妆台、装饰品、浴室、路面镜子、卧室、办公室、花园、街道和停车场。

最后有3063张图像用于训练,955张图像用于测试。

怎么找镜子?

论文中提出的镜子分割网络MirrorNet的架构,以单幅图像为输入,通过特征提取网络(FEN)提取多层特征。

然后,将最深层的、语义丰富的特征输入到所提出的上下文对比特征提取(CCFE)模块中,学习上下文对比特征,通过检测对比出现的分界线,用初始的粗糙的镜子分割图来定位镜子。

这一镜子分割图作为注意力图,用于抑制非镜子区域上一层 FEN 特征的特征噪声,使上一层能够集中学习候选镜子区域的鉴别特征。

通过这种方式,MirrorNet逐步利用上下文对比信息以从粗到精的方式细化镜子区域。最后,对最粗的网络输出进行上行采样,得到原始的图像分辨率作为输出。

镜子在这里

自建数据集提出的MirrorNet效果怎么样?

研究人员采用了相关领域中常用的5个度量(即语义分割、显著目标检测和阴影检测) ,对镜子分割性能进行定量评估。

比较对象也都是目标分割领域先进的模型,比如Mask RCNN、R3Net等等。

从这些指标来看,MirrorNet表现都是最佳。

一次跨越南北的合作

这一论文来自大连理工、鹏城实验室和香港城市大学,是一次跨越南北的合作。

第一作者有两位,分别是杨鑫和梅海洋。

杨鑫,大连理工大学计算机学院副教授、博士生导师、学校学科办建设副主任。本科毕业于吉林大学计算机学院,于浙江大学-美国加州大学戴维斯分校计算机学院进行博士生联合培养,获工学博士学位,香港城市大学博士后。

梅海洋,大连理工大学在读博士生,本科也毕业于大连理工大学。研究兴趣为图像处理、计算机视觉和深度学习。

梅海洋介绍称,他们团队围绕镜子,用了一年半的时间进行课题调研、确定问题、制作数据集、设计模型、优化模型,研究成果最终被ICCV2019接收。

后续将围绕城市间建筑表面的镜子来展开研究,以此来进一步扩展问题,缓解各种场景下镜子对于其他视觉任务的影响,提高应用价值。

最后,梅海洋说,关于这一研究的数据集和代码将会开源,希望广大的研究者们能够一起加入到这个问题的研究中~

如果你对这一研究感兴趣,请收好传送门:

https://mhaiyang.github.io/ICCV2019_MirrorNet/index.html

— 完 —

加入社群 | 与优秀的人交流

小程序 | 全类别AI学习教程

量子位QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

大连理工大学计算机视觉实验室,首个镜子分割网络问世,大连理工、鹏城实验室、香港城大出品 | ICCV 2019...相关推荐

  1. 首个镜子分割网络问世,大连理工、鹏城实验室、香港城大出品 | ICCV 2019

    乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 镜子里的人,是人吗?对于计算机视觉系统来说:是. 大部分系统也不考虑镜子因素,它们很难分清楚镜中人. 镜子作为日常生活中非常重要的物体无处 ...

  2. ICCV 2019 | 首个镜子分割网络问世,大连理工、鹏城实验室、香港城大出品

    点击我爱计算机视觉标星,更快获取CVML新技术 乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 镜子里的人,是人吗?对于计算机视觉系统来说:是. 大部分系统也不考虑镜子因素,它们很难分清 ...

  3. 大连理工大学c语言第三次上机作业答案,大连理工大学软件学院C语言上机第五六章课后题...

    大连理工大学软件学院C语言上机第五六章课后题 五.1. #includeint main() { int a,b,c; float X,Y,Z; scanf("%d%d%d",&a ...

  4. 2022年博士招生 | 华南理工大学-鹏城实验室 联培博士 专项计划

    为服务国家创新驱动发展战略,助力粤港澳大湾区发展和深圳中国特色社会主义先行示范区建设,夯实鹏城实验室作为网络信息国家战略科技力量的基础平台,2022年鹏城实验室将联合华南理工大学共同开展博士研究生培养 ...

  5. 2018大连理工计算机考研科目,2018考研大连理工大学优势科目专业

    2018考研交流群:438424323 大连理工大学 大连理工大学作为新中国创立的一所正规等院校,建校来秉承老一辈教育家教育与科学研究并重的办学精神,在超过60年的办学历程中,科学研究实力不断增强,学 ...

  6. 大连理工大学计算机学院院长,谭国真

    谭国真,男,毕业于大连理工大学,博士,大连理工大学计算机系教授.博士生导师.计算机学院院长. 中文名 谭国真 毕业院校 大连理工大学 学位/学历 博士专业方向 计算机科学 职    务 计算机学院院长 ...

  7. 大连理工大学计算机学院讲师名单,大连理工大学学科评估排名!附大工a类学科名单...

    选择科目 测一测我能上哪些大学 选择科目 领取你的专属报告 > 选择省份 关闭 请选择科目 确定 v> 大连理工大学是辽宁省一所知名高校,位于辽宁省大连市,是我国著名的"211大 ...

  8. 大连理工大学计算机软件,大连理工大学计算机软件初试全书.pdf

    附录四 大连理工大学plus 版本 大连理工大学介绍 大连理工大学考纲 810 考纲 887 考纲 大连理工大学历年真题 810 历年真题 2018 年初试 大连理工大学计算机专业课编号为810,包括 ...

  9. 大连八中学2021年高考成绩查询,2021年大连各高中高考成绩排名及放榜最新消息...

    一.2020年大连各高中高考成绩排名及放榜最新消息 普通类文史 特殊类型招生控制分数线:567分 本科控制分数线:472分 专科(高职.提前专科)控制分数线:150分 普通类理工 特殊类型招生控制分数 ...

  10. ​【重磅】鹏城实验室与北大、清华等联合培养博士招生

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要3分钟 Follow小博主,每天更新前沿干货 为主动服务国家粤港澳大湾区重大战略需求,储备战略人才,探索以科研经费承担博士生培养的新机制,自2 ...

最新文章

  1. 『笔记』常用命名规则
  2. 异常处理中throws和throw的区别?
  3. oracle var/tmp,关于/var/tmp/.oracle 目录(ZT)
  4. 使用AspectJ审计Spring MVC Webapp。 第2部分
  5. python为什么没有指针_Python中有指针吗?
  6. 高性能EL——Fel探秘,兼谈EL
  7. 08.为什么要使用lombok,它解决了什么问题?
  8. python希腊字母大小写的转换_在线英文字母大小写转换工具-包含英文大写转小写-字母小写转大写_蛙蛙在线工具...
  9. 计算机设置密码命令,如何为“ rm”命令设置密码?
  10. BZOJ3277 串 【后缀数组】【二分答案】【主席树】
  11. 学生信息管理系统-结构体编写
  12. 嵌入式--串口、RS232、RS485通信
  13. ZZULIOJ:1034: 夏季促销
  14. 重邮计算机专业毕业月薪多少,高校就业质量报告⑥ | 重庆邮电大学2020届毕业生月均收入6800元...
  15. 【19调剂】国家211工程大学、世界一流学科建设高校-福州大学,硕士研究生预调剂通知...
  16. html5一键导航代码,站长有福了-让网址一键添加百度首页导航
  17. 布丁语音小夜灯使用说明书
  18. html缩放比例转为pdf,缩小HTML页面并转换为A4尺寸pdf
  19. 震撼!徐涛朗诵《再别康桥》
  20. OTB数据集的几个注意点

热门文章

  1. 标准C程序设计七---121
  2. HDU 1429--胜利大逃亡(续)【BFS amp;amp; 状态压缩】
  3. jqGrid添加详细按钮,单击弹出窗体
  4. MySQL何时使用索引 何时不使用索引
  5. Python实现Windows电脑定时关机
  6. pandas 下一行减去上一行
  7. C语言中各数据类型和他们对应的最大值和最小值的常量
  8. ArcGIS 城市生活区用地适宜性评价(一)
  9. modis数据产品行列号以及数据行列号
  10. ios 添加浮动效果_iOS 为UITableView的索引 添加浮动放大View显示