作者丨lam lau@知乎

来源丨https://zhuanlan.zhihu.com/p/358337679

编辑丨深话AI

后台回复:0322 ,即可下载本文论文PDF和代码

本文是港科大陈启峰老师组的一篇文章,不得不说,从learning to see in the dark到现在,陈老师组做的底层视觉的相关工作都对我很有启发。

大家做计算机视觉应该知道,计算机视觉任务大致可以分为高层(检测,分类),中层(语义分割)和底层(超分辨率..)的任务。越偏向高层的任务越需要语义的信息和人的理解,越底层的任务越注重边缘,纹理之类local的细节。其实高层任务也有偏底层的任务,如单目标跟踪(tracking)。底层任务也有需要语义理解的,今天介绍的去反光(reflection removal)就是一个。

我们平时透过玻璃看外面的风景的时候,因为玻璃的反射,所以不可避免的会有反光内容的干扰,这些反光的内容各种各样,有的情况反光强烈的时候连人都无法辨别哪些内容是反光,哪些是真实的物体信息。

因此就需要引入一些外部信息来帮助我们。最常见是采用偏光镜技术,也有一些对应的论文。但是偏光镜技术会造成颜色偏移。去年cvpr,brown组有一篇用dual pixel技术来做的。

至于用闪光图像来辅助做的,去年有一篇文章。

Siamese dense network for reflection removal with flash and no-flash image pairs. IJCV, 2020

这篇文章就是对IJCV这篇文章更进一步的探讨。

一. 理论部分:

图1 用闪光灯拍照的三种情况

我们先分析一下论文中的这张图像吧。先看图(a),蓝色矩形是玻璃后的物体,红色圆形是反射的物体。(a)就是不开闪光的时候,因为有环境光的存在(ambient light),所以相机接收到了蓝色矩形和红色圆形的信息。我们用代替吧

再来看(c)当有闪光灯和环境光的时候,因为闪光灯是有方向性的(对着蓝色物体射),因此反光灯的光只是照着蓝色物体,这样进入相机的信息就有了三个:环境光对着蓝色矩形,环境光对着红色圆形,反光灯对着蓝色矩形:所以总的光是

然后我们发现了什么?  就是剩下闪光灯对着蓝色物体的光了(图(b))。也就是说,这两个图像一减,红色圆形/反光的物体,就从相机中消失了!是不是很神奇?

可是理论很丰满,现实很骨感。科学家把这个图像拿出来一看,发现偏色的厉害T_T, 看下面那个图的Flash only image,就相当于图1(b),原图则是下图的our transmission。可能的原因是跟闪光灯的曝光和环境光的不同等的有关系。

图2

但是这个flash-only image吧,肯定可以作为一个线索来帮助去反光的。因为他的图都已经没有反光了,只是有一点色偏。

二. 工程部分:

图3

图三就是整个网络的结构,(a)就是我们第一部分说的如何得到,也就是flash-only image的过程。(b)则是利用flash-only image,用神经网络训练去除反光的过程。

论文里的图有点迷惑,我看的时候有点懵,具体看我标的红线和蓝色线。

提几个要点吧,具体的可以去看论文:

1.(a)中可以看出,我们获得的两张图的相减是在raw域进行的。然后用isp变回rgb域。flash-only image图的白平衡其实是做的不太对的,因为他采用了另外一张图的meta-data。

2. 图(b)说的是,先预测一个反射的反光图  ,再预测去反射后的图像。至于为啥不直接预测图像。文章中有说明白,这里限于篇幅不阐述。

三. 缺点和优点:

文章中作者自己就说了缺点,

1. 相机假如离拍摄物体比较远,闪光灯的灯到不了拍摄物体,这时候得到的flash-only image可能就是一团黑的。

2. 物体快速移动的时候,两张图像会不一样,这个缺点是所有多帧图像处理都有的缺点吧。

优点:

优点不必多说,有理论创新有工程方法创新。之前说过最佩服的是用硬件和软件结合做底层图像处理的方法。看了一下作者的主页,他们团队在去反光技术上也有很多的积累了,这篇这么solid的文章不得中cvpr啊。

本文论文PDF和代码下载

后台回复:0322 ,即可下载本文论文PDF和代码

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近3000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

CVPR 2021 | 港科大:如何利用闪光图像(flash image)来去除反光?相关推荐

  1. CVPR 2021 | 港科大:如何利用闪光图像(flash image)来去除反光

    文章题目:Robust Reflection Removal with Reflection-free Flash-only Cues 本文是港科大陈启峰老师组的一篇文章,不得不说,从learning ...

  2. CVPR 2021 | 港科大旷视提出ACON:激活还是不激活?学习自定义激活函数

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 本文转载自:GiantPandaCV | 作者:zzk 简介 在该工作中,我们提出了一种名为ACON(Act ...

  3. CVPR 2021 | CoCosNet v2解锁“高配版”图像翻译

    编者按:针对图像翻译(image translation)任务,微软亚洲研究院的研究员们曾在 CVPR 2020 发表的论文中提出了 CoCosNet 算法,解决了图像生成过程中风格精细控制的难题.目 ...

  4. CVPR 2021 | 中科大联合快手,提出人脸伪造检测新方法

    视学算法发布 机器之心编辑部 来自中科大.快手的研究者针对人脸伪造,提出了基于单中心损失监督的频率感知鉴别特征学习框架,将度量学习和自适应频率特征学习应用于人脸伪造检测,实现SOTA性能. 一:背景和 ...

  5. CVPR 2021 | 国防科大:基于几何稳定性分析的物体位姿估计方法

    作者|机器之心编辑部 来源|机器之心 物体 6D 姿态估计是机器人抓取.虚拟现实等任务中的核心研究问题.近些年来,随着深度学习技术和图像卷积神经网络的快速发展,在提取物体的几何特征方面出现了许多需要改 ...

  6. CVPR 2021 | 港大、牛津提出PAConv: 一种位置自适应卷积,点云分类、分割任务表现SOTA

    论文链接: https://arxiv.org/abs/2103.14635 代码: https://github.com/CVMI-Lab/PAConv 一.引言 近年来,深度学习在三维点云处理上取 ...

  7. CVPR 2021 底层视觉最新进展分享

    微软亚洲研究院 2021 CVPR 论文分享会已完美结束.今日起,CV君将根据不同类别的分享主题进行逐一分享,欢迎查收! 今日分享的主题为:底层视觉 论文一 论文名称:Neighbor2Neighbo ...

  8. 大疆、港科大联手!双目3D目标检测实验效果大放送 | CVPR 2019

    作者 | heryms 责编 | Jane CVPR 2019的文章出来了,今天聊聊双目的 3D object detection.这是一篇来自 DJI (大疆)与港科大合作的文章<Stereo ...

  9. CVPR 2022|处理速度仅用0.2秒!港科大腾讯AI lab开源基于GAN反演的高保真图像编辑算法...

    作者丨Tengfei Wang 来源丨港科大.腾讯 AI Lab 编辑丨极市平台 论文:https://arxiv.org/abs/2109.06590 代码:https://github.com/T ...

最新文章

  1. Python多版本共存配置
  2. Bmob云IM实现头像更换并存入Bmob云数据库中(1.拍照替换,2.相册选择)
  3. Embeded linux之移植boa
  4. [UVA - 11865]Stream My Contest(最小树形图+朱刘算法)
  5. RabbitMQ入门教程——发布/订阅
  6. 血红蛋白判断access程序答案_普渡大学开发智能手机应用程序 帮助评估贫血症情况...
  7. linux服务器组件有哪些,推荐几个linux服务器面板
  8. linux系统资格认证,Linux资格认证:Linux操作系统的运行级别
  9. 微信小程序(脱敏处理,通过身份证判断性别,时间段的倒计时)
  10. 最新emlog5.3.1系统YiT模板源码
  11. 买的也忒波折了。。。
  12. Java 获取对象占用内存大小
  13. IO复用模型同步,异步,阻塞,非阻塞及实例详解
  14. 微信小程序之多规格选择
  15. Simulink模块字体设置
  16. 怎样理解电磁兼容电路
  17. 微服务框架dubbo
  18. hadoop 实现文件压缩
  19. 外部数据导入qiime2软件内部
  20. java puzzles_java Puzzles 之 如何正确的判断奇数

热门文章

  1. dd命令测试磁盘读写速度
  2. 举个栗子!Tableau 技巧(93):用 热图标记 地图或散点图
  3. 杭州线上办理水电燃气过户
  4. 2000元 组装车 思路
  5. turtle绘画,设置画布的背景图片
  6. RationalDMIS 2020旋转坐标系
  7. Python包镜像网站
  8. Ubuntu系统耳机没声音
  9. 创造与魔法维护服务器奖励,创造与魔法5月最新兑换码大全 创造与魔法礼包码2021及使用方法一览...
  10. 2019网红带货电商新趋势,与传统电商说再见-云秀传媒