论文名称:

Understanding Deep Image Representations by Inverting Them, CVPR 2015

Prerequisite:Convolutional Neural Network, Linear Algebra, Integral, 

需要熟悉CNN的训练流程,达到可以剖析每一步是干什么用的程度。知道loss function作用,和CNN是怎么encode图像的概念。

==========Motivation==========

这篇文章我没有看完,或者可以说是挑着我最关心的问题看的,就是Total Variation。其他的跟我的研究无关,所以暂且只讲这一个点。

一开始看这篇论文的初衷是因为我看过的前一篇关于Perceptual Loss的文章。其中的loss由三部分组成,perceptual loss,L2 loss 和 total variation。perceptual loss 和L2好理解,可是total variation一笔带过,根本没有细说。后来在我训练的应用中发现这个loss几乎不怎么收敛。所以我希望搞明白从数学层面上这到底是个什么,在做什么事情。这样我就可以根据自己的研究调整参数,甚至如果根本不需要加这个loss可以干脆去掉。

在进行了大量的调研之后,找到了一些有用的东西。首先是Perceptual loss的作者Justin Johnson在他的github上回复了别人的类似疑问,这里。Justin把解释指向本论文的一段说明。但是其实本文也没有细说total variation是个啥,只是在应用的层面上给出了经验性的实验结果。即调整不同的参数对输出图像的影响。

Total Variation(TV)的方程是这样的:

但是在图像中,连续域的积分就变成了像素离散域中求和,所以可以这么算:

也就是说,求每一个像素和横向下一个像素的差的平方,加上纵向下一个像素的差的平方。然后开β/2次根。

文中对β的取值有所描述。当β < 1时,会出现下图左侧的小点点的artifact。

当β > 1时,图像中小点点会被消除,但是代价就是图像的清晰度。

其实,这个效果最先来源于Nonlinear total variation based noise removal algorithms这篇论文。Rubin等人在1990年左右观察到受噪声污染的图像的TV比无噪图像的总变分明显的大[1]。 那么最小化TV理论上就可以最小化噪声。至于从数学层面上的意义到底是什么,为什么算偏导数的平方,我也不明白。在这里,视频的发布者对于TV的直观理解有一个相对比较清晰地解释。

也就是说,图片中相邻像素值的差异可以通过降低TV loss来一定程度上解决。比如降噪,对抗checkerboard等等。

Reference:

1,https://blog.csdn.net/tianrolin/article/details/44101197

Total Variation相关推荐

  1. 转载:全局拉普拉斯平滑之(1)Strucutre extraction from texture via relative total variation及稀疏矩阵求解...

    全局拉普拉斯平滑之(1)Strucutre extraction from texture via relative total variation及稀疏矩阵求解 2018年01月31日 22:04: ...

  2. An efficient augmented Lagrangian method with applications to total variation minimization论文阅读笔记

    An efficient augmented Lagrangian method with applications to total variation minimization论文阅读笔记 论文信 ...

  3. Infrared and visible image fusion using total variation model(采用全变差模型的红外与可见光图像的融合)

    由于研究需要,在非专业学习的基础上对<Infrared and visible image fusion using total variation model>进行了翻译,有翻译不对之处 ...

  4. 图像合成与风格转换实战

    图像合成与风格转换实战 神经式转移 Neural Style Transfer 如果使用社交分享应用程序或者碰巧是个业余摄影师,对过滤器很熟悉.滤镜可以改变照片的颜色样式,使背景更清晰或人的脸更白.然 ...

  5. 深度学习在计算机视觉中的应用长篇综述

    深度学习在计算机视觉中的应用长篇综述 前言 2012年ImageNet比赛,使深度学习在计算机视觉领域在全世界名声大震,由此人工智能的全球大爆发.第一个研究CNN的专家使Yann LeCun,现就职于 ...

  6. 联邦学习的隐忧:来自梯度的深度泄露

    作者 | Ligeng Zhu and Song Han 编译 | 对外经济贸易大学金融科技实验室 头图 | 下载于视觉中国 [编者按]数据交易流通是数据要素市场建立的关键环节.为了在推动数据流动的同 ...

  7. 万字长文带你入门 GCN

    来源 | 阿泽的学习笔记(ID: aze_learning) Convolutional Neural Network CNN 在图像识别等任务中具有重要作用,主要是因为 CNN 利用了图片在其域中的 ...

  8. 基于深度学习的低光照图像增强方法总结(2017-2019)| CSDN博文精选

    扫码参与CSDN"原力计划" 作者 | hyk_1996 来源 | CSDN博客精选 之前在做光照对于高层视觉任务的影响的相关工作,看了不少基于深度学习的低光照增强(low-lig ...

  9. 超全!深度学习在计算机视觉领域的应用一览

    作者 | 黄浴,奇点汽车美研中心首席科学家兼总裁 转载自知乎 简单回顾的话,2006年Geoffrey Hinton的论文点燃了"这把火",现在已经有不少人开始泼"冷水& ...

  10. 【GCN】万字长文带你入门 GCN

    断断续续写了一个多星期,期间找了很多同学讨论学习,感谢指导过点拨过我的同学们,为了精益求精本着不糊弄别人也不糊弄自己的原则在本文中探讨了很多细节. 当然,还有很多细节没提到,包括总变差(Total V ...

最新文章

  1. linux防火墙伦堂,「linux专栏」自从看了这篇文章,我彻底搞懂了selinux和防火墙...
  2. ovs router
  3. 王晖:以Linux为核心扩展云核心组件
  4. 场景/故事/story——寻物者发布消息场景、寻失主发布消息场景、消息展示场景、登录网站场景...
  5. A Star寻路相关资料汇总
  6. 永洪报表工具_2020年最值得推荐的五大BI工具
  7. ibatis.net:第六天,QueryForList
  8. 用haslib给字符加密
  9. Fedora Remix for WSL 登陆微软商城
  10. 如何设计一个好看的 404 错误页面 ?
  11. pcb板led正负极图形_晶体二极管正负极判断_晶体二极管图形符号
  12. 复杂的密码学也可以人人可懂
  13. 看完这篇文章,线上再遇到Jedis「Redis客户端」异常相信你不再怕了!
  14. zephyr如何添加pwm支持
  15. 基于matlab的手写体数字识别系统,基于matlab的手写体数字识别系统研究
  16. rca接口_常用的音频接口及焊接方法
  17. 生命的轨迹会沿着期望的方向走去
  18. java给日期date加上23:59:59
  19. 这些东西不宜空腹吃[转]
  20. Web页面动态验证码

热门文章

  1. UFS学习一:UTP层和UPIU
  2. 关闭Typora拼写检查功能
  3. 纹理(讲得比较详细的文章)
  4. php deprecated,PHP Deprecated: Function eregi() is deprecated解决方法
  5. ddwrt php,DDWRT脱机下载+架设网站修正加强版tar.gz模式发布
  6. 12306验证码识别
  7. 微信小程序客服自动推送欢迎语php,如何实现小程序客服自动提示回复小程序卡片,弹出对应内容?小程序客服系统...
  8. php 输入经纬度查询位置,根据经纬度查询附近地点信息
  9. html 文字自动转大写
  10. Swagger导出pdf文档