Distort-and-Recover: Color Enhancement using Deep Reinforcement Learning

  • 摘要
    • Introduction
    • Problem Formulation
    • Automatic Color Enhancement
      • Features
      • agent
      • Distort-and-Recover Training Scheme
    • 结果

)

摘要

提出了一个基于深度强化学习的方法,用于颜色强化;将颜色强化看做一个马尔科夫决策,然后训练一个agent,去学习每步中最优的全局强化序列;此外,还提出了一个“失真-复原”的训练方案,仅需要高质量的参考图像用于训练(不用input-retouched图像对)

Introduction

本文提出了一个自动进行色彩强化的方法. First,提出了深度强化学习DRL对色彩强化(如下图)。将色彩强化问题看作一个马尔科夫决策MDP,每步行为(选择白平衡、上下文、亮度等操作)都可看做一个全局的颜色调整操作。它是一个迭代的过程,类似于人类一步一修图。之后使用DQN来解决MDP问题。

Second
提出了一个“distort-recover”训练方案。仅仅通过一系列的高质量参考图片来学习色彩强化。随机地对参考图像进行畸变,产生“distort-and-recover’”图像对。
Contributions
1.色彩强化agent可在无监督的情况下学习每次的润饰action。
2.提出“distort-and-recover”方案训练agent。
3.可在不知道色彩分配的情况下强化图像。
加粗文本 加粗文本
标记文本

引用文本

Problem Formulation

作者将输入图像记: I;
对其进行的调整action记为:A;
图像I(t)表示第t次使用上下文特征Fcontext(I(t))和全局色彩特征Fcolor(I(t))的图像;
A(t)表示每一次根据决策Ωθ确定的action;
状态S是上下文特征和色彩特征(Fcontext,Fcolor)的组合;
action space是一系列的A;
另外采用专家修饰的图像Itarget作为ground truth,将图像I(t)和图像Itarget的negative L2距离看做色彩审美指标。
最终目的是找到最优的色彩强化序列actions T{Aoptimal(t)⊂A},使得 最小

立即回报函数:当R(t)大于0时,表示第t次润饰的结果比前一次的好,给予一个正向激励;当R(t)小于0时,表示第t次润饰的结果比前一次的差,给予一个负向激励;

效用函数:表示在第t次润饰时选用action A对未来的影响;在训练agent时,根据Q(S(t),A)的值(值越大表示润饰效果越好)选择action

Automatic Color Enhancement

使用预训练的CNN对图像I(t)提取上下文特征和色彩特征,之后将提取的特征输入到agent网络,agent选择最优的action A(作者预先定义了12个actions),直到所有的action的值都为负数时才停止。

Features

上下文特征:选择VGG-16第六层的4096维激活做为上下文特征
色彩特征:采用CIELab颜色直方图,将CIELab空间的每个轴线性量化到20间隔,然后计算落入每个间隔的像素数,得到一个20X20X20维的直方图。

agent

由一个3层的多层感知器组成,并且每层均使用一个ReLu激励函数,使用公式一来训练agent,而决策Ωθ是由ϵ-贪心算法(ϵ=0)决定的.

Distort-and-Recover Training Scheme

对高质量的参考图像进行随机的色彩操作使其失真,得到伪输入-修饰图像对。

  1. 为了在有效的搜索空间提供更清晰的监督信号,在CIELab颜色空间上,将失真图像与参考图像的L2距离保持到10-20之间
  2. 为了防止色彩偏差,使用与DRL-agent动作集不同的全局动作:高光像素/阴影像素上的亮度/上下文/色彩饱和的调整;高光像素C/M/Y/R/G/B上的C/M/Y/R/G/B操作.
  3. 在选择高光像素/阴影像素时,使用soft-像素选择的方法,该方法利用一个变型的sigmoid函数,对高像素/低像素施加较高的权重。
  4. 还使用了基本的亮度/上下文/色彩饱和操作。
  5. 还考虑了简单性。

结果

选择不同特征的结果:

基于input-retouched图像对的不同方法结果对比:

以Pix2Pix为基线的对比结果:

与专家A、B、C、D、E的修饰结果对比:
不同修饰结果对比:

Distort-and-Recover: Color Enhancement using Deep Reinforcement Learning相关推荐

  1. 【论文翻译】Distort-and-Recover: Color Enhancement using Deep Reinforcement Learning

    ABSTRACT: 本文提出--人类修图是按照步骤逐渐进行的序列,于是用MDP建模,训练agent得到一个最优的动作序列.此外,我们提出了一种"失真-复原"训练方案,只需要高质量图 ...

  2. ReLLIE Deep Reinforcement Learning for Customized Low-Light Image Enhancement

    文章目录 ReLLIE Deep Reinforcement Learning for Customized Low-Light Image Enhancement 0 Abstract and In ...

  3. 深度强化学习综述论文 A Brief Survey of Deep Reinforcement Learning

    A Brief Survey of Deep Reinforcement Learning 深度强化学习的简要概述 作者: Kai Arulkumaran, Marc Peter Deisenroth ...

  4. 基于深度强化学习的车道线检测和定位(Deep reinforcement learning based lane detection and localization) 论文解读+代码复现

    之前读过这篇论文,导师说要复现,这里记录一下.废话不多说,再重读一下论文. 注:非一字一句翻译.个人理解,一定偏颇. 基于深度强化学习的车道检测和定位 官方源码下载:https://github.co ...

  5. Deep Reinforcement Learning: Pong from Pixels翻译和简单理解

    原文链接: http://karpathy.github.io/2016/05/31/rl/ 文章目录 原文链接: 前言 Policy-Gradient结构流程图 Deep Reinforcement ...

  6. 论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning

    论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning  2017-06-06  21: ...

  7. Deep Reinforcement Learning 深度增强学习资源

    http://blog.csdn.net/songrotek/article/details/50572935 1 学习资料 增强学习课程 David Silver (有视频和ppt): http:/ ...

  8. 深度强化学习(Deep Reinforcement Learning)的资源

    深度强化学习(Deep Reinforcement Learning)的资源 2015-04-08 11:21:00|  分类: Torch |  标签:深度强化学习   |举报 |字号 订阅 Goo ...

  9. 利用Deep Reinforcement Learning训练王者荣耀超强AI

    Mastering Complex Control in MOBA Games with Deep Reinforcement Learning (一)知识背景 (二)系统架构 (三)算法结构 3.1 ...

最新文章

  1. 运维自动化之 Cobbler 系统安装使用详解
  2. Orange‘s 一个操作系统的实现--Bochs遇到的问题
  3. 语言特性与API设计
  4. 组装电脑的五大注意点
  5. Bootstrap 5款常用模板
  6. 201571030128/201571030118《小学四则运算练习软件软件需求说明》结对项目报告
  7. php程序里的configini_程序员手册 修改php.ini的几种方法
  8. python 格式化工具_Google的Python代码格式化工具YAPF详解
  9. Dictionary Union and Sort by value
  10. IP地址规划之子网划分
  11. brew彻底卸载mysql
  12. 昆明理工大学计算机面试题,2016年昆明理工大学管理与经济学院F003运筹学复试笔试仿真模拟题...
  13. python毕业论文答辩ppt_如何制作优秀的毕业论文答辩 PPT?
  14. 【PMP】变更流程图与说明
  15. 移动应用的黑盒测试(1)
  16. 我整理了50道经典Java算法题,直接进了字节跳动!!
  17. 微信小程序获取微信用户步数
  18. 汽车“核战争”:Arm明年量产下一代架构,“全面计算”战略背后的隐忧
  19. 你是如何进行群发邮件的呢 告诉你一些快速高效的群发邮件方法
  20. 计算机毕业设计-基于VUE+SpringBoot+MyBatis+MySQL的学生作业管理系统

热门文章

  1. PEP 20 – The Zen of Python
  2. ZOJ 3885 The Exchange of Items
  3. SQL基础知识——WHERE
  4. Thinking in Frequency: Face Forgery Detection by Mining Frequency-aware Clues
  5. 安卓开发问题一:在虚拟机上运行APP不能运行,即闪退现象
  6. Zjh游戏(九)登陆注册面板的开发
  7. 如何手动生成ASH报告
  8. centos8及Ubuntu20.4安装docker教程
  9. jxl对某一列设置单元格格式
  10. iTunes Connect 使用总结