本文内容将着重分析当前GAN原理及其应用场景,比对其相对于传统深度学习方法在图像生成等方面的区别

一、原始GAN原理

          原始GAN论文中的思想为生成模型与判别模型间的零和博弈,通过对抗式的训练,生成模型G捕捉样本数据的数据分布,判别模型则是一个二分类模型,估计一个样本来自训练数据(而非生成数据)的概率。G和D一般都是非线性映射函数,如多层感知器(朴素GAN)/卷积神经网(DCGAN)等。
         训练过程中GAN网络中的生成器模型G的目标就是生成看上去尽量真实的数据去欺骗判别器D,而D作为一个二分类模型,目标为判断输入的数据是否“真实”,对于其认为的”真实“的数据输出值会尽量接近1,反之数据逼近于0,代表认为不可能是真实图片,由此形成一种动态博弈过程。博弈的理想结果为,在判别器已经很强大的情况下,仍然无法分辨来自生成器模型的数据是否是真实的,即此时的D(G(Z))=0.5.此时便得到了训练结果:生成模型G,输入相应的量便能根据G捕获的数据分布实现相应数据的生成。
 

二、原始GAN优缺点

2.1GAN框架有着很多的优点:
GAN能训练任何一种生成器网络,不需要设计遵循任何种类的因式分解模型;
任意的生成网络(G)和鉴别网路(D)都会有用(只要网络可微分),GAN只需要反向传播而不需要利用马尔科夫链反复采样(传统生成模型必备);
通过引入内部对抗训练机制,无需在学习过程中进行推断,回避了近似棘手的概率问题,可以逼近一些不是很容易计算的目标函数
④生成器模型G的参数更新不来自于数据样本本身(不是对数据的似然性进行优化),而是来自模型D的一个反传梯度)
 
2.2GAN框架的主要缺点:
①可解释性差,生成模型最终捕获的数据分布Pg(D)没有显示的表达,只是一个黑盒子一样的映射函数,输入是一个随机变量,输出是需要的数据分布。
网络在训练过程中很难收敛,由于要平衡两个模型G和D的最优化,因此很容易陷入局部最优导致模型崩溃。 
 
三、GAN应用
         目前GAN主要的应用方向有:图像增强图像变换图像生成,核心技术仍然是利用GAN对训练数据分布的捕获能力,如超分辨率图像的数据分布特点、语义分割图的数据分布特点,彩色图片的数据分布特点、艺术风格图片的数据分布特点等。数据分布的捕获结果体现在生成模型G内
 
 

总结:以上应用都是利用了GAN对目标数据的数据分布特点捕获的能力(个人认为也是GAN能实现数据生成最强大的地方)
四、传统CNN实现艺术风格转换 VS GAN框架实现艺术风格转换
4.1 A Neural Algorithm of Artistic Style
          最早使用深度学习中的CNN框架进行艺术风格转换,利用CNN中逐级的卷积层实现对style风格图和content底图的局部/全局纹理特征进行提取,再利用设计好的损失函数进行全局优化,调整噪声图内容使得其在VGG网络对应卷积层的特征输出同时逼近艺术风格图和内容图。每进行一次反向传播,都使得原噪声图得到微调,逐步逼近最终的效果图。
         其主要的缺点在于速度太慢,因为每一次生成都相当于重新训练一个模型,在线训练的方式使其无法满足实时性,同时无法充分利用海量的离线数据。当需要对大量的图片或者视频进行艺术风格转换时,这种传统的方式显然是不符合需求的。
        优点在于,艺术风格的迁移训练仅仅需要两张图片,不需要海量的图片数据。
 
4.2 Perceptual Losses for Real-Time Style Transfer and Super-Resolution     
        基于GAN框架的前向艺术风格生成模型:将传统的求解全局最优解问题转换成用前向网络逼近最优解,原版的方法每次要将一幅内容图进行风格转换,就要进行不断的迭代,而这篇的方法是先将其进行训练,训练得到前向生成网络,以后再来一张内容图,直接输入到网络中,即得到了具有预先训练的风格内容图。
         这种基于GAN的无监督学习训练方法,只需要一张对应的风格图及一批不同内容的content图,充分利用了离线训练的情况下海量的无标签图片数据,通过生成式对抗网络对数据分布的捕获能力,获取艺术风格纹理分布特点。
 
        该模型一旦训练好,对于输入的内容图就能实现模型对应的艺术风格转换,同时保留内容图的语义信息。即将传统的在线训练模式转换为离线训练,在线前馈测试,大大提高了图像转换的实时性
 
五、GAN框架运用思路整理及疑问
         结合GAN框架对于任意生成网络与判别网络的兼容性,以及零和博弈这种对抗式训练模式对于目标数据分布的捕获能力,GAN框架适用于针对数据的生成与转换,通过零和博弈获取人工设计困难的转换关系(如模糊图像转高清图像,按照传统方法,高频分量丢失造成的信息缺失是很难恢复,但GAN通过捕获高清图像的数据分布特点,实现了转换关系的设计)。
        而从训练数据来源的角度:针对朴素GAN,仅更改训练样本能实现对任意图数据的生成模型训练,且由于无监督学习的特点,数据来源丰富。而通过在训练过程中隐含层引入一定的标签信息,如图像中的位置信息,得到的模型将 能根据输入数据信息,实现更细化的数据生成,如图像翻译,文本->图像等。
         因此,针对GAN的特点,目前已有的思路还是较为集中在其对数据分布特点的捕捉能力上,能否由此发散,考虑其他图像增强和图像变换方面的运用?用于特点环境下的图像数据简化(如去雾)或者特定图像增强(如普通图像转热成像),由此方便机器判断或者个人体验?

GAN框架研究与思路整理相关推荐

  1. 基于GAN框架的时间序列异常检测研究综述

    一项综述类的课程作业 Anomaly detection with generative adversarial networks for multivariate time series. MAD- ...

  2. 王飞跃教授:生成式对抗网络GAN的研究进展与展望

    本次汇报的主要内容包括GAN的提出背景.GAN的理论与实现模型.发展以及我们所做的工作,即GAN与平行智能.  生成式对抗网络GAN GAN是Goodfellow在2014年提出来的一种思想,是一种比 ...

  3. 多智能体强化学习思路整理

    多智能体强化学习算法思路整理 目录 摘要 背景和意义 研究背景 强化学习 多智能体强化学习与博弈论基础 研究意义 问题与挑战 问题分类 问题分析 环境的不稳定性与可扩展性的平衡 部分可观测的马尔可夫决 ...

  4. 【Android 插件化】Hook 插件化框架 ( Hook 实现思路 | Hook 按钮点击事件 )

    Android 插件化系列文章目录 [Android 插件化]插件化简介 ( 组件化与插件化 ) [Android 插件化]插件化原理 ( JVM 内存数据 | 类加载流程 ) [Android 插件 ...

  5. 张铁柱-前端实现《低代码可视化编辑器》(一)思路整理 React-dnd+Ts

    张铁柱-前端实现<低代码可视化编辑器>(一)思路整理 React-dnd+Ts 先上效果: 拖拽生成页面+调整顺序 最近,接到任务做一个低代码编辑器,于是着手整理一下思路,调研一下实现方式 ...

  6. 《生成式对抗网络GAN的研究进展与展望》论文笔记

    本文主要是对论文:王坤峰, 苟超, 段艳杰, 林懿伦, 郑心湖, 王飞跃. 生成式对抗网络GAN的研究进展与展望. 自动化学报, 2017, 43(3): 321-332. 进行总结. 相关博客地址: ...

  7. 新一代深度学习框架研究

    点击上方蓝字关注我们 新一代深度学习框架研究 于璠 华为技术有限公司,广东 深圳 518000    摘要:从人工智能的历史出发,简述深度学习发展历程以及目前的挑战,通过介绍新一代深度学习框架的特点, ...

  8. 网络IP检测框架的基本设计思路

    网络IP检测框架的基本设计思路 一.考虑IP相关的应用需求 (1)在线休闲游戏中,有些房间为了防止玩家"开黑店"作弊,限制了同一个IP的两个账号不能同时登录同一个房间,然而玩家通过 ...

  9. 2021美赛D题艺术家思路整理

    问题整理 使用influence_data数据集或其部分创建音乐影响力的(多个)定向网络,其中影响者与关注者相连.开发捕捉此网络中"音乐影响的参数".通过创建定向影响网络的子网络来 ...

最新文章

  1. 【c语言】蓝桥杯算法训练 斜率计算
  2. selenium学习笔记(一)
  3. OpenCASCADE:使用扩展数据交换 XDE之几何尺寸和公差 (GDT)
  4. 使用轮转算法求时间片_彩票调度算法,让进程们拼手气? --当操作系统遇上随机算法...
  5. F#与ASP.NET(1):基于事件的异步模式与异步Action
  6. webService学习2:hello word入门
  7. 5 年之后,产品经理,没了?
  8. cefpython基础入门
  9. 学习笔记 04----声明和类
  10. python输入文本的缩写是什么_Python如何使用NLP从缩写文本中插入单词?
  11. matlab数字信号处理 王彬 pdf,MATLAB数字信号处理
  12. oracle手把手教学资料
  13. window自带字体
  14. 2018ACM/ICPC 焦作网络预选赛-A Magic Mirror
  15. 深度学习入门——利用卷积神经网络训练CIFAR—10数据集
  16. 斯坦福大学计算机科学专业硕士排名,斯坦福大学计算机系统研究生排名关键的都看过来...
  17. 网站 502 解决方法
  18. Markdown——下载链接与语法说明
  19. IP地址非你在商户平台设置的可用IP地址
  20. 计算机组织有CPU,计算机组织与结构 复习题 练习-cpu and memory(3页)-原创力文档...

热门文章

  1. 关于全量与增量 的思考
  2. 计算机一级字幕设置,字幕怎么用-看电影没字幕怕什么!老司机教你手动设置字幕!...
  3. 服务器系统排行榜,服务器操作系统排行榜
  4. Python批量下载ts视频文件,并用ffmpeg合并
  5. eclipes使用方法
  6. mac上使用qt,进行输入法的开发
  7. iOS图像渲染 + 动画探索
  8. Mysql相关操作与命令
  9. nvidia驱动安装,屏幕偏移调整,及屏幕刷新率解决办法(摘自:中国Linux公社)
  10. 基于网络小型文件型的数据管理系统