论文:https://arxiv.org/abs/1606.03498

源码:https://github.com/openai/improved_gan

参考:博客1,博客2,博客3

1  介绍

GAN是基于博弈论的生成模型方法。GAN训练一个生成网络来生成尽可能真实的图像,一个判别网络尽可能区分真是图像和生成图像。训练GAN要求找到在连续高维参数下非凸博弈的纳什均衡。但是通常GAN用梯度下降方法去寻找损失函数的最小值,而不是纳什均衡,这可能会导致无法收敛。论文中介绍了几个方法去尽量实现GAN博弈的收敛。这些方法的灵感来源于非凸问题的启发式理解。可以帮助提升半监督学习性能和提升采样生成。

2  相关tricks

首先需要对G做一个处理,使用Feature matching代替原来的关于G的loss函数。

2.1  Feature matching(特征匹配)

Feature matching 中提出,在D(判别器)模型中,添加中间层,称之为f(x)。也就是,不是像以前一样考虑最后的结果(概率),而是考虑在中间层中的数据之间的差异性(这里使用的是二范数的平方)。因为原始的GAN网络的目标函数需要最大化判别网络的输出。作者提出了新的目标函数,目的是让生成网络产生的图片经过判别网络后的中间层的feature 和真实图片经过判别网络的feature尽可能相同。因此生成网络的目标函数定义如下:

判别网络按照原来的方式训练。相比原先的方式,生成网络G产生的数据更符合数据的真实分布。尽管不能保证到达均衡点,不过收敛的稳定性应该是有所提高。

2.2  minibatch discrimination(小批量判别)

判别网络如果每次只看单张图片,如果判断为真的话,那么生成网络就会认为这里一个优化的目标,导致生成网络会快速收敛到当前点。作者使用了minibatch的方法,每次判别网络输入一批数据进行判断。

假设表示判别网络中间层的输出向量,作者将乘以矩阵,得到一个矩阵。计算矩阵每行的L-1距离,得到。定义输入的输出如下:

作为输入,进入判别网络下一层的输入。

2.3  Historical averaging(历史平均)

在生成网络和判别网络的损失函数中添加一个项:

公式中 表示在i时刻的参数。这个项在网络训练过程中,也会更新。加入这个项后,梯度就不容易进入稳定的轨道,能够继续向均衡点更新。

2.4  One-side label smooth(类别标签平滑

将正例label乘以,, 负例label乘以,最优的判别函数分类器变为:

文中将正例label乘以,, 负例label乘以0。

2.5  Virtual batch normalization(虚拟的batch normalization)

Normalization(归一化)使用能够提高网络的收敛,但是BN(批归一化)带来了一个问题,就是layer的输出和本次batch内的其他输入相关。为了避免这个问题,作者提出了一种新的bn方法,叫做virtual batch normalization。首先从训练集中拿出一个batch在训练开始前固定起来,算出这个特定batch的均值和方差,进行更新训练中的其他batch。VBN的缺点也显而易见,就是需要更新两份参数,比较耗时。

3  Semi-supervised learning(半监督学习)

标准的分类网络将数据xx输出为可能的K个classes,然后对K维的向量使用softmax:

标准的分类是有监督的学习,模型通过最小化交叉熵损失,获得最优的网络参数。对于GAN网络,可以把生成网络的输出作为第k+1类,相应的判别网络变为k+1类的分类问题。用来表示生成网络的图片为假,用来代替GAN的。对分类网络,只需要知道某一张图片属于哪一类,不用明确知道这个类是什么,通过可以训练。因此损失函数变为:

如果把,上述无监督的表达式就是GAN的形式(见2014的GAN论文https://blog.csdn.net/weixin_44855366/article/details/119734833):

ImprovedGAN论文略读相关推荐

  1. 【How to Design Translation Prompts for ChatGPT: An Empirical Study 论文略读】

    How to Design Translation Prompts for ChatGPT: An Empirical Study 论文略读 INFORMATION Abstract 1 Introd ...

  2. 论文略读:《地区如何随着时间的推移而多样化?产业关系与地区新增长路径的发展》

    地区如何随着时间的推移而多样化?产业关系与地区新增长路径的发展 阅读时间:2022.04.06 How Do Regions Diversify over Time? Industry Related ...

  3. 论文略读1《Direct training for spiking neural networks:faster,larger,better》

    发布时间2019-07-17,AAAI 文章链接Direct Training for Spiking Neural Networks: Faster, Larger, Better | Procee ...

  4. 论文略读 | Pattern-revising Enhanced Simple Question Answering over Knowledge Bases

    这是何世柱老师团队发表于COLING2018的一篇文章. 一. 文章贡献: 提出进行模式提取和实体链接,并提出模式修改程序来缓解错误传播问题 学习对候选主谓词对进行排序以使得能够在给出问题的情况下进行 ...

  5. 论文略读 | Question Answering on Knowledge Bases and Text using Universal Schema and Memory Networks

    文章创新点: 使用文本和KB组合的通用模式,结合记忆网络来完成问答 提出模型: UNISCHEMA 提出原因: 知识库问答会受到不完整性的影响,文本虽然包含大量事实,但是存在非结构化文本,将KB和文本 ...

  6. 如何读论文才不至于发疯?

    ↑ 点击蓝字 关注视学算法 来源丨新智元 编辑丨极市平台 极市导读 本文精选Reddit热帖"如何阅读大量的学术论文,而不发疯?"下的优质回答,介绍了多种提高文献阅读效率的方法. ...

  7. 哈夫曼编码压缩率计算_考研经验分享(哈工大计算机)

    2019.3.13 考研就此告一段落,在这里写下我自己的总结. 本人报考的哈尔滨工业大学深圳,专业是计算机科学与技术. 先说初试,初试我考的是数学一(129),英语一(69),政治(75)和计算机基础 ...

  8. cvpr2018 行为识别

    转载论文笔记:CVPR 2018 关于行为识别论文略读笔记(一) 论文笔记:CVPR 2018 关于行为识别论文略读笔记(二)

  9. 【Share 2021】caoyang.log(OLD VERSION)

    序言 目录 序言 2021年1月 01-01 01-02 01-03 01-04 01-05 01-06 01-07 01-08 01-09 01-10 01-11 01-12 01-13 01-14 ...

  10. 吴恩达:关于机器学习职业生涯以及阅读论文的一些建议

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者:Mohamed Ali Habib 编译:ronghuaiy ...

最新文章

  1. 低成本可复用前端框架——Linke
  2. Oracle隐式游标和显式游标
  3. c语言动态内存分配数组,【C】动态内存分配
  4. gdbc 同步mysql_Jdbc数据同步
  5. java绘制半透明图片_如何使绘制的图像在Java中透明
  6. c语言用递归方法实现冒泡排序,C语言 冒泡排序 递归法
  7. Python基础 - MySQLdb模块
  8. 十折交叉验证python_机器学习(十二)交叉验证实例
  9. Windows10易升下载
  10. python 抓百度招聘信息,将搜索结果解析下来,用来跟踪招聘趋势数据,免费数据变为有用的东东
  11. python 保存源码,python save保存图片系统提示错误请帮忙分析python源码,savepython,很基本的操作,比如imp...
  12. 二十一、从句_非限定性定语从句
  13. php 判断是否汉字
  14. HDU-4417-Super Mario(划分树+二分)
  15. nas系统存储服务器,企业搭建NAS存储服务器的三部曲,你都清楚嘛?
  16. CET-4 高频核心 week1
  17. python 学习日志(3)旋转角--改进
  18. CopyTranslator——一个PDF文本翻译神器
  19. 7-38 社交网络图中结点的“重要性”计算 (30分) 最短路 迪杰斯特拉堆优化
  20. VMware安装Ubuntu开启蓝屏解决方案

热门文章

  1. python函数图像绘制、函数不固定_Python中函数图像快速绘制的方法
  2. Spring Cloud Eureka 全解 (1) - 总览篇
  3. C++中bad_alloc类
  4. android手机通过wifi控制数码管,淫技:android无屏操作之adb操控wifi
  5. 如何开通微信小程序在线客服系统?
  6. 【转】问答 - 挑灯看剑 的最新日记
  7. 软件工程师考试(中级)大纲
  8. python向网页上传excle、text文件
  9. 电脑屏幕为什么没有手机屏幕清晰?
  10. LeetCode 第35题 搜索插入位置 做题记录