作者丨薛洁婷

学校丨北京交通大学硕士生

研究方向丨图像翻译

研究动机

持续学习是指希望模型能和人一样能基于过去的先验知识来快速准确的解决当前任务,然而对于人类而言与生俱来的能力对于模型来说却宛如大海捞针般困难。

当我们使用新的数据集去训练已有的模型时,该模型将会失去对原数据集识别的能力即模型会发生灾难性遗忘问题(如图 1 所示:edges-shoes 模型在经过 segmentations-facades 训练后原有的参数被完全打乱,无法再完成 edges-shoes 任务)。

▲ 图1. 灾难性遗忘问题

这一问题对于持续学习而言是一个非常巨大的挑战,目前比较主流的解决方案是让当前任务数据集结合原数据集去训练模型,但这样会导致模型的可扩展性很差,当添加一个新的任务时存储和训练时间都会同时增加,并且有些预训练模型的数据是难以获取的,因此作者提出了更通用的持续学习模型框架,该框架用于解决条件图像生成问题。

模型介绍

Lifelong GAN 模型基于 BicycleGAN 的架构,BicycleGAN 的架构可参考 [1]。模型主要使用了知识蒸馏来解决持续学习中的灾难性遗忘问题,即模型在学习当前任务的同时需要记住原任务的知识,在具体训练中通过鼓励当前网络和原网络产生相似的结果来迫使模型从原任务的训练网络中提取出信息并且加入到当前网络中。

架构如图 2 所示,其中表示当前任务的第 t 次训练,表示当前任务的第 t-1 次训练。

▲ 图2. LifelongGAN模型架构

作者希望在训练中产生的结果和训练结果保持一致性,即对于 cVAE-DL 阶段的训练中希望训练产生的目标域图像的编码结果以及生成的图像与训练时保持一致。

对于 cLR-GAN 阶段希望训练产生的生成结果以及生成结果的编码与训练时保持一致。

对于 Lifelong GAN 来说其损失函数就是两部分损失之和。

但是我们知道 BicycleGAN 之所以结合 cVAE-DL 以及 cLR-GAN 就是为了增加模型的多样性,但是上述两个损失函数都希望训练时与原训练结果保持一致,这两者的目标是矛盾的,因此作者提出在具体训练时使用辅助图像来解决这一问题,即从训练数据中随机采样小图像块并将它们一起剪切,或者交换原域和目标域图像来产生辅助图像,这两种方案都不会让模型产生过拟合问题。

实验结果

作者将条件图像生成问题分为基于图像条件的图像生成以及基于标签条件的图像生成,并从这两个方面分别评估了模型的性能。

针对基于图像条件的图像生成作者在 MNIST 数据集以及 Image-to-Image 数据集(如 edges-shoes,segmentations-facades 等)上计算其 Acc, r-Acc 以及 LPIPS 得分来评估,由图 3 可以看出和 Sequential Fine-tuning 以及 Joint Learning(使用全部数据集来训练)相比 Lifelong GAN 的表现效果与JL相近,但 Lifelong GAN 不需要使用全部数据集。

▲ 图3. 基于图像条件的图像生成

针对基于标签条件的图像生成问题作者采用了 MNIST 数据集以及 Flower 数据集进行评估。

▲ 图4. 基于标签条件的图像生成

总结

本文作者首次提出将知识蒸馏应用于持续学习模型中,并提出了更通用的(可以应用于基于标签条件以及图像条件的图像生成问题上)的条件图像生成模型。整个模型的设计非常巧妙,避免了使用原数据集带来的开销问题。从实验结果可以看出 Lifelong GAN 的效果和使用全数据集的效果类似,进一步证明了模型的有效性。

参考文献

[1] J.-Y. Zhu, R. Zhang, D. Pathak, T. Darrell, A. A. Efros, O. Wang, and E. Shechtman. Toward multimodal image-to image translation. In Advances in Neural Information Processing Systems (NIPS), 2017.

点击以下标题查看更多往期内容:

  • Grid R-CNN Plus:基于网格的目标检测演化

  • 进击的YOLOv3,目标检测网络的巅峰之作

  • CVPR 2019 | 基于池化技术的显著性目标检测

  • 天秤座R-CNN:全面平衡的目标检测器

  • 万字综述之生成对抗网络(GAN)

  • CVPR 2019 | BASNet:关注边界的显著性检测

#投 稿 通 道#

 让你的论文被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学习心得技术干货。我们的目的只有一个,让知识真正流动起来。

来稿标准:

• 稿件确系个人原创作品,来稿需注明作者个人信息(姓名+学校/工作单位+学历/职位+研究方向)

• 如果文章并非首发,请在投稿时提醒并附上所有已发布链接

• PaperWeekly 默认每篇文章都是首发,均会添加“原创”标志

? 投稿邮箱:

• 投稿邮箱:hr@paperweekly.site

• 所有文章配图,请单独在附件中发送

• 请留下即时联系方式(微信或手机),以便我们在编辑发布时和作者沟通

?

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 下载论文

ICCV 2019 | Lifelong GAN:基于持续学习的条件图像生成模型相关推荐

  1. ICCV 2019 开源论文 | 基于元学习和AutoML的模型压缩新方法

    这篇文章来自于旷视.旷视内部有一个基础模型组,孙剑老师也是很看好 NAS 相关的技术,相信这篇文章无论从学术上还是工程落地上都有可以让人借鉴的地方.回到文章本身,模型剪枝算法能够减少模型计算量,实现模 ...

  2. 2020-4-22 深度学习笔记20 - 深度生成模型 5 (有向生成网络--sigmoid信念网络/可微生成器网络/变分自编码器VAE/生产对抗网络GAN/生成矩匹配网络)

    第二十章 深度生成模型 Deep Generative Models 中文 英文 2020-4-17 深度学习笔记20 - 深度生成模型 1 (玻尔兹曼机,受限玻尔兹曼机RBM) 2020-4-18 ...

  3. 目标检测YOLO实战应用案例100讲-基于深度学习的航拍图像YOLOv5目标检测研究及应用(论文篇)

    目录 基于深度学习的航拍图像目标检测研究 航拍图像目标检测 评价指标与数据集

  4. 基于深度学习的春联自动生成系统 实验记录

    基于深度学习的春联自动生成系统主要分成两个方面: 1.数据集构造 2.模型搭建 本文将主要从这两个方面展开,之后将介绍实验结果和结果分析. 目录 一.[数据集构造] 1.分词方面 2.编码方面 3.数 ...

  5. 基于Jittor框架实现LSGAN图像生成对抗网络

    基于Jittor框架实现LSGAN图像生成对抗网络 生成对抗网络(GAN, Generative Adversarial Networks )是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的 ...

  6. 《预训练周刊》第6期:GAN人脸预训练模型、通过深度生成模型进行蛋白序列设计

    No.06 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第6期< ...

  7. IJCAI 2018 基于主题信息的神经网络作文生成模型

    本文介绍哈尔滨工业大学社会计算与信息检索研究中心(SCIR)录用于IJCAI 2018的论文<Topic-to-Essay Generation with Neural Networks> ...

  8. 2020-4-20 深度学习笔记20 - 深度生成模型 3 (实值数据上的玻尔兹曼机)

    第二十章 深度生成模型 Deep Generative Models 中文 英文 2020-4-17 深度学习笔记20 - 深度生成模型 1 (玻尔兹曼机,受限玻尔兹曼机RBM) 2020-4-18 ...

  9. matlab求图像暗通道图像,基于暗通道先验条件图像去雾算法

    基于暗通道先验条件图像去雾算法 香港大学何凯明博士于2009发表了一篇论文<Single Image Haze Removal Using Dark Channel Prior>.在文章中 ...

最新文章

  1. 2月第4周中国五大顶级域名总量减1.8万 美国增10.8万
  2. 1.QT刷新ROS地图画面时,地图画面时不时卡住,甚至整个界面挂掉退出
  3. 语音编解码技术演进和应用选型
  4. ajax面试技术回答模板
  5. 前端学习(1331):mongoose第三方模块
  6. 真香 | 谁说的 StringJoiner 不好!真香警告……
  7. 2017.10.1 atcoder TK1 D 思考记录
  8. python程序设计报告-Python程序设计实验报告一
  9. 工行纸黄金软件测试,只需一万元,工行刷星7级下卡2万的方法
  10. Linux 杀毒软件ClamAV离线安装部署
  11. Dva.js 入门级教学文档-1
  12. 微信小程序开发笔记(二)
  13. 传奇架设 GEE引擎教程 配置微端
  14. Log4j输出终端(Appender)详解
  15. 想学会刷机就得学会怎么刷小米4S这种手机就能会了
  16. 一维数组的使用:逆序输出数据/:任意输入5个数据,存放于数组,编程实现将这5个数据逆序存放并输出
  17. 【HTML 教程系列第 18 篇】详解什么是 HTML 中的表格 table
  18. SAP-MM MM STO订单详解1(工厂间的转储一步法和两步法)
  19. AVB源码学习(二):Uboot阶段AVB2.0校验流程
  20. 汇编计算机钢琴流程图,汇编模拟电子琴程序

热门文章

  1. SOA架构下的人事信息管理系统的构建与分析
  2. Android 6.0 7.0 8.0 一个简单的app内更新版本-okgo app版本更新
  3. python-模块入门二(模块循环导入,区分python文件的两种用途,模块搜索路径,软件开发的目录规范)...
  4. Chapter 1 First Sight——17
  5. [改善Java代码]自由选择字符串拼接方法
  6. Android笔记(七十) AlertDialog
  7. 一套代码编译出ios和android,Hippy: Hippy 是一个新生的跨端开发框架,目标是使开发者可以只写一套代码就直接运行于三个平台(iOS、Android 和 Web)...
  8. 原生sql 查询返回一个实体_python连接SQLServer执行给定的查询SQL语句,并返回结果数据...
  9. tomcat ajp协议安全限制绕过漏洞_国家信息安全漏洞共享平台发布Apache Tomcat漏洞安全公告...
  10. c++ char*转string_CC++|输入输出与内存、缓存、设备文件