来源:新智元

本文共2200字,建议阅读9分钟

本文介绍一种将压缩感知和GAN联系起来的创新框架。

[ 导读 ] DeepMind提出一种全新的“深度压缩感知”框架,将压缩感知与深度学习相结合,显著提高了信号恢复的性能和速度,并提出一种改进GAN的新方法。

压缩感知(CS)是一种优雅的框架,用于从压缩信号中恢复稀疏信号。

例如,CS可以利用自然图像的结构,仅从少量的随机测量中恢复图像。

CS具有灵活性和数据效率高的优点,但由于其稀疏性和昂贵的重建过程,CS的应用受到限制。

那么,将CS与深度学习的思想相结合,是否能得到更优雅的框架呢?

近日,DeepMind的Yan Wu,Mihaela Rosca,Timothy Lillicrap等研究人员在ICML 2019发表论文Deep Compressed Sensing,基于前人将CS和神经网络生成器结合起来的方法,提出一个全新的框架。

深度压缩感知(DCS)框架通过联合训练生成器通过元学习优化重建过程,显著提高了信号恢复的性能和速度。作者探索了针对不同目标的测量训练,并给予最小化测量误差推导出一系列模型。

作者表示:“我们证明了,生成对抗网络(GANs)可以被视为这个模型家族中的一个特例。借鉴CS的思想,我们开发了一种使用来自鉴别器的梯度信息来改进GAN的新方法。”

压缩感知,一种优雅的框架

压缩感知是什么呢?

有人这样评价道:

压缩感知是信号处理领域进入 21 世纪以来取得的最耀眼的成果之一,并在磁共振成像、图像处理等领域取得了有效应用。压缩感知理论在其复杂的数学表述背后蕴含着非常精妙的思想。基于一个有想象力的思路,辅以严格的数学证明,压缩感知实现了神奇的效果,突破了信号处理领域的金科玉律 —— 奈奎斯特采样定律。即,在信号采样的过程中,用很少的采样点,实现了和全采样一样的效果。[1]

编码和解码是通信中的核心问题。压缩感知(CS)提供了将编码和解码分离为独立的测量和重建过程的框架。与常用的自动编码模型(具有端到端训练的编码器和解码器对)不同,CS通过在线优化从低维测量重建信号。

该模型架构具有高度的灵活性和采样效率:高维信号可以从少量随机测量数据中重建,几乎不需要或根本不需要任何训练。

CS已经成功地应用于测量噪声大、成本高的场景,如MRI。它的采样效率使得诸如“单像素相机”的开发成为可能,可以从单个光传感器重全分辨率的图像。

然而,尤其是在现代深度学习方法蓬勃发展的大规模数据处理中,CS的广泛应用受到了它的稀疏信号假设和重建优化过程缓慢的阻碍。

最近,Bora et al. (2017)将CS与单独训练的神经网络生成器相结合。虽然这些预训练的神经网络没有针对CS进行优化,但它们表现出的重建性能优于现有的方法,如Lasso (Tibshirani, 1996)。

在本文中,我们提出一种深度压缩感知框架(deep compressed sensing,DCS),在此框架中,神经网络可以从头开始训练,用于测量和在线重建。

我们证明,深度压缩感知框架可以自然地生成一系列模型,包括GANs,可以通过训练具有不同目标的测量函数推导得出。

这项工作的贡献如下:

  • 我们展示了如何在CS框架下训练深度神经网络。

  • 结果表明,与以往的模型相比,元学习重建方法具有更高的精度和快几个数量级的速度。

  • 我们开发了一种新的基于潜在优化的GAN训练算法,提高了GAN的性能。

  • 我们将这个新框架扩展到训练半监督GAN,并表明潜在优化会产生具有语义意义的潜在空间。

深度压缩感知:结合深度神经网络

我们首先展示了将元学习与Bora et al. (2017)的模型相结合的好处。然后将测量矩阵推广到参数化的测量函数,包括深度神经网络。

之前的工作依赖于 random projection作为测量函数,而我们的方法通过将RIP作为训练目标来学习测量函数。然后,我们通过在测量上添加RIP之外的其他特性,得到了两个新的模型,包括一个带有鉴别器引导的潜在优化的GAN模型,这导致了更稳定的训练动态和更好的结果。

  • 压缩感知与元学习

我们假设CSGM(Bora et al. 2017)的运行时效率和性能可以通过使用元学习训练潜在的优化过程、通过梯度下降步骤的反向传播来提高。

CS模型的潜在优化过程可能需要数百个或数千个梯度下降步骤。通过使用元学习来优化这个优化过程,我们的目标是用更少的更新来实现类似的结果。

为此,我们训练模型参数,以及潜在的优化程序,以尽量减低预期的测量误差:

我们的算法如下:

算法1:元学习压缩感知

  • 具有学习测量函数的深度压缩感知

在算法1中,我们使用RIP属性来训练生成器。我们可以使用相同的方法,并加强RIP属性来学习测量函数F本身,而不是使用random projection。

下面的算法2总结了这个扩展算法。我们称之为深度压缩感知(DCS) ,以强调测量和重建可以是深度神经网络。

算法2:深度压缩感知

实验和结果

表2和表3总结了我们的模型以及Bora等人的基准模型的结果。

表2:使用不同测量函数的MNIST测试数据的重建损失。除了第一行之外,所有行都来自我们的模型。“±”表示测试样本间的标准差。(L)表示习得的测量函数,越低越好

表3:使用不同测量函数的CelebA测试数据的重建损失。除了第一行之外,所有行都来自我们的模型。“±”表示测试样本间的标准差。(L)表示习得的测量函数,越低越好

可以看到,DCS的性能明显优于基准。此外,虽然基线模型使用了数千个梯度下降步骤,并且多次重启,但是我们只使用了3个步骤,没有重启,大幅提高了效率。

有趣的是,对于固定的函数F,随机线性投影的表现优于神经网络。这个实证结果符合压缩感知文献中描述的随机投影的最优性,以及更通用的Johnson-Lindenstrauss定理。

更多结果如下:

表4:与 Spectral Normalised GANs的比较

图2:利用随机线性投影(上)、训练线性投影(中)和训练神经网络(下)的10个测量的重建

图3:使用0(左)、3(中)和5(右)个梯度下降步骤进行潜在优化的CS-GAN样本。采用0步骤的CS-GAN相当于原始GAN

图4:在CIFAR训练期间的Inception Score(越高越好)和FID分数(越低越好)

论文地址:

https://arxiv.org/pdf/1905.06723.pdf

参考:

[1]形象易懂讲解算法 II—— 压缩感知

https://zhuanlan.zhihu.com/p/22445302

编辑:黄继彦

校对:龚力

DeepMind论文:深度压缩感知,新框架提升GAN性能(附链接)相关推荐

  1. DeepMind论文:深度压缩感知,新框架提升GAN性能

    https://www.toutiao.com/a6694045305064653324/ [新智元导读]DeepMind提出一种全新的"深度压缩感知"框架,将压缩感知与深度学习相 ...

  2. 关于压缩感知的第一篇论文解析压缩感知研究新思路

    9月5日,我在<<计算机应用研究>>上发表一篇文章,这篇论文目前还在审核!后续情况将继续报道.这里就压缩感知谈谈自己的想法.我们知道压缩感知是一种在香农采样频率下能够实现对信号 ...

  3. 深度学习:深度压缩感知-从ISTA到LISTA及其pytorch实现方法

    摘要:传统的压缩感知方法在重构时的速度通常比较慢.通过将深度学习和压缩感知结合,可以大大提高重构速度.Learned Iterative Shrinkage and Thresholding Algo ...

  4. Google和微软分别提出分布式深度学习训练新框架:GPipe PipeDream

    [进群了解最新免费公开课.技术沙龙信息] 作者 | Jesus Rodriguez 译者 | 陆离 编辑 | Jane 出品 | AI科技大本营(ID:rgznai100) [导读]微软和谷歌一直在致 ...

  5. 2020 年最具潜力的 44 个顶级开源项目,涵盖 11 类 AI 学习框架、平台(附链接)...

    来源:AI开发者 本文约为7600字,建议阅读10分钟 本文给开发者提供了详细的各领域工具并整理了清单11 种极具潜力的 AI 工具类型. 工欲善其事必先利其器,这也是大部分开发者在日常工作中最重要开 ...

  6. 让人脸识别算法失灵,还能抵抗微信微博照片压缩!武大Adobe提出抗压缩对抗新框架,成功率最高超90%...

    鱼羊 编辑整理 凹非寺 量子位 报道 | 公众号 QbitAI 上回书说到,现在,对抗攻击的理念已经被应用到隐私保护领域: 通过给照片添加肉眼看不出来的对抗性噪声,来蒙蔽人脸识别AI,达到保护隐私的效 ...

  7. 优化Hexo性能,使用hexo-neat插件压缩页面,大幅度提升页面性能和响应速度

    写在前面的话 如果你还没有搭建Hexo博客成功的话,可以看看我写的这篇博客<手把手教你使用GitHub + Hexo搭建属于自己的个人博客>. 如果你搭建成功的话,可以看看关于这两篇博客& ...

  8. 17种深度强化学习算法用Pytorch实现(附链接)

    来源:新智元 本文约1300字,建议阅读5分钟. 本文为你介绍一个用PyTorch实现了17种深度强化学习算法的教程和代码库,帮助大家在实践中理解深度RL算法. [ 导读 ]深度强化学习已经在许多领域 ...

  9. 独家 | 这张骑马的宇航员图片是AI感知世界的一个里程碑(附链接)

    文:Will Douglas Heaven April 6, 2022(2022 年4月6日)翻译:陈超校对:zrx本文约3400字,建议阅读10分钟本文介绍了DALL-E的升级版,DALL-E 2对 ...

最新文章

  1. R语言文摘:Subsetting Data
  2. R语言数据结构之矩阵
  3. 不要在递归中使用静态容器
  4. python比较两个二进制文件_python三种方法判断文件是否为二进制文件
  5. c语言中删除有序数组中重复元素,去除有序列表中的重复元素
  6. mysql 之jdbc idea版
  7. 系统架构设计师 - 信息安全技术
  8. MSP430杂谈--时钟资源UCS的配置
  9. php postgresql win,Windows PHP上的PostgreSQL问题
  10. linux vim替换指定字符串
  11. MacOS 下载JDK11 Java
  12. s3c6410 开发板Linux系统支持 K9GAG08U0E的方法(第二篇)
  13. 使用Perfmon和PAL工具查看Server性能--PerfMon入门指南
  14. python读取docx中表格 图片_Python-docx 读写 Word 文档:插入图片、表格,设置表格样式,章节,页眉页脚等...
  15. iOS PayPal集成和使用
  16. 共模电感磁芯材质你知道哪几种
  17. ins的更新带来的一系列问题
  18. FixedUpdate
  19. MySQL数据库——MySQL INSERT:插入数据(添加数据)
  20. 最新版akamai2.0逆向分析爬虫破盾风控绕过tls指纹

热门文章

  1. Rabbitmq 消息对列 生产者与消费者的具体实现 springboot
  2. 我人生的第一个博客,真正的博客。
  3. 碰撞检测碰撞Java简单游戏开发之碰撞检测
  4. 我知道的一些 ”运行“ 窗体下的命令,个人使用
  5. Accessing tools within a VB6 program - AE中使用VB调用Geoprocessing
  6. 计算机专业人事制度改革,清华大学计算机系人事制度改革正式启动-清华大学新闻网...
  7. info java module_如何在Jdk9 / java-9中解决module-info.java编译错误
  8. php做gui,php7 图形用户界面GUI如何开发
  9. 2021.4.11 字节跳动实习笔试题---情报解密
  10. 如何在一个空的datafame中append新的dataframe