《Asymmetric Gained Deep Image Compression With Continuous Rate Adaptation》

1 绪论

本文提出连续比特率可调整框架,非对称、增益的变分自编码器(AG-VAE)。使用一对即插即用增益单元实现单个模型下离散比特率自适应,之后使用指数插值实现连续比特率自适应,其间增加的复杂度可以忽略不计。此外为解决非对称分布样本的熵估计误差,提出非对称高斯熵模型。

2 提出方法

2.1 增益单元

基于VAE的图像压缩框架中隐层表示普遍存在着不均匀的通道冗余。将隐层表示的前30个通道分别设置为0,之后转换回RGB域,图2左侧显示缺少不同通道导致的PSNR损失。选择通道29为例(缺少29导致的PSNR损失最多),应用不同缩放因子,得到结果如图2右侧。可以得出,不同通道的重要性不同,而且可以通过缩放控制重建质量。之前的许多工作忽略了不同通道的不均匀冗余。

根据以上性质设计增益单元,隐层变量,增益单元由增益矩阵组成,其中n代表增益向量数目。增益向量可以表示为,s是增益向量序号。隐层重调整操作描述如下:

通过这种方法,隐层表示的量化损失可以通过增益向量逐通道地精细调整。网络被引导着为影响重建质量大的通道分配更多的比特。增益单元计算过程如下:

代表逐通道相乘。需要注意的是,增益矩阵与自编码器网络联合训练以保证两者兼容。

2.2 离散可变比特率

量化过程公式化:

在将重调整、量化之后的结果送入decoder之前,添加可训练反增益单元,将映射回与相同的数字间隔。反增益矩阵,反增益向量,反增益过程:

训练过程中,每一对增益向量对应预定义好的拉格朗日乘子有限集合中一个特定的拉格朗日乘子,增益、反增益向量和拉格朗日乘子与下标s绑定在一起,离散可变比特率框架(DVR)损失函数如下:

推理过程中,更改s获得对应增益、反增益向量对。通过这种方法,可以获得R-D曲线上几个离散点的压缩性能,R-D曲线范围取决于拉格朗日乘子的数量和值。

2.3 指数插值

增益单元对保证的数字间隔相同(?),可以公式化为:

代表不同比特率的增益向量对。根据上式,可以获得指数插值公式:

其中,是生成增益向量对,是插值系数,控制对应生成增益向量对的比特率。是实数,使用指数插值可以实现之间任意比特率,实现了连续比特率控制方法(CVR),如图4所示,CVR扩大了覆盖范围同时不减R-D表现。

2.4 超先验的可变比特率

超先验被建模为无参数、全分解熵模型,比特率自适应也可以应用于超先验(HCVR),整体结构如下:

2.5 高斯熵模型

目前主流熵模型:

但是对称高斯熵模型自由度不够,对于不满足对称高斯分布的自然图片可能产生较大估计误差,因此使用非对称高斯熵模型[1]如下:

其中代表隐层表示的左右尺度参数。所有参数包括都是可训练的,当左右尺度参数相同的时候退化为对称高斯分布。因此更灵活精确。

2.6 网络结构

AG-VAE框架如图6。采用自回归框架作为基础框架并添加增益单元对,使用非对称高斯作为熵模型。隐层变量的通道数设置为192,卷积核大小为。采用一些优化方法:注意力模块、通用量化[2]、平行上下文模型。

3 实验

3.1 实验细节

3.2 表现对比

率失真表现

只使用一个模型获得R-D曲线,PSNR表现sota,MS-SSIM表现与Cheng相近。

结果可视化

AG-VAE结果回复更多细节,减少了模糊伪影。

3.3 可变比特率方法对比

率失真表现

与原方法多模型曲线贴合,范围大,无性能损失。

增加的计算与参数

增加参数少,计算快。

3.4 消融学习

增益单元的泛化性

因为无需修改网络结构,增益单元几乎可以用于所有基于VAE的图像压缩方法。实验如图10:

HCVR方法

证明HCVR相对于CVR的优越性,如图11,使用HCVR略好于CVR。

非对称高斯模型

SG对称高斯模型,AG非对称高斯模型:

[1]Nafaa Nacereddine, Salavatore Tabbone, Djemel Ziou, and Latifa Hamami. Asymmetric generalized gaussian mixture models and em algorithm for image segmentation. In ICPR, 2010.

[2]Jacob Ziv. On universal quantization. IEEE Transactions on Information Theory, 1985.

【图像压缩】连续比特率自适应《Asymmetric Gained Deep Image Compression With Continuous Rate Adaptation》相关推荐

  1. 端到端图像压缩《Asymmetric Gained Deep Image Compression With Continuous Rate Adaptation》

    Asymmetric Gained Deep Image Compression With Continuous Rate Adaptation 一 简介 二 内容 2.1 目前方法的缺陷 2.2 整 ...

  2. 论文笔记30 -- (视频压缩)【CVPR2021】FVC: A New Framework towards Deep Video Compression in Feature Space

    <FVC: A New Framework towards Deep Video Compression in Feature Space> CVPR 2021 的一篇Oral 提出了特征 ...

  3. 深度学习视频压缩1—DVC: An End-to-end Deep Video Compression Framework

    本文是第一篇端到端使用神经网络来进行视频压缩的论文, github地址:GitHub - GuoLusjtu/DVC: DVC: An End-to-end Deep Video Compressio ...

  4. 模型加速--CLIP-Q: Deep Network Compression Learning by In-Parallel Pruning-Quantization

    CLIP-Q: Deep Network Compression Learning by In-Parallel Pruning-Quantization CVPR2018 http://www.sf ...

  5. A Survey of Rate Adaptation Techniques for Dynamic Adaptive Streaming Over HTTP(自适应流媒体的综述)

    为了避免出现视频卡顿或者重新缓冲的现象,目前有以下四种解决方案: 1.使用播放缓冲区.此方法可以克服短期的网络吞吐量变化. 2.编码变换.比如改变视频分辨率.压缩比或帧速率,但此方法计算量巨大,需要复 ...

  6. 【论文阅读】Deep Cocktail Network: Multi-source Unsupervised Domain Adaptation with Category Shift

    Deep Cocktail Network: Multi-source Unsupervised Domain Adaptation with Category Shift SUMMARY@ 2020 ...

  7. 半监督领域自适应之CCSA--Unified Deep Supervised Domain Adaptation and Generalization

    文章目录 介绍 论文和实现 模型架构 介绍 Unsupervised domain adaptation (UDA)无监督领域自适应不需要目标域任何标签数据,但是需要大量的目标域数据才能适应数据的分布 ...

  8. 7.Deep Interest Network for Click-Through Rate Prediction论文详解

    一.总述 这是2018年阿里Guorui Zhou等人发表在KDD上的一篇论文.论文提出在CTR任务中,丰富的用户历史行为数据包含了用户多种兴趣,对于不同的候选广告,起作用的用户历史行为数据表示应该不 ...

  9. 论文阅读笔记《Fine-tuning Deep Neural Networks in Continuous Learning Scenarios》

    摘要:深度神经网络的复兴与ImageNet数据集的公开为近期复杂识别任务的成功奠定了基础.然而,ImageNet并不能包含所有可能的应用场景的所有视觉概念.因此,应用科学家仍然不断地记录新的数据,并期 ...

  10. 【图像压缩】超先验模型 《VARIATIONAL IMAGE COMPRESSION WITH A SCALE HYPERPRIOR》

    updating... 1 动机 基于香农定理,使用估计所得熵模型对隐层表示建模理论上的编码下界为: 其中为隐层表示(latent representation)实际分布,为熵模型估计分布,熵模型是一 ...

最新文章

  1. 阿联酋宣布成立全球首所人工智能大学
  2. 【AI产品】听着AI为照片生成的专属轻音乐,你还会失眠吗
  3. final,finally,finaliz的区别(Java)
  4. 博弈论分析题_博弈论练习题答案 张照贵
  5. swig封装 c语言函数到python库,python swig 调用C/C++接口
  6. 网页变成灰色,对重大事件表示哀悼
  7. mfc实现播放器功能,双击全屏,再双击还原
  8. java 封闭类型_Java并发之线程封闭
  9. 无法扩展该卷 因为群集的数量将超过文件系统_Ubifs文件系统分析
  10. Android【报错】Failed to resolve: com.android.support:appcompat-v7:28.0.0-alpha【报错】
  11. Redis与Django中配置使用Redis
  12. 研究下抓站开源项目simplecd的源代码吧
  13. 1月10日云栖精选夜读:专访金榕:四年蜕变,阿里iDST是如何登上浪潮之巅的?
  14. 怎样做小游戏挖金子(VC,源码3)
  15. Oracle minus用法详解及应用实例
  16. 图片合并pdf,详细方法!
  17. 清翔电子51单片机小结——可调表时钟
  18. mac 文件隐藏加密工具_如何在照片内部加密和隐藏您的个人文件
  19. linux下执行gauss的脚本文件,求脚本:同时向n个nodes提交并执行当前目录下所有Gaussian输入文件...
  20. 用Ruby替代Java做rest接口的单元测试!

热门文章

  1. 日本研发创可贴式的皮肤传感器
  2. 虚拟机ping通主机步骤_6在购买虚拟主机服务之前,请按照操作步骤进行操作
  3. [转]给明年依然年轻的我们:欲望、外界、标签、天才、时间、人生目标、现实、后悔、和经历
  4. NIVIDIA 硬解码学习4
  5. Fedora13装nividia驱动
  6. IDE, virtio, virtio-scsi 硬盘区别
  7. android面试题分析总结
  8. python输入姓名输出欢迎你某某同学_2018-03-24 python 练习
  9. JS 的5个不良编码习惯,现在就改掉吧
  10. iOS-图片可以自适应屏幕大小吗,应该会失真吧?