【图像压缩】替换输入改善压缩+实现可变比特率
Wang, X., Jiang, W., Wang, W., Liu, S., Kulis, B., & Chin, P. (2021). Substitutional Neural Image Compression. http://arxiv.org/abs/2105.07512
绪论
本文提出了一种通用的增强神经图像压缩的模型SNIC。核心思想是,将输入图像看做可训练参数,优化得到最优输入。本方法可行的根本原因在于:图像压缩本质上是一种自监督过程,因此,在推理过程中,可以根据反馈改善模型参数或输入以提升性能表现。
方法
最优替换图像
把图像压缩看成两步映射过程,统一表示为。作者提出疑问:当压缩一个指定的图像的时候,以为输入是否可以得到最优压缩效果?本文的想法为,寻找一个替代的作为输入,执行同样的两步映射,如果能够使目标函数进一步下降则意味着可以通过将替换为来提高压缩性能。SNIC优化问题如下:
(3)
需要指出的是,重建质量的比较对象依然是,因为最终目标是要通过优化输入来获得对原图像更好的重建效果。以上最优化问题,在SNIC中被替换为:
其中替换不可导操作(改为)。
比特率、失真控制
用来生成替换图像和用来训练模型的损失函数是不同的。比特率控制可以通过改变损失函数中的实现。类似的,(3)中失真项也可以根据需要替换,不必和训练时相同。
直接比特率、失真控制
和结果比特率之间的关系未知而且可能不是线性的,因此调节来调节比特率很不方便。可以通过直接修改损失函数达到直接控制的效果:
(4)
其中k是一个很大的常数,用以惩罚。因为梯度更新的时候可能会产生偏差,使用很小的值弥补这种偏差。类似的,失真控制:
直接比特率控制的精度
影响直接比特率控制精度的因素:1)不可导操作的替换引入错误 2)优化问题通过梯度下降解决,可能不是最优解 3)x实际上是离散的(8-bit color RGB),可能会产生四舍五入错误。
替换隐层表示
除了替换输入外,优化以替换隐层表示也是一个可以尝试的方向。
实验
提升图像压缩性能
以下使用真实比特率而非估计结果。端到端模型ICLR2017,超先验模型ICLR2018。对于ICLR2017和ICLR2018中训练得到的每个模型实例,为每个实例单独应用SNIC,其中设置与训练时相同,经过100步梯度下降,在每次梯度更新后将像素值裁剪到。下图为结果,体现了SNIC可以提升压缩效果的功能。
比特率控制
基于ICLR不同模型实例,使用(4)控制比特率,训练得到不同颜色曲线如下图。可以看到,当比特率比较高的时候,上界略高于原模型曲线,曲线下方变化范围比较大,当比特率比较低的时候变化范围就很小了,当到达界限的时候,即使继续改变loss函数中的值压缩效果也不会变化。SNIC高于原曲线的BPP范围约0.3,这说明可以通过在较少的模型上应用SNIC以覆盖原始曲线。
比特率控制的精度
(4)给出了一种明确指定目标BPP的方法,但是由于近似、噪声注入和舍入误差等因素,真实的BPP可能与目标不同。图6展示了重复采样结果BPP的分布(同一目标BPP重复100次),证明在实验中标准差足够小(大部分小于0.001),表明该方法是有效的。注意,平均值可以用额外一轮的生成为代价通过(4)中的来校准。
SNIC的速度
【图像压缩】替换输入改善压缩+实现可变比特率相关推荐
- [错误]input输入框只能输入或者选中替换输入,不能删除内容
** [错误]input输入框只能输入或者选中替换输入,不能删除内容 ** 本人的解决方法 类型添加或改成 type="text"
- BERT-of-Theseus:基于模块替换的模型压缩方法
©PaperWeekly 原创 · 作者|苏剑林 学校|追一科技 研究方向|NLP.神经网络 最近了解到一种称为"BERT-of-Theseus"的 BERT 模型压缩方法,来自论 ...
- python替换 输入手机号_python file模块 替换输入内容脚本
root@python-10:/home/liujianzuo/python/test# ls passwd rc.local test1 root@python-10:/home/liujianzu ...
- 替换输入的密码为星号【C语言】
用户输入密码时,希望把密码隐藏,比如替换为星号* 思路 判断用户是否由有键入 有则输出一个星号,否则略过 如果键入回车字符,终止程序 一些准备工作 IDE: VC++6.0 了解可能用到的特殊函数: ...
- 图像压缩之基于神经网络压缩(BP)
基于人工神经网络ANN的图像压缩方法. % *************************************************% **** BP_Compress/Decompress ...
- 【设计】用戴维南等效替换输入差动对
戴维宁定理(Thevenin's theorem):含独立电源的线性电阻单口网络N,就端口特性而言,可以等效为一个电压源和电阻串联的单口网络.电压源的电压等于单口网络在负载开路时的电压uoc:电阻R0 ...
- 数字图像处理 第八章——图像压缩
目录 8.1 基础知识 8.1.1 编码冗余 8.1.2 空间冗余和时间冗余 8.1.3 不相关的信息 8.1.4 图像信息的度量 香农第一定理 8.1.5 保真度准则 8.1.6 图像压缩模型 编码 ...
- html如何压缩发送,css如何压缩?
在建站的时候,很多网站都对他们的代码进行压缩,本篇文章主要来讲解下CSS代码的压缩,压缩后的CSS代码所占用字节数会减少,要是访问量比较小的网站看不出明显的区别,比较大型的网站,就能节约很多内存资源. ...
- css样式压缩了怎么还原,CSS代码的压缩方法
原标题:CSS代码的压缩方法 在建站的时候,很多网站都对他们的代码进行压缩,今天主要来讲解下CSS代码的压缩,压缩后的CSS代码所占用字节数会减少,要是访问量比较小的网站看不出明显的区别,比较大型的网 ...
- CSS的压缩 方法与解压
为什么要压缩CSS? 1.大网站节约流量 2.加快访问速度 工具:Dreamweaver(手工替换,个人感觉任何文本编辑器都可以)不过DW可以还原 CSS压缩与CSS代码压缩还原方法,CSS压缩工具有 ...
最新文章
- NSPredicate 查询/搜索
- 网络编程学习笔记(shutdown函数)
- 无线通信领域:技术整合,创造未来
- Hadoop MapReduce实例:按手机上网总流量降序排序代码实现及结果演示
- Java 基础——数组解析
- android style边界显示兼容问题,android – IDE“无法解析@ style/Theme.Appcompat”时使用v7兼容性支持主题...
- 马鞍山红星中学2021年高考成绩查询,2021年马鞍山高考状元名单公布,马鞍山高考状元学校资料及最高分...
- 计算机软件知识pdf,[计算机软件及应用]PDF基础知识.doc
- 第一章:1.3:了解编译系统如何工作的好处
- 图像融合(五)-- 梯度金字塔
- [WTL] 使用CImageList
- 程序员王不留到底干了啥?!
- 小米miui adb删除自带软件
- 为什么百度快照没有样式
- Ever-Flowers IN Never-Dream(16)
- Python数据可视化matplotlib:第四回:文字图例尽眉目
- P7826 「RdOI R3」RBT
- Appstore商店排名前十的威客应用!
- 一加手机怎么导出照片_一加5t怎么才能把手机相片上传到电脑上?
- 圆的周长面积(YZOJ-1020)
热门文章
- 微信小程序点击激活类
- 6. ROS编程入门--路径跟随(Trajectory following)
- 一、Windows许可证即将过期怎么办
- openairinterface5g+limesdr搭建4G基站
- php如何让浏览器切换到极速模式,如何识别并切换到浏览器极速模式?
- 锐捷校园网:小米mini路由刷Padavan固件实现wifi上网
- 小米 12S Utra 莱卡水印生成在线工具
- 伺服电机的工作原理是什么
- Skype 8.34 Windows7-64bit Ubuntu 16.04安装试验
- 求一个数的平方c语言函数实现,C++中数的平方是什么函数?