算术编码(Arithmetic coding)
算术编码
- 算术编码
- 简介
- 思想
- 示例
- 小结
算术编码
简介
算术编码是图像压缩的主要算法之一。 是一种无损数据压缩方法,也是一种熵编码的方法。和其它熵编码方法不同的地方在于,其他的熵编码方法通常是把输入的消息分割为符号,然后对每个符号进行编码,而算术编码是直接把整个输入的消息编码为一个数,一个满足(0.0 ≤ n < 1.0)的小数n。
思想
算术编码(Arithmetic coding)的本质思想也是对于高频字符进行短编码。
示例
编码过程:
对于字符AABABCABAB有P(A) = 0.5,P(B) = 0.4,P( C ) = 0.1。那么算术编码会对0-1进行区间划分。
A:[0, 0.5), B:[0.5, 0.9), C:[0.9, 1)
AABABCABAB的第1个字符为A,那么我们选中了A的区间[0, 0.5)作为新的目标区间。我们对新目标区间,再按照ABC的概率占比进行划分:
A:[0, 0.25), B:[0.25, 0.45), C:[0.45, 0.5)
AABABCABAB的第2个字符为A,那么我们选中了A的区间[0, 0.25)作为新的目标区间。我们对新目标区间,再按照ABC的概率占比进行划分:
A:[0, 0.125), B:[0.125, 0.225), C:[0.225, 0.25)
AABABCABAB的第3个字符为B,那么我们选中了B的区间[0.125, 0.225)作为新的目标区间。我们对新目标区间,再按照ABC的概率占比进行划分:
A:[0.125, 0.175), B:[0.175, 0.215), C:[0.215, 0.225)
我们重复上面的操作,一直到最后一个字符。
当前字符 | 当前目标区间 |
---|---|
A | [0, 0.5) |
A | [0, 0.25) |
B | [0.125, 0.225) |
A | [0.125, 0.175) |
B | [0.15, 0.17) |
C | [0.168, 0.17) |
A | [0.168, 0.169) |
B | [0.1685, 0.1689) |
A | [0.1685, 0.1687) |
B | [0.1686, 0.16868) |
完成上面的操作后,最终的目标区间为:[0.1686, 0.16868),我们在这个区间内,任意选一个小数,便可以作为最终的编码小数。但是计算机只能识别0和1,所以我们再将小数转成二进制。我们的诉求是进行最短压缩,所以我们从[0.1686, 0.16868)选一个二进制表示最短的小数。这里我们选定0.16864013671875,二进制为:0.00101011001011,去掉整数位0以及小数点后,最终的二进制编码为00101011001011,长度为14位,比哈夫曼编码更短1位。
算术编码的解码过程:
二进制编码为00101011001011,加上小数点后还原为 0.00101011001011,对应的十进制编码小数是0.16864013671875。
我们先从初始区间中定位第一个字符:
A:[0, 0.5), B:[0.5, 0.9), C:[0.9, 1)
0.16864013671875位于A区间,所以第一个字符为A。我们接着对A:[0, 0.5) 进行划分:
A:[0, 0.25), B:[0.25, 0.45), C:[0.45, 0.5)
0.16864013671875仍然位于A区间,所以第二个字符仍然为A。我们接着对A:[0, 0.25)再进行划分:
A:[0, 0.125), B:[0.125, 0.225), C:[0.225, 0.25)
0.16864013671875位于B区间,所以第三个字符为B。我们接着对B:[0.125, 0.225)再进行划分:
A:[0.125, 0.175), B:[0.175, 0.215), C:[0.215, 0.225)
0.16864013671875 位于 A 区间,所以第四个字符为 A。
依次类推,我们可以从0.16864013671875将整个字符解码出来,得到AABABCABAB。
小结
算术编码的压缩本质,就是保留字符排列顺序的同时,对于更高频出现的字符,也就是概率更大的字符,赋予更大的小数区间。
为什么要这样划分区间呢?
因为算术编码的目的,是要在最终的目标区间内,找一个二进制最短的小数作为最终编码。那怎么去找到这样一个目标区间呢?最终目标区间的范围更大,可容纳的小数精度就越低,意味着我们最终的二进制编码就更短。
算术编码(Arithmetic coding)相关推荐
- 算术编码(Arithmetic Coding)源代码
Ian H. Witten.Radford M. Neal和John G. Cleary在1987年发表了一篇启发性的论文.论文中描述了一种基于整数运算的通用算术编码器,而且还给出了由计算错误导致的效 ...
- (Matlab源码)Matlab实现算术编码(Arithmetic coding)超级详解(每一段代码都可以看懂)
1.代码功能 输入:一个字符串 输出: codeword(码值) codeword所占的位数 2.代码框图 3.代码超详解 统计字符串中的字符种类,调用函数,放入数组b中. b=unique(str1 ...
- (含Matlab源码)算术编码(arithmetic coding)的underflow问题
0.文章结构 文章的行文逻辑如下,看官可以根据需要跳读,节省时间. 1.介绍underflow和overflow. 2.underflow问题起源 3.underflow问起探索 4.underflo ...
- Arithmetic Code 算术编码
Principle: 算术编码的原理是非常直白的.在算术编码中我们考虑对[消息序列整体]进行编码,以这里的消息序列[210]为例,其落在概率区间[0.68,0.712]中.然后我们需要用二进制编码去表 ...
- [转]算术编码+统计模型=数据压缩 - 第二部分:统计模型
转自:http://deercrane.spaces.live.com/blog/cns!8BEF692B75EB8095!189.entry 算术编码 + 统计模型 = 数据压缩 - 第二部分:统计 ...
- H.266/VVC技术学习:算术编码
算术编码是一种常用的变长编码方法,和Huffman编码类似,也是对出现概率大的符号赋予短码,出现概率小的符号赋予长码,但算术编码不是简单的将每个信源符号映射成一个码字,而是对整个输入序列分配一个码字, ...
- 算术编码原理与实现【转载】
1. 算术编解码原理 编码 与哈夫曼编码一样,算数编码是熵编码的一种,是基于数据中字符出现的概率,给不同字符以不同的编码. 算数编码的原理我个人感觉其实并不太容易用三言两语直观地表达出来,其背后的数学 ...
- 5.3 Python图像处理之图像编码-算术编码
5.3 Python图像处理之图像编码-算术编码 文章目录 5.3 Python图像处理之图像编码-算术编码 1 算法原理 2 代码 3 效果 1 算法原理 算术编码在图像数据压缩标准(如JPEG,J ...
- 强化学习(七) - 函数近似方法 - 随机梯度下降, 半梯度下降,及瓦片编码(Tile Coding)实例
函数近似方法 7.1 目标预测(VE‾\overline{VE}VE) 7.2 随机梯度下降和半梯度下降 例7.1: 1000态随机行走的状态收敛 7.3 线性近似 7.4 线性方法的特征构造 7.4 ...
最新文章
- docker 安装 oracle12,使用Docker安装Oracle 12c
- spring @Required
- 北电PBX资料_LD 17 系統結構指令設定
- 理解JSON对象:JSON.parse、 JSON.stringify
- PHP - 获取音频长度
- Python——反射
- 阶梯到XML:1级 - XML简介
- c++中的多态---1(多态概念,静态联编和动态联编,多态原理解析,重载,重写,重定义的对比)
- Python排序 插入排序
- fatal: could not read Username for ‘https://git.dev.tencent.com‘ 解决方法
- Thinkbayes_Chapter5
- 大学计算机一级准考证打印,河海大学计算机等级考试准考证打印入口
- SWAT模型在水文水资源、面源污染模拟中的实践技术应用
- 网络安全从小白到专家
- 高校校园网建设方案【含网络拓扑图+拓扑结构图+配置命令】(详细版)
- 统计bed文件下的reads数目和GC含量
- 计算组合数的三种方式
- 使用JS数组迭代方法渲染页面数据并实现查询功能
- python下载图片到文件夹_Python批量下载网页图片详细教程
- 自动驾驶技术平台分享:百度Apollo开放平台8.0再升级,更简单,更便捷,更高效