霍夫曼编码及解码实验c语言,Huffman编码与解码

实验目的：

1. 掌握熵编码的原理和方法

2. 掌握霍夫曼编码的原理

3. 了解霍夫曼编码的优缺点

4. 掌握和熟悉C

一、背景知识及相关公式

1．熵，又称为“信息熵”(Entropy)

1.1 在信息论中，熵是信息的度量单位。信息论的创始人Shannon在其著作《通信的数学理论》中提出了建立在概率统计模型上的信息度量。他把信息定义为“用来消除不确定性的东西”。

1.2 一般用符号 H 表示，单位是比特。对于任意一个随机变量 X，它的熵定义如下：

1.3 变量的不确定性越大，熵也就越大。换句话说，了解它所需要的信息量也就越大。

2. Huffman编码

1.4 Huffman Coding (霍夫曼编码)是一种无失真编码的编码方式，Huffman编码是可变字长编码(VLC)的一种。

1.5 Huffman编码基于信源的概率统计模型，它的基本思路是，出现概率大的信源符号编长码，出现概率小的信源符号编短码，从而使平均码长最小。

1.6 在程序实现中常使用一种叫做树的数据结构实现Huffman编码，由它编出的码是即时码。

3. Huffman 编码的方法

1.7 统计符号的发生概率；

1.8 把频率按从小到大的顺序排列

1.9 每一次选出最小的两个值，作为二叉树的两个叶子节点，将和作为它们的根节点，这两个叶子节点不再参与比较，新的根节点参与比较；

1.10 重复3，直到最后得到和为1的根节点；

1.11 将形成的二叉树的左节点标0，右节点标1，把从最上面的根节点到最下面的叶子节点途中遇到的0，1序列串起来，就得到了各个符号的编码。

二、数据结构

1.huffman树节点

typedef struct huffman_node_tag

{

unsigned char isLeaf; //是否是叶节点

unsigned long count; //字母出现的频率

struct huffman_node_tag *parent; //父节点指针

union //联合体：如果是叶节点，则只能有symbol，如果是非叶节点，只能有左右孩子指针

{

struct

{

struct huffman_node_tag *zero, *one; //左右孩子指针

};

unsigned char symbol; //该节点对应的字母

};

} huffman_node;

2.huffman码字节点

typedef struct huffman_code_tag

{

//以位为单位的码字长度

unsigned long numbits;

/*码字(二进制)：码字的第1位位于bits[0]的第1位；

码字的第2位位于bits[0]的第2位

……

码字的第8位位于bits[0]的第8位

码字的第9位位于bits[1]的第1位 */

unsigned char *bits;

} huffman_code;

3.输出缓冲结构体

typedef struct buf_cache_tag /*内存编码时，结构体存放输出内存及缓存的指针*/

{

//cache：缓存作用

//如果待存入数据大小合适，则放入*cache；

/*如果待存入数据与*cache中原有数据大小之和超出cache_len，则将原有数据与待存入数据一起放入输出内存*pbufout，最后将*cache内容清空*/

unsigned char *cache;

//缓存区*cache的大小，本程序将其设为1024字节

unsigned int cache_len;

//缓冲区*cache当前已缓存数据的大小(当前已缓存大小)

unsigned int cache_cur;

//最终所有输出数据存放的内存区域，即输出内存的二级指针

unsigned char **pbufout;

//最终所有输出数据的大小之和，即*pbufout所指向的内存大小

unsigned int *pbufoutlen;

} buf_cache;

思考：

为什么使用pbufout二级指针？输出内存**pbufout是通过malloc后多次realloc获得，malloc后内存地址一定会变，realloc后内存地址有时会变有时不变(MSDN上说，*realloc returns a void pointer to the reallocated (and possiblymoved) memory block.)，所以输出内存地址(指向输出内存的指针)是不断变化的，即指针内容会发生改变，因此要想通过函数改变指针内容，并使该内容可以被函数外环境使用，只能操作二级指针。

为什么使用pbufoutlen指针？要想通过函数改变输出内存大小的值，并使该内容可以被函数外环境使用，只能操作指针。

三、主函数分析

1.getopt()分析命令行参数

头文件：#include (unix standard header缩写 unix 标准头文件)

原型：

int getopt(int argc,char * const argv[],const char * optstring);

参数argc和argv是由main()传递的参数个数和内容。参数optstring 则代表预处理选项字符串。

什么是选项？什么是参数？

字符串optstring可以下列元素

1.单个字符，表示选项。

2.单个字符后接一个冒号：表示该选项后必须跟一个参数。参数紧跟在选项后或者以空格隔开。该参数的指针赋给optarg。

3.单个字符后跟两个冒号，表示该选项后必须跟一个参数。参数必须紧跟在选项后不能以空格隔开。该参数的指针赋给optarg。

调用原理：

调用一次，返回一个选项。如果选项字符串里的字母后接着冒号“:”，则表示还有相关的参数，char* optarg指向该参数。在命令行选项参数再也检查不到optstring中包含的选项时，返回－1，同时optind储存第一个不包含选项的命令行参数。

霍夫曼编码及解码实验c语言,Huffman编码与解码_C语言实现相关推荐

Zlib压缩算法：LZ77、LZ78、霍夫曼编码、滑动窗口、Rabin-Karp算法、哈希链、I/O缓冲区
Table of Contents 1.简介 1.1 什么是zlib 2.压缩算法 2.1 放气 2.2 LZ77 2.2.1 滑动窗口 2.2.2 长距离对 2.3 霍夫曼编码 3. zlib的实现 ...
c语言实现霍夫曼编码
// // 霍夫曼编码 //#include <stdio.h> #include <stdlib.h> #include <string.h>/**思路:用一个有 ...
Alink漫谈(十六) ：Word2Vec源码分析之建立霍夫曼树
Alink漫谈(十六) :Word2Vec源码分析之建立霍夫曼树文章目录 Alink漫谈(十六) :Word2Vec源码分析之建立霍夫曼树 0x00 摘要 0x01 背景概念 1.1 词向量 ...
数据结构与算法 / 霍夫曼树、霍夫曼编码和解码
一. 诞生原因找出存放一串字符所需的最少的二进制编码. 二. 构造方法首先统计出每种字符出现的频率,即:概率.权值. 例如:频率表 A:60, B:45, C:13 D:69 E ...
数据结构与算法之霍夫曼编码解码实现
目标:将字符串"can you can a can as a can canner can a can."编码再解码流程: 将字符串转成bytes (byte[]格式)(eg.[ ...
视频编解码——霍夫曼编码的实现
目录原理分析输入文件字符出现次数排序功能 .C .H 效果思考未完成的代码 .c .h 能够成功运行的代码原理视频编解码--熵编码-哈夫曼编码的原理及实现分析首先制作一个输入文件, ...
labview 霍夫曼树_哈夫曼树编码实验报告_信息论与编码实验2 实验报告_信息论与编码报告...
huffman编码C语言实验报告今日推荐 180份文档 2014...4页 1下载券安卓版100 doors 2攻略1... 3页 1下载券 <逃脱本色>doors....语文教育实习 ...
信息论哈夫曼编码与菲诺编码的实现（对一幅BMP格式的灰度图像（个人证件照片）进行二元霍夫曼编码和译码。并进行编码效率的计算，对一幅BMP格式的灰度图像进行二元Fano编码、译码）
信息论哈夫曼编码与菲诺编码的实现(对一幅BMP格式的灰度图像(个人证件照片)进行二元霍夫曼编码和译码.并进行编码效率的计算,对一幅BMP格式的灰度图像进行二元Fano编码.译码 ) 原始图片 ...
信源压缩编码编程c语言,霍夫曼信源编码实验报告.docx
霍夫曼信源编码实验报告.docx PAGE PAGE 7 实验1:霍夫曼信源编码综合设计[实验目的]通过本专题设计,掌握霍夫曼编码的原理和实现方法,并熟悉利用C语言进行程序设计,对典型的文本数据和图像 ...
熵编码（算术+霍夫曼）编解码基础知识总结
在MPEG的TMC13模型中,对于surface point cloud compression,对block和vertices进行熵编码:对于lidar point cloud compressio ...

霍夫曼编码及解码实验c语言,Huffman编码与解码_C语言实现

霍夫曼编码及解码实验c语言,Huffman编码与解码_C语言实现相关推荐

最新文章

热门文章