介绍

哈夫曼（Haffman）这种方法的基本思想如下：
①由给定的n个权值{W1，W2，…，Wn}构造n棵只有一个叶子结点的二叉树，从而得到一个二叉树的集合F={T1，T2，…，Tn}。
②在F中选取根结点的权值最小和次小的两棵二叉树作为左、右子树构造一棵新的二叉树，这棵新的二叉树根结点的权值为其左、右子树根结点权值之和。
③在集合F中删除作为左、右子树的两棵二叉树，并将新建立的二叉树加入到集合F中。
④重复②、③两步，当F中只剩下一棵二叉树时，这棵二叉树便是所要建立的哈夫曼树。

对于同一组给定叶子结点所构造的哈夫曼树，树的形状可能不同，但带权路径长度值是相同的，一定是最小的。

哈夫曼树的构建

为了方便操作，用静态链表作为哈夫曼树的存储。在构造哈夫曼树时，设置一个结构数组HuffNode保存哈夫曼树中各结点的信息，根据二叉树的性质可知，具有n个叶子结点的哈夫曼树共有2n-1个结点，所以数组HuffNode的大小设置为2n-1，结点的结构形式如下：

weight lchild rchild parent
其中，weight域保存结点的权值，lchild和rchild域分别保存该结点的左、右孩子结点在数组HuffNode中的序号，从而建立起结点之间的关系。为了判定一个结点是否已加入到要建立的哈夫曼树中，可通过parent域的值来确定。初始时parent的值为-1，当结点加入到树中时，该结点parent的值为其双亲结点在数组HuffNode中的序号，就不会是-1了。构造哈夫曼树时，首先将由n个字符形成的n个叶子结点存放到数组HuffNode的前n个分量中，然后根据前面介绍的哈夫曼方法的基本思想，不断将两个较小的子树合并为一个较大的子树，每次构成的新子树的根结点顺序放到HuffNode数组中的前n个分量的后面。

代码：

#define maxvalue 1e6 //定义最大权值整数常量
#define maxleaf 1e3 //定义哈夫曼树中结点个数整数常量
#define maxnode maxleaf*2-1
typedef struct{int weight;
int parent;
int lchild;
int rchild;
}HNodeType;
HNodeType* HuffTree(){HNodeType node[maxnode];
int i,j,n;
int m1,m2,x1,x2;
cin>>n;//输入叶子结点个数
for(int i = 0;i < n;i++)
{node[i].weight=0;
node[i].parent=-1;
node[i].lchild=-1;
node[i].rchild=-1;//初始化结点
}
for(int i = 0;i < n;i++)
{cin>>node[i].weight;//输入n个叶子结点的权值
}
for(int i = 0;i <n-1;i++){m1=m2=maxvalue;//注意由于需要最小的和次小的两个权值，因此需要设两个变量
x1=x2=0;//一共n-1个叶节点，一共2n-1个结点
for(int j=0;j<n+i;j++){//构造哈夫曼树if(node[j].weight<m1&&node[j].parent=-1){m2=m1;
m1=node[j].weight;
x2=x1;//保存结点的下标
x1=j;}
else if(node[j].weight<m2&&node[j].parent=-1){m2=node[j].weight;
x2=j;
}
}
//当结点加入到树中时，该结点parent的值为其双亲结点在数组HuffNode中的序号，就不会是-1了
//现在合并两棵子树 步骤：更新两棵子树的父节点，修改父节点的权值，修改父节点的左右子树信息
node[x1].parent=n+i;
node[x2].parent=n+i;//最小权值的结点和倒数第二小的权值结点的双亲相同
node[n+i].weight=node[x1].weight+node[x2].weight;//记得更新父结点的权值
node[n+i].lchild=x1;//修改父节点的子树
node[n+i].rchild=x2;
}
return node;
}

哈夫曼编码

构造编码的时候人们希望解决的两个问题是：
①编码总长最短。
②译码的唯一性。哈夫曼树可用于构造使电文的编码总长最短的编码方案。
具体做法如下：设需要编码的字符集合为{d1，d2，…，dn}，它们在电文中出现的次数或频率集合为{w1，w2，…，wn}，以d1，d2，…，dn作为叶子结点，w1，w2，…，wn作为它们的权值，构造一棵哈夫曼树，规定哈夫曼树中的左分支代表0，右分支代表1，则从根结点到每个叶子结点所经过的路径分支组成的0和1的序列便为该结点对应字符的编码，称为哈夫曼编码。

实现哈夫曼编码的算法可分为两大部分：
①构造哈夫曼树。
②在哈夫曼树上求叶结点的编码。
求哈夫曼编码，实质上就是在已建立的哈夫曼树中，从叶子结点开始，沿结点的双亲链域退回到根结点，每退回一步，就走过了哈夫曼树的一个分支，从而得到一位哈夫曼码值。由于一个字符的哈夫曼编码是从根结点到相应叶子结点所经过的路径上各分支所组成的0、1序列，因此先得到的分支代码为所求编码的低位码，后得到的分支代码为所求编码的高位码。可以设置一结构数组HuffCode用来存储各字符的哈夫曼编码信息，数组元素的结构如下：
bit start
其中，分量bit为一维数组，用来保存字符的哈夫曼编码，start表示该编码在数组bit中的开始位置。所以，对于第i个字符，它的哈夫曼编码存放在HuffCode[i].bit中的从HuffCode[i].start到n的分量上。
算法实现；（写法一）

#define maxbit 1e6 //定义编码的最大长度整数常量
typedef struct{int bit[maxbit];
int start;}Hcode;
void HuffCode(){node huffnode[maxnode];//node为上面的代码定义的结点类型
Hcode huffcode[maxcode],cd;//cd为一临时编码结点
int i,j,c,p;
huffnode=HuffTree();//HuffTree为上面实现的建立哈夫曼树的函数
for(int i = 0;i < n;i++)
{cd.start=n-1;//注意start从n-1开始
c=i;
p=node[c].parent;while(p!=-1)
{if(node[p].lchild==c)cd.bit[cd.start]=0;
else cd.bit[cd.start]=1;
cd.start--;
c=p;//从叶节点往上
p=node[c].parent;//p变成c的父节点
}
for(j=cd.start+1;j<n;j++)
{Hcode[i].bit[j]=cd.bit[j];}//保存刚刚求出的叶结点的哈夫曼编码和编码的起始位置
Hcode[i].start=cd.start;
}
for(i=0;i<n;i++)
{for(j=start+1,j<n;j++)
cout<<Hcode[i].bit[j];//输出每个叶结点的哈夫曼编码
}

写法二：

typedef HuffNode{char data;//待编码的符号
double weight;//符号出现的频率
int parent,lchild,rchild;
}HTnode,*HuffmanTree;

编码：从叶结点回退，左分支记0 右记1

void Code(HuffmanTree &HT,int n,int i,char *code)
{//求第i个字符的编码
int p,parent,start;
char *cd;
cd = new char[n];
cd[n-1] = '\0';
start = n-1;
p = i;//p是当前结点的下标
parent = HT[i].parent;//当前结点的父节点下标
while(parent != -1)
{if(HT[parent].lchild == p)
cd[--start] = '0';
else
cd[--start] = '1';
p = parent;
parent = HT[patent].parent;//沿双亲回退
}
strcpy(code,&cd[start]);
delete[]cd;
}

【算法学习笔记】哈夫曼树的构建和哈夫曼编码的实现代码相关推荐

哈夫曼树的构建及哈夫曼树编码
哈夫曼树的构建: 注意:(1).首先把一组数3 5 6 8 9 12 15从小到大排列 (2).选取里面最小2个,顶点出为2个数的和 (3).新产生的顶点在与原先的数字进行比较,在里面选取2个最小的数 ...
数据结构与算法学习笔记（五）树
本文针对树结构中,常见的二叉树和多叉树类型进行介绍和代码分析(主要针对二叉树) 目录一.树 1.1 介绍: 1.2 常用的概念: 1.3 树的种类: 1.4 常见的存储结构: 二.二叉树 2.1 二 ...
算法学习笔记16：递归树
递归树:如何借助树来求解递归算法的时间复杂度今天,我们来讲这种数据结构的一种特殊应用,递归树. 我们都知道,递归代码的时间复杂度分析起来很麻烦.我们在<排序>那里讲过,如何利用递推公式, ...
【算法学习笔记】57. 前缀树字典序优化技巧 STL学习 SJTU OJ 1366 前缀匹配
Description 给出一个总字符个数大小不超过1,000,000的字典(这个字典的单词顺序不为字典序)和不超过1000个长度不超过1000的前缀,输出字典中匹配该前缀,字典序为K_i的单词在字典 ...
算法学习笔记——数据结构：哈夫曼树、带权路径长度WPL、哈夫曼编码
引入合并果子问题如下: 有n堆果子,每次可以合并任意两堆果子,耗费体力值为[两堆果子数之和],最终在n-1次合并后,得到一堆果子. 给出合并的方案,使得耗费的体力值最小例如有3堆果子,质量依次为1 ...
数据结构学习记录——哈夫曼树（什么是哈夫曼树、哈夫曼树的定义、哈夫曼树的构造、哈夫曼树的特点、哈夫曼编码）
目录什么是哈夫曼树哈夫曼树的定义哈夫曼树的构造图解操作代码实现代码解析哈夫曼树的特点哈夫曼编码不等长编码二叉树用于编码哈夫曼编码实例什么是哈夫曼树我们先举个例子: 要将百分制 ...
【数据结构与算法】-哈夫曼树(Huffman Tree)与哈夫曼编码
超详细讲解哈夫曼树(Huffman Tree)以及哈夫曼编码的构造原理.方法,并用代码实现. 1哈夫曼树基本概念路径:从树中一个结点到另一个结点之间的分支构成这两个结点间的路径. 结点的路径长度:两 ...
大顶堆删除最大值_算法学习笔记(47): 二叉堆
堆(Heap)是一类数据结构,它们拥有树状结构,且能够保证父节点比子节点大(或小).当根节点保存堆中最大值时,称为大根堆:反之,则称为小根堆. 二叉堆(Binary Heap)是最简单.常用的堆,是一 ...
哈夫曼树的构建、编码以及带权路径长计算
给定n个权值作为n个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree).哈夫曼树是带权路径长度最短的树,权值较大的结点离根较 ...

【算法学习笔记】哈夫曼树的构建和哈夫曼编码的实现代码

介绍

哈夫曼树的构建

哈夫曼编码

【算法学习笔记】哈夫曼树的构建和哈夫曼编码的实现代码相关推荐

最新文章

热门文章