Hash表（C语言）

一、简介:

哈希表又称散列表。哈希表存储的基本思想是：以数据表中的每个记录的关键字 key为自变量，通过一种函数H(key)计算出函数值。把这个值解释为一块连续存储空间（即数组空间）的单元地址（即下标），将该记录存储到这个单元中。在此称该函数H为哈函数或散列函数。按这种方法建立的表称为哈希表或散列表。

二、哈希冲突：

不同key值产生相同的地址，H(key1)=H(key2)

处理冲突的方法：

(1)开放寻址法： $H_{i}=(H(key) + d_{i})MODm$ , i=1,2,…, k(k<=m-1)，其中H(key)为散列函数，m为散列表长， $d_{i}$ 为增量序列，可有下列三种取法：
1. $d_{i}$ =1,2,3,…, m-1，称线性探测再散列；
2. $d_{i}=1^{2}, -1^{2}, 2^{2},-2^{2}, 3^{2},$ ..., $\pm k^{2}$ ,(k<=m/2)称二次探测再散列；
3. $d_{i}$ =伪随机数序列，称伪随机探测再散列。

例：有一组数据19 01 23 14 55 68 11 86 37要存储在表长11的数组中，其中H(key)=key MOD 11

线性探测再散列

index	0	1	2	3	4	5	6	7	8	9	10
key	55	1		14					19	86
		23冲突	23
			68冲突	68冲突	68
	11冲突	11冲突	11冲突	11冲突	11冲突	11
					37冲突	37冲突	37
最终存储结果	55	1	23	14	68	11	37		19	86

(2)再散列法： $H_{i}=RH_{i}(key)$ ,i=1,2,…,k。 $RH_{i}$ 均是不同的散列函数，即在同义词产生地址冲突时计算另一个散列函数地址，直到冲突不再发生，这种方法不易产生“聚集”，但增加了计算时间

(3)链地址法（拉链法）：将所有关键字为同义词的记录存储在同一线性链表中，产生hash冲突后在存储数据后面加一个指针，指向后面冲突的数据：

三、hash表的查找：

查找过程和造表过程一致，假设采用开放定址法处理冲突，则查找过程为：
1.对于给定的key，计算hash地址index = H(key)
2.如果数组arr[index]的值为空则查找不成功
3.如果数组arr[index]== key 则查找成功
4.否则使用冲突解决方法求下一个地址，直到arr[index] == key 或者 arr[index] == null

hash表的查找效率

决定hash表查找的ASL因素：
(1)选用的hash函数
(2)选用的处理冲突的方法
(3)hash表的饱和度，装载因子 α=n/m（n表示实际装载数据长度，m为表长）

一般情况，假设hash函数是均匀的，则在讨论ASL时可以不考虑它的因素，hash表的ASL是处理冲突方法和装载因子的函数，前人已经证明，查找成功时如下结果：

可以看到无论哪个函数，装载因子越大，平均查找长度越大，那么装载因子α越小越好？也不是，就像100的表长只存一个数据，α是小了，但是空间利用率不高啊，这里就是时间空间的取舍问题了。通常情况下，认为α=0.75是时间空间综合利用效率最高的情况。上面的这个表可是特别有用的。假设我现在有10个数据，想使用链地址法解决冲突，并要求平均查找长度<2，那么有：1+α/2 <2，即α<2，即 n/m<2 (n=10)，即m>10/2，即m>5，即采用链地址法，使得平均查找长度< 2，那么m>5。

hash表的构造应该是这样的：

四、hash表的删除：

首先链地址法是可以直接删除元素的，但是开放定址法是不行的，拿前面的双探测再散列来说，假如我们删除了元素1，将其位置置空，那 23就永远找不到了。正确做法应该是删除之后置入一个原来不存在的数据，比如-1。

五、算法实现：

#include<stdio.h>
#include<stdlib.h>#define hashtype int//声明数组元素类型typedef struct {int key;  //键（在数组中的索引）hashtype val;  //值（元素值）
}DataType; //对基本数据类型进行封装，类似泛型typedef struct {DataType data;struct HashNode *next;  //key冲突时，通过next指针进行连接
}HashNode;typedef struct {int size;HashNode *table;
}HashMap, *hashmap;//f1_createHashMap
//将给定的整形数组构建为HashMap,size为数组长度
HashMap *CreateHashMap(int *nums, int size) {//分配内存空间HashMap *hashmap = (HashMap*)malloc(sizeof(HashMap));hashmap->size = 2 * size;//2倍可寻找到‘冲突机会’和‘空间利用率’的一个平衡//hash表分配空间hashmap->table = (HashNode *)malloc(sizeof(HashNode)*hashmap->size);//初始化int j = 0;for (j = 0; j<hashmap->size; j++) {hashmap->table[j].data.val = INT_MIN;hashmap->table[j].next = NULL;}int i = 0;//建立HashMapwhile (i<size) {//根据数组元素的值计算其在hashMap中的位置int pos = abs(nums[i]) % hashmap->size;//判断是否冲突if (hashmap->table[pos].data.val == INT_MIN) {//不冲突//把元素在数组中的索引作为keyhashmap->table[pos].data.key = i;//把元素值作为valuehashmap->table[pos].data.val = nums[i];}//冲突else {//给当前元素分配一个结点，并为结点复制HashNode *lnode = (HashNode*)malloc(sizeof(HashNode)), *hashnode;lnode->data.key = i;lnode->data.val = nums[i];lnode->next = NULL;//从冲突位置开始，遍历链表hashnode = &(hashmap->table[pos]);while (hashnode->next != NULL) {hashnode = hashnode->next;}//将当前结点连接到链表尾部hashnode->next = lnode;}//处理下一个元素i++;}//处理完成，返回HashMapreturn hashmap;
}//f2_GetHashNode
int Get(HashMap hashmap, int value) {   //根据元素值，计算其位置int pos = abs(value) % hashmap.size;HashNode *pointer = &(hashmap.table[pos]);//在当前链表遍历查找该结点while (pointer != NULL) {if (pointer->data.val == value)return pointer->data.key;elsepointer = pointer->next;}//未找到，返回-1return -1;
}//f3_Put，与建立HashMap时插入元素的方法相同
int Put(HashMap hashmap, int key, int value) {int pos = abs(value) % hashmap.size;HashNode *pointer = &(hashmap.table[pos]);if (pointer->data.val == INT_MIN){pointer->data.val = value;pointer->data.key = key;}else {while (pointer->next != NULL)pointer = pointer->next;HashNode *hnode = (HashNode *)malloc(sizeof(HashNode));hnode->data.key = key;hnode->data.val = value;hnode->next = NULL;pointer->next = hnode;}return 1;
}//f4_PrintHashMap
void PrintHashMap(HashMap* hashmap) {printf("%===========PrintHashMap==========\n");int i = 0;HashNode *pointer;while (i<hashmap->size) {pointer = &(hashmap->table[i]);while (pointer != NULL) {if (pointer->data.val != INT_MIN)printf("%10d", pointer->data.val);elseprintf("        [ ]");pointer = pointer->next;}printf("\n---------------------------------");i++;printf("\n");}printf("===============End===============\n");
}//f5_DestoryHashMap
void DestoryHashMap(HashMap *hashmap) {int i = 0;HashNode *hpointer;while (i<hashmap->size) {hpointer = hashmap->table[i].next;while (hpointer != NULL) {hashmap->table[i].next = hpointer->next;//逐个释放结点空间，防止内存溢出free(hpointer);hpointer = hashmap->table[i].next;hashmap->table[i].next = NULL;//消除野指针}//换至下一个结点i++;}free(hashmap->table);hashmap->table = NULL;free(hashmap);hashmap = NULL;printf("Destory hashmap Success!");
}int main(int argc, char **argv)
{int nums[] = { 34,54,32,32,56,78 };//创建HashMapHashMap *hashmap = CreateHashMap(nums, 6);PrintHashMap(hashmap);//查找元素printf("%d\n", Get(*hashmap, 78));DestoryHashMap(hashmap);getchar();return 0;
}

本文节选或转载CSDN博主「洌冰」的原创文章，遵循 CC 4.0 BY-SA 版权协议，以下附上原文出处链接。
原文链接：https://blog.csdn.net/u011109881/article/details/80379505

本文节选或转载CSDN博主「Rnan_wang」的原创文章，遵循 CC 4.0 BY-SA 版权协议，以下附上原文出处链接。
原文链接：https://blog.csdn.net/qq_19446965/article/details/102290770

Hash表（C语言）相关推荐

hash表--c语言字符串键值配对——(key, value)
c语言键值配对--(key, value) 看一个C++项目时,其中解析配置文的部分引发了我的思考. 配置文件问普通字符文件,内容都是类似如下: ipaddr=127.0.0.1 port=888 ...
哈希表（散列表）—Hash表解决地址冲突 C语言实现
哈希表(Hash table,也叫散列表),是根据关键码值(Key value)而直接进行访问的数据结构.也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度.具体的介绍网上有很详 ...
hash表的平均查找长度C语言,关于ASL(平均查找长度)的简单总结
ASL(Average Search Length),即平均查找长度,在查找运算中,由于所费时间在关键字的比较上,所以把平均需要和待查找值比较的关键字次数成为平均查找长度. 它的定义是这样的: 其中n ...
hash表建立，查找，详解
散列表(Hash table,也叫哈希表),是根据关键字(Key value)而直接访问在内存存储位置的数据结构.也就是说,它通过计算一个关于键值的函数,将所需查询的数据映射到表中一个位置来访问记录, ...
从头到尾彻底解析Hash表算法
从头到尾彻底解析Hash表算法发布时间: 2013-10-02 10:26 阅读: 25156 次推荐: 14 原文链接 [收藏] 作者:July.wuliming.pkuoliv ...
0x14.基础数据结构 — hash表与字符串hash
目录一.Hash表 1.AcWing 137. 雪花雪花雪花 0.hash表+链表 1.字符串的最小表示法二.字符串hashhashhash 0.AcWing 138. 兔子与兔子 1.luogu ...
PTA 基础编程题目集 7-20 打印九九口诀表 C语言
PTA 基础编程题目集 7-20 打印九九口诀表 C语言下面是一个完整的下三角九九口诀表: 本题要求对任意给定的一位正整数N,输出从11到NN的部分口诀表. 输入格式: 输入在一行中给出一个正整数N ...
一步一步写算法（之hash表）
[ 声明:版权全部,欢迎转载,请勿用于商业用途. 联系信箱:feixiaoxing @163.com] hash表,有时候也被称为散列表.个人觉得,hash表是介于链表和二叉树之间的一种中间结构.链 ...
转从头到尾彻底解析Hash表算法
出处:http://blog.csdn.net/v_JULY_v. 说明:本文分为三部分内容, 第一部分为一道百度面试题Top K算法的详解:第二部分为关于Hash表算法的详细阐述:第三部 ...

Hash表（C语言）

Hash表（C语言）相关推荐

最新文章

热门文章