查找三 哈希表的查找
哈希表和哈希函数
在记录的存储位置和它的关键字之间是建立一个确定的对应关系(映射函数),使每个关键字和一个存储位置能唯一对应。这个映射函数称为哈希函数,根据这个原则建立的表称为哈希表(Hash Table),也叫散列表。
以上描述,如果通过数学形式来描述就是:
若查找关键字为 key,则其值存放在 f(key) 的存储位置上。由此,不需比较便可直接取得所查记录。
注:哈希查找与线性表查找和树表查找最大的区别在于,不用数值比较。
冲突
若 key1 ≠ key2 ,而 f(key1) = f(key2),这种情况称为冲突(Collision)。
根据哈希函数f(key)和处理冲突的方法将一组关键字映射到一个有限的连续的地址集(区间)上,并以关键字在地址集中的“像”作为记录在表中的存储位置,这一映射过程称为构造哈希表。
构造哈希表这个场景就像汽车找停车位,如果车位被人占了,只能找空的地方停。
由以上内容可知,哈希查找本身其实不费吹灰之力,问题的关键在于如何构造哈希表和处理冲突。
常见的构造哈希表的方法有 5 种:
(1)直接定址法
说白了,就是小学时学过的一元一次方程。
即 f(key) = a * key + b。其中,a和b 是常数。
(2)数字分析法
假设关键字是R进制数(如十进制)。并且哈希表中可能出现的关键字都是事先知道的,则可选取关键字的若干数位组成哈希地址。
选取的原则是使得到的哈希地址尽量避免冲突,即所选数位上的数字尽可能是随机的。
(3)平方取中法
取关键字平方后的中间几位为哈希地址。通常在选定哈希函数时不一定能知道关键字的全部情况,仅取其中的几位为地址不一定合适;
而一个数平方后的中间几位数和数的每一位都相关, 由此得到的哈希地址随机性更大。取的位数由表长决定。
(4)除留余数法
取关键字被某个不大于哈希表表长 m 的数 p 除后所得的余数为哈希地址。
即 f(key) = key % p (p ≤ m)
这是一种最简单、最常用的方法,它不仅可以对关键字直接取模,也可在折叠、平方取中等运算之后取模。
注意:p的选择很重要,如果选的不好,容易产生冲突。根据经验,一般情况下可以选p为素数。
(5)随机数法
选择一个随机函数,取关键字的随机函数值为它的哈希地址,即 f(key) = random(key)。
通常,在关键字长度不等时采用此法构造哈希函数较为恰当。
设计合理的哈希函数可以减少冲突,但不能完全避免冲突。
所以需要有解决冲突的方法,常见有两类
(1)开放定址法
当程序查找哈希表时,如果没有在第一个对应的哈希表项中找到符合查找要求的数据元素,程序就会继续往后查找,直到找到一个符合查找要求的数据元素,或者遇到一个空的表项。
例子
若要将一组关键字序列 {1, 9, 25, 11, 12, 35, 17, 29} 存放到哈希表中。
采用除留余数法构造哈希表;采用开放定址法处理冲突。
不妨设选取的p和m为13,由 f(key) = key % 13 可以得到下表。
需要注意的是,在上图中有两个关键字的探查次数为 2 ,其他都是1。
这个过程是这样的:
a. 12 % 13 结果是12,而它的前面有个 25 ,25 % 13 也是12,存在冲突。
我们使用开放定址法 (12 + 1) % 13 = 0,没有冲突,完成。
b. 35 % 13 结果是 9,而它的前面有个 9,9 % 13也是 9,存在冲突。
(2)拉链法
在这种方法中,哈希表中每个单元存放的不再是记录本身,而是相应同义词单链表的头指针。
例子
如果对开放定址法例子中提到的序列使用拉链法,得到的结果如下图所示:
假设要实现一个哈希表,要求
a. 哈希函数采用除留余数法,即 f(key) = key % p (p ≤ m)
b. 解决冲突采用开放定址法,即 f2(key) = (f(key)+i) % size (p ≤ m)
(1)定义哈希表的数据结构
public int key = 0; // 关键字
public int data = 0; // 数值
public int count = 0; // 探查次数
}
(2)在哈希表中查找关键字key
根据设定的哈希函数,计算哈希地址。如果出现地址冲突,则按设定的处理冲突的方法寻找下一个地址。
如此反复,直到不冲突为止(查找成功)或某个地址为空(查找失败)。
* 查找哈希表
* 构造哈希表采用除留取余法,即f(key) = key mod p (p ≤ size)
* 解决冲突采用开放定址法,即f2(key) = (f(key) + i) mod p (1 ≤ i ≤ size-1)
* ha为哈希表,p为模,size为哈希表大小,key为要查找的关键字
*/
public int searchHashTable(HashTable[] ha, int p, int size, int key) {
int addr = key % p; // 采用除留取余法找哈希地址
// 若发生冲突,用开放定址法找下一个哈希地址
while (ha[addr].key != NULLKEY && ha[addr].key != key) {
addr = (addr + 1) % size;
}
if (ha[addr].key == key) {
return addr; // 查找成功
} else {
return FAILED; // 查找失败
}
}
(3)删除关键字为key的记录
在采用开放定址法处理冲突的哈希表上执行删除操作,只能在被删记录上做删除标记,而不能真正删除记录。
int addr = 0;
addr = searchHashTable(ha, p, size, key);
if (FAILED != addr) { // 找到记录
ha[addr].key = DELKEY; // 将该位置的关键字置为DELKEY
return SUCCESS;
} else {
return NULLKEY; // 查找不到记录,直接返回NULLKEY
}
}
(4)插入关键字为key的记录
先调用查找算法,若在表中找到待插入的关键字,则插入失败;
若在表中找到一个开放地址,则将待插入的结点插入到其中,则插入成功。
int i = 1;
int addr = 0;
addr = key % p; // 通过哈希函数获取哈希地址
if (ha[addr].key == NULLKEY || ha[addr].key == DELKEY) { // 如果没有冲突,直接插入
ha[addr].key = key;
ha[addr].count = 1;
} else { // 如果有冲突,使用开放定址法处理冲突
do {
addr = (addr + 1) % size; // 寻找下一个哈希地址
i++;
} while (ha[addr].key != NULLKEY && ha[addr].key != DELKEY);
ha[addr].key = key;
ha[addr].count = i;
}
}
(5)建立哈希表
先将哈希表中各关键字清空,使其地址为开放的,然后调用插入算法将给定的关键字序列依次插入。
int i = 0;
// 将哈希表中的所有关键字清空
for (i = 0; i < ha.length; i++) {
ha[i].key = NULLKEY;
ha[i].count = 0;
}
// 将关键字序列依次插入哈希表中
for (i = 0; i < list.length; i++) {
this.insertHashTable(ha, p, size, list[i]);
}
}
完整代码
本文转自静默虚空博客园博客,原文链接:http://www.cnblogs.com/jingmoxukong/p/4332252.html,如需转载请自行联系原作者
查找三 哈希表的查找相关推荐
- 【ZZ】详解哈希表的查找
详解哈希表的查找 https://mp.weixin.qq.com/s/j2j9gS62L-mmOH4p89OTKQ 详解哈希表的查找 2018-03-01 算法与数据结构 来自:静默虚空 http: ...
- 查找 之 散列表查找(哈希表)
基础概念 散列技术是在记录的存储位置和它的关键字之间建立一个确定的对应关系f,使得每个关键字key对应一个存储位置f(key).这里对应关系f称为散列函数,又称为哈希(Hash)函数. 采用散列技术将 ...
- 散列表查找(哈希表)
散列函数构造经常要考虑: 1.散列表的长度 2.关键字的长度 3.关键字的分布情况 4.计算散列函数所需的时间 5.记录的查找频率 一个"好"的散列函数应遵循一下两条原则 (1)函 ...
- ssl1125-集合【哈希表二分查找+快排】
前言 今天学哈希表,然后就第一节晚修赶快写完作业就上了做题了,然后就做完了这道题get√. 正题 题目 给出两个集合: A是B的一个真子集,输出"A is a proper subset o ...
- 哈希表的查找比红黑树更快吗?
这个主要取决于键的类型,因为哈希表需要考虑hash函数和operate==,而红黑树需要考虑operate<.这其中速度取决于hash函数与operate<的计算成本.一般情况下,两者的成 ...
- 哈希(Hash)算法,用哈希表进行查找
众所周知,哈希表是一种时间复杂度低的查找方式,而它的实现原理也比较简单. 举个简单的例子,如果我报一个字:中,让你去找到这个字在字典里的位置,你会怎么做? 首先,我们知道,这个字念:zhong,故我们 ...
- 【大话数据结构C语言】62 散列表(哈希表)查找
欢迎关注我的公众号是[CodeAllen],关注回复[1024]获取精品学习资源 程序员技术交流①群:736386324 程序员技术交流②群:371394777 什么是散列表? 在初中的数学课本中学 ...
- 算法查找,顺序查找,二分查找,分块查找,哈希表查找
七大查找算法博客园:https://www.cnblogs.com/yw09041432/p/5908444.html
- Hash函数与算法、哈希查找、哈希冲突解决方法总结
Hash哈希知识点导航 1.基本概念 2. 哈希函数 2.1 直接寻址法 2.2 数字分析法 2.3 平方取中法 2.4 折叠法 2.5 随机数法 2.6 除留余数法 3. 哈 ...
最新文章
- 三十张图片让你彻底弄明白图的两种遍历方式:DFS和BFS
- 程序压力测试、性能测试AB、Webbench、Tsung
- Kubernetes-Label
- Cell Research | 单细胞测序技术揭示派杰氏病的致病机制
- SSM框架中的前后端分离
- 字符流Reader和Writer
- visa卡号生成器 在线_作为一名程序员,我都收集了哪些好玩的生成器?
- MATLAB图像的读取和显示
- 全国计算机软考程序员考试大纲(2012)
- matlab拟合模型学习总结
- 关于TRACERT和TTL
- python之操作mysql数据库
- ArcGIS for Desktop 10.2安装破解与使用图文详解
- 程序员下厨房入门---好好照顾自己
- shopnc linux im安装教程,shopnc编译安装IM服务器node.js
- UNIX网络编程卷1 回射客户程序 TCP客户程序设计范式
- linux查看附近可用wifi并进行通过命令行连接
- 西北工业大学明德学院计算机老师,师资队伍结构
- 常用软件列表,根据网上的一位仁兄稍加整理所得。再此感谢那位仁兄。
- 二十六万字详解bat文件
热门文章
- JAVA版游戏下载_我的世界Java版20w51a
- 爱的十个秘密--2.思想的力量
- 【纪中集训2019.3.26】动态半平面交
- 执行力:Just Do It
- Hibernate4实战 之 第一部分 Hibernate入门
- 极度 YM....自己用trie写了个伪 map....( HDU 1075 )
- data too long for column 'Auser' at row 1
- MFC中char*,string和CString之间的转换
- C# XML 添加,修改,删除Xml节点
- git 2.30.1最新版本的使用