详解哈希表的查找

https://mp.weixin.qq.com/s/j2j9gS62L-mmOH4p89OTKQ


详解哈希表的查找

2018-03-01 算法与数据结构

来自:静默虚空

http://www.cnblogs.com/jingmoxukong/p/4332252.html

 

哈希表和哈希函数

在记录的存储位置和它的关键字之间是建立一个确定的对应关系(映射函数),使每个关键字和一个存储位置能唯一对应。

这个映射函数称为哈希函数,根据这个原则建立的表称为哈希表(Hash Table),也叫散列表。

以上描述,如果通过数学形式来描述就是:

若查找关键字为 key,则其值存放在 f(key) 的存储位置上。由此,不需比较便可直接取得所查记录。

注:哈希查找与线性表查找和树表查找最大的区别在于,不用数值比较。

冲突

若 key1 ≠ key2 ,而 f(key1) = f(key2),这种情况称为冲突(Collision)。

根据哈希函数f(key)和处理冲突的方法将一组关键字映射到一个有限的连续的地址集(区间)上,并以关键字在地址集中的“像”作为记录在表中的存储位置,这一映射过程称为构造哈希表。

构造哈希表这个场景就像汽车找停车位,如果车位被人占了,只能找空的地方停。

构造哈希表

由以上内容可知,哈希查找本身其实不费吹灰之力,问题的关键在于如何构造哈希表和处理冲突。

常见的构造哈希表的方法有 5 种:

(1)直接定址法

说白了,就是小学时学过的一元一次方程。

即 f(key) = a * key + b。其中,a和b 是常数。

(2)数字分析法

假设关键字是R进制数(如十进制)。并且哈希表中可能出现的关键字都是事先知道的,则可选取关键字的若干数位组成哈希地址。

选取的原则是使得到的哈希地址尽量避免冲突,即所选数位上的数字尽可能是随机的。

(3)平方取中法

取关键字平方后的中间几位为哈希地址。通常在选定哈希函数时不一定能知道关键字的全部情况,仅取其中的几位为地址不一定合适;

而一个数平方后的中间几位数和数的每一位都相关, 由此得到的哈希地址随机性更大。取的位数由表长决定。

(4)除留余数法

取关键字被某个不大于哈希表表长 m 的数 p 除后所得的余数为哈希地址。

即 f(key) = key % p (p ≤ m)

这是一种最简单、最常用的方法,它不仅可以对关键字直接取模,也可在折叠、平方取中等运算之后取模。

注意:p的选择很重要,如果选的不好,容易产生冲突。根据经验,一般情况下可以选p为素数。

(5)随机数法

选择一个随机函数,取关键字的随机函数值为它的哈希地址,即 f(key) = random(key)。

通常,在关键字长度不等时采用此法构造哈希函数较为恰当。

解决冲突

设计合理的哈希函数可以减少冲突,但不能完全避免冲突。

所以需要有解决冲突的方法,常见有两类

(1)开放定址法

如果两个数据元素的哈希值相同,则在哈希表中为后插入的数据元素另外选择一个表项。

当程序查找哈希表时,如果没有在第一个对应的哈希表项中找到符合查找要求的数据元素,程序就会继续往后查找,直到找到一个符合查找要求的数据元素,或者遇到一个空的表项。

例子

若要将一组关键字序列 {1, 9, 25, 11, 12, 35, 17, 29} 存放到哈希表中。

采用除留余数法构造哈希表;采用开放定址法处理冲突。

不妨设选取的p和m为13,由 f(key) = key % 13 可以得到下表。

需要注意的是,在上图中有两个关键字的探查次数为 2 ,其他都是1。

这个过程是这样的:

a. 12 % 13 结果是12,而它的前面有个 25 ,25 % 13 也是12,存在冲突。

我们使用开放定址法 (12 + 1) % 13 = 0,没有冲突,完成。

b. 35 % 13 结果是 9,而它的前面有个 9,9 % 13也是 9,存在冲突。

我们使用开放定址法 (9 + 1) % 13 = 10,没有冲突,完成。

(2)拉链法

将哈希值相同的数据元素存放在一个链表中,在查找哈希表的过程中,当查找到这个链表时,必须采用线性查找方法。

在这种方法中,哈希表中每个单元存放的不再是记录本身,而是相应同义词单链表的头指针。

例子

如果对开放定址法例子中提到的序列使用拉链法,得到的结果如下图所示:

实现一个哈希表

假设要实现一个哈希表,要求

a. 哈希函数采用除留余数法,即 f(key) = key % p (p ≤ m)

b. 解决冲突采用开放定址法,即 f2(key) = (f(key)+i) % size (p ≤ m)

(1)定义哈希表的数据结构

class HashTable {

public int key = 0; // 关键字

public int data = 0; // 数值

public int count = 0; // 探查次数

}

(2)在哈希表中查找关键字key

根据设定的哈希函数,计算哈希地址。如果出现地址冲突,则按设定的处理冲突的方法寻找下一个地址。

如此反复,直到不冲突为止(查找成功)或某个地址为空(查找失败)。

/**

* 查找哈希表

* 构造哈希表采用除留取余法,即f(key) = key mod p (p ≤ size)

* 解决冲突采用开放定址法,即f2(key) = (f(key) + i) mod p (1 ≤ i ≤ size-1)

* ha为哈希表,p为模,size为哈希表大小,key为要查找的关键字

*/

public int searchHashTable(HashTable[] ha, int p, int size, int key) {

int addr = key % p; // 采用除留取余法找哈希地址

// 若发生冲突,用开放定址法找下一个哈希地址

while (ha[addr].key != NULLKEY && ha[addr].key != key) {

addr = (addr + 1) % size;

}

if (ha[addr].key == key) {

return addr; // 查找成功

} else {

return FAILED; // 查找失败

}

}

(3)删除关键字为key的记录

在采用开放定址法处理冲突的哈希表上执行删除操作,只能在被删记录上做删除标记,而不能真正删除记录。

找到要删除的记录,将关键字置为删除标记DELKEY。

public int deleteHashTable(HashTable[] ha, int p, int size, int key) {

int addr = 0;

addr = searchHashTable(ha, p, size, key);

if (FAILED != addr) { // 找到记录

ha[addr].key = DELKEY; // 将该位置的关键字置为DELKEY

return SUCCESS;

} else {

return NULLKEY; // 查找不到记录,直接返回NULLKEY

}

}

(4)插入关键字为key的记录

将待插入的关键字key插入哈希表

先调用查找算法,若在表中找到待插入的关键字,则插入失败;

若在表中找到一个开放地址,则将待插入的结点插入到其中,则插入成功。

public void insertHashTable(HashTable[] ha, int p, int size, int key) {

int i = 1;

int addr = 0;

addr = key % p; // 通过哈希函数获取哈希地址

if (ha[addr].key == NULLKEY || ha[addr].key == DELKEY) { // 如果没有冲突,直接插入

ha[addr].key = key;

ha[addr].count = 1;

} else { // 如果有冲突,使用开放定址法处理冲突

do {

addr = (addr + 1) % size; // 寻找下一个哈希地址

i++;

} while (ha[addr].key != NULLKEY && ha[addr].key != DELKEY);

ha[addr].key = key;

ha[addr].count = i;

}

}

(5)建立哈希表

先将哈希表中各关键字清空,使其地址为开放的,然后调用插入算法将给定的关键字序列依次插入。

public void createHashTable(HashTable[] ha, int[] list, int p, int size) {

int i = 0;

// 将哈希表中的所有关键字清空

for (i = 0; i < ha.length; i++) {

ha[i].key = NULLKEY;

ha[i].count = 0;

}

// 将关键字序列依次插入哈希表中

for (i = 0; i < list.length; i++) {

this.insertHashTable(ha, p, size, list[i]);

}

}

完整代码

 

class HashTable {

public int key = 0; // 关键字

public int data = 0; // 数值

public int count = 0; // 探查次数

}

public class HashSearch {

private final static int MAXSIZE = 20;

private final static int NULLKEY = 1;

private final static int DELKEY = 2;

private final static int SUCCESS = 0;

private final static int FAILED = 0xFFFFFFFF;

/**

* 查找哈希表

* 构造哈希表采用除留取余法,即f(key) = key mod p (p ≤ size)

* 解决冲突采用开放定址法,即f2(key) = (f(key) + i) mod p (1 ≤ i ≤ size-1)

* ha为哈希表,p为模,size为哈希表大小,key为要查找的关键字

*/

public int searchHashTable(HashTable[] ha, int p, int size, int key) {

int addr = key % p; // 采用除留取余法找哈希地址

// 若发生冲突,用开放定址法找下一个哈希地址

while (ha[addr].key != NULLKEY && ha[addr].key != key) {

addr = (addr + 1) % size;

}

if (ha[addr].key == key) {

return addr; // 查找成功

} else {

return FAILED; // 查找失败

}

}

/**

* 删除哈希表中关键字为key的记录

* 找到要删除的记录,将关键字置为删除标记DELKEY

*/

public int deleteHashTable(HashTable[] ha, int p, int size, int key) {

int addr = 0;

addr = searchHashTable(ha, p, size, key);

if (FAILED != addr) { // 找到记录

ha[addr].key = DELKEY; // 将该位置的关键字置为DELKEY

return SUCCESS;

} else {

return NULLKEY; // 查找不到记录,直接返回NULLKEY

}

}

/**

* 将待插入的关键字key插入哈希表

* 先调用查找算法,若在表中找到待插入的关键字,则插入失败;

* 若在表中找到一个开放地址,则将待插入的结点插入到其中,则插入成功。

*/

public void insertHashTable(HashTable[] ha, int p, int size, int key) {

int i = 1;

int addr = 0;

addr = key % p; // 通过哈希函数获取哈希地址

if (ha[addr].key == NULLKEY || ha[addr].key == DELKEY) { // 如果没有冲突,直接插入

ha[addr].key = key;

ha[addr].count = 1;

} else { // 如果有冲突,使用开放定址法处理冲突

do {

addr = (addr + 1) % size; // 寻找下一个哈希地址

i++;

} while (ha[addr].key != NULLKEY && ha[addr].key != DELKEY);

ha[addr].key = key;

ha[addr].count = i;

}

}

/**

* 创建哈希表

* 先将哈希表中各关键字清空,使其地址为开放的,然后调用插入算法将给定的关键字序列依次插入。

*/

public void createHashTable(HashTable[] ha, int[] list, int p, int size) {

int i = 0

// 将哈希表中的所有关键字清空

for (i = 0; i < ha.length; i++) {

ha[i].key = NULLKEY;

ha[i].count = 0;

}

// 将关键字序列依次插入哈希表中

for (i = 0; i < list.length; i++) {

this.insertHashTable(ha, p, size, list[i]);

}

}

/**

* 输出哈希表

*/

public void displayHashTable(HashTable[] ha) {

int i = 0;

System.out.format("pos: ", "pos");

for (i = 0; i < ha.length; i++) {

System.out.format("%4d", i);

}

System.out.println();

System.out.format("key: ");

for (i = 0; i < ha.length; i++) {

if (ha[i].key != NULLKEY) {

System.out.format("%4d", ha[i].key);

} else {

System.out.format("    ");

}

}

System.out.println();

System.out.format("count: ");

for (i = 0; i < ha.length; i++) {

if (0 != ha[i].count) {

System.out.format("%4d", ha[i].count);

} else {

System.out.format("    ");

}

}

System.out.println();

}

public static void main(String[] args) {

int[] list = { 3, 112, 245, 27, 44, 19, 76, 29, 90 };

HashTable[] ha = new HashTable[MAXSIZE];

for (int i = 0; i < ha.length; i++) {

ha[i] = new HashTable();

}

HashSearch search = new HashSearch();

search.createHashTable(ha, list, 19, MAXSIZE);

search.displayHashTable(ha);

}

}

参考资料

《数据结构习题与解析》(B级第3版)

转载于:https://www.cnblogs.com/pegasus923/p/8674201.html

【ZZ】详解哈希表的查找相关推荐

  1. 详解哈希数据结构,手写哈希表

    哈希表,终于姗姗来迟了. 本文系统讲解了哈希表数据结构的相关概念,并以HashMap为案例讲解一下它与普通哈希表的不同点,最后也手写一个简易的哈希表. 所以通过本文,我希望读者们能对哈希表有一个清楚的 ...

  2. 查找三 哈希表的查找

    要点 哈希表和哈希函数 在记录的存储位置和它的关键字之间是建立一个确定的对应关系(映射函数),使每个关键字和一个存储位置能唯一对应.这个映射函数称为哈希函数,根据这个原则建立的表称为哈希表(Hash ...

  3. 建oracle簇表,详解ORACLE簇表、堆表、IOT表、分区表

    详解ORACLE簇表.堆表.IOT表.分区表 簇和簇表 簇其实就是一组表,是一组共享相同数据块的多个表组成.将经常一起使用的表组合在一起成簇可以提高处理效率. 在一个簇中的表就叫做簇表.建立顺序是:簇 ...

  4. mysql 事务 for update,mysql事务锁_详解mysql 锁表 for update

    摘要 腾兴网为您分享:详解mysql 锁表 for update,智慧农业,真还赚,悦读小说,学习帮等软件知识,以及电池管家,三国群英传3,userland,运满满货主版,王者荣耀,简单3d动画,嘉丽 ...

  5. mysql教程详解之多表联合查询_详解数据库多表连接查询的实现方法

    详解数据库多表连接查询的实现方法 通过连接运算符可以实现多个表查询.连接是关系数据库模型的主要特点,也是它区别于其它类型数据库管理系统的一个标志. 在关系数据库管理系统中,表建立时各数据之间的关系不必 ...

  6. C/C++编译和链接过程详解 概述 (重定向表,导出符号表,未解决符号表)

    详解link  有 些人写C/C++(以下假定为C++)程序,对unresolved external link或者duplicated external simbol的错误信息不知所措(因为这样的错 ...

  7. ssl1125-集合【哈希表二分查找+快排】

    前言 今天学哈希表,然后就第一节晚修赶快写完作业就上了做题了,然后就做完了这道题get√. 正题 题目 给出两个集合: A是B的一个真子集,输出"A is a proper subset o ...

  8. mysql多表查询详解_MySQL多表查询详解上

    时光在不经意间,总是过得出奇的快.小暑已过,进入中暑,太阳更加热烈的绽放着ta的光芒,...在外面被太阳照顾的人们啊,你们都是勤劳与可爱的人啊.在房子里已各种姿势看我这篇这章的你,既然点了进来,那就由 ...

  9. mysql user表字段详解_Mysql User表权限字段说明全介绍

    下文对Mysql User表权限字段进行了全部的详细说明,供您参考学习,如果您对Mysql User表权限字段不是很了解,不妨一看,相信对您会有所启迪. Select_priv:确定用户是否可以通过S ...

最新文章

  1. 魔兽War3按键精灵Ⅱ(2012-9-4)
  2. IE和Firefox在JS方面的不兼容及统一方法总结
  3. JavaScript入门(一)
  4. IDEA界面太丑??尝试一下这几个插件!
  5. 通俗易懂,带你了解Kafka
  6. Python环境搭建与连接SQL Server类MyDBase的实现
  7. 神了,一次解决Java所有痛难点!
  8. ipa apk.cn dbl.html,前端解析ipa、apk安装包信息 ―― app-info-parser
  9. GitLab版本管理(转)
  10. 蓝桥杯 杨辉三角形 python组省赛真题
  11. 华为星环大数据_星环大数据平台介绍,盘点星环大数据和华为大数据
  12. UReport2导出word报错
  13. 【禁用U盘】电脑windows7/10注册表、组策略禁用优盘;
  14. 免费的在线Web文件管理器:Net2FTP,Pydio,eXtplorer,KodExplorer–功能强大
  15. 树莓派-从入手到使用(一):树莓派入手操作第一步
  16. 直击微软第九频道著名主持Robert Green 对话一站式示例代码库大老板梁梅女士
  17. 二、TIPTOP命名原则和目录配置—TIPTOP GP ERP二次开发新手教程
  18. linux sata驱动加载硬盘顺序,linux安装前必备知识
  19. Verilog VHDL三种建模描述方式——2选1数据选择器
  20. 有没有免费将XPS转Word的方法?

热门文章

  1. vue :class 动态绑定样式_Notes04vbind动态绑定class
  2. 区位码\机器码\内码关系
  3. Linux系统xshell常用指令,linux系统安装数据库时,xshell工具常用MySQL(5.5)相关命令...
  4. 基金指数温度怎么算_医药冷链物流——运输过程中如何保证温度?
  5. 泸州计算机专业学院,泸州计算机专业中职推荐
  6. c语言字符屏幕,C语言字符屏幕函数 - 编程资料 - Powered 万人网络编程学院 bcxy.yinese.com...
  7. python 去除字符串的标点符号 用_Python输入和输出
  8. 12天背诵楞严咒的技巧_背诵楞严咒的技巧
  9. android静态代码扫描,android 静态代码扫描
  10. Django远端访问