C++数据结构——哈希表
文章目录
- 1.unordered_map/unordered_set
- 2. 底层结构
- 2.1哈希概念
- 2.3常见哈希函数
- 2.4 哈希冲突
- 3.闭散列(开放定址法)
- 3.1线性探测
- 3.2闭散列扩容-载荷因子
- 3.3二次探测
- 4.开散列
- 4.1开散列增容
1.unordered_map/unordered_set
- unordered_map是存储<key, value>键值对的关联式容器,其允许通过keys快速的索引到与其对应的value。
- 在unordered_map中,键值通常用于惟一地标识元素,而映射值是一个对象,其内容与此键关联。键和映射值的类型可能不同。
- 在内部,unordered_map没有对<kye, value>按照任何特定的顺序排序, 为了能在常数范围内找到key所对应的value,unordered_map将相同哈希值的键值对放在相同的桶中。
- unordered_map容器通过key访问单个元素要比map快,但它通常在遍历元素子集的范围迭代方面效率较低。
unordered_map的元素访问:
2. 底层结构
unordered系列的关联式容器之所以效率比较高,是因为其底层使用了哈希结构。
2.1哈希概念
哈希结构:可以不经过任何比较,一次直接从表中得到要搜索的元素。通过哈希函数(hashFunc) 使元素的存储位置与它的关键码之间能够建立一一映射的关系,那么在查找时通过该函数可以很快找到该元素。
当向该结构中插入元素:根据待插入元素的关键码,以 函数(hashFunc) 计算出该元素的存储位置并按此位置进行存放。
搜索元素: 对元素的关键码进行同样的计算,把求得的函数值当做元素的存储位置,在结构中按此位置取元素比较,若关键码相等,则搜索成功。
该方式即为哈希(散列)方法,哈希方法中使用的转换函数称为哈希(散列)函数,构造出来的结构称为哈希表(Hash Table)(或者称散列表)。
2.3常见哈希函数
1.直接定址法–(常用):
- 取关键字的某个线性函数为散列地址:Hash(Key)= A*Key + B ;
优点:简单、高效 ;
缺点:需要事先知道关键字的分布情况 ;
使用场景:适合查找比较小且连续的情况,比如:第一次出现的字符:构建一个数组hash[ch-‘a’] 来映射位置;
不适用场景:数据分散,数据元素不连续,很容易造成空间浪费,比如 :一组数据最小的为1,最大的到了99999999;
2.除留余数法(常用)
设散列表中允许的地址数为m,取一个不大于m,但最接近或者等于m的质数i作为除数,按照哈希函数:Hash(key) = key% i(p<=m), 将关键码转换成哈希地址;
注意:哈希函数设计的越精妙,产生哈希冲突的可能性就越低,但是无法避免哈希冲突
2.4 哈希冲突
- 不同关键字通过相同哈希哈数计算出相同的哈希地址,该种现象称为哈希冲突或哈希碰撞。
解决哈希冲突两种常见的方法是:闭散列和开散列;
3.闭散列(开放定址法)
当发生哈希冲突时,如果哈希表未被装满,说明在哈希表中必然还有空位置,那么可以把key存放到冲突位置中的“下一个” 空位置中去。寻找下一个空位置的方法有线性探测法和二次探测法
3.1线性探测
从发生冲突的位置开始,依次向后探测,直到寻找到下一个空位置为止;
插入:通过哈希函数获取待插入元素在哈希表中的位置
删除:
采用闭散列处理哈希冲突时,不能随便物理删除哈希表中已有的元素,若直接删除元素会影响其他元素的搜索。比如删除元素4,如果直接删除掉,44查找起来可能会受影响。因此线性探测采用标记的伪删除法来删除一个元素;
线性探测的缺点:空间踩踏
3.2闭散列扩容-载荷因子
3.3二次探测
因此:闭散列最大的缺陷就是空间利用率比较低,这也是哈希的缺陷;
4.开散列
开散列法又叫链地址法(开链法),首先对关键码集合用散列函数计算散列地址,具有相同地址的关键码归于同一子集合,每一个子集合称为一个桶,各个桶中的元素通过一个单链表链接起来,各链表的头结点存储在哈希表中。
4.1开散列增容
开散列最好的情况是:每个哈希桶中刚好挂一个节点,再继续插入元素时,每一次都会发生哈希冲突,因此,在元素个数刚好等于桶的个数时,可以给哈希表增容;
- 载荷因子为1进行扩容;
优点:
- 不同位置冲突时,不再互相干扰,载荷因子一般控制在1
缺点:
- 迭代器遍历输出的时候,不是有序输出的;
如果所有的数据都冲突到一个桶下面了,怎么办?
1.桶下面挂红黑树:极限也是logN的时间复杂度,但是也只是这一会而已,当增容的时候,这种现象就会缓解;
2.多阶哈希
C++数据结构——哈希表相关推荐
- java hashtable 数据结构_数据结构--哈希表(Java)
数据结构--哈希表(Java) 介绍 哈希表 底层是 数组加链表 或者是 数组加二叉树 ,一个数组里面有多个链表,通过散列函数来提高效率 代码 package cn.guizimo.hashtab; ...
- Python中常用的数据结构---哈希表(字典)
Python中常用的数据结构-哈希表(字典) 常用的数据结构有数组.链表(一对一).栈和队列.哈希表.树(一对多).图(多对多)等结构. 在本目录下我们将讲解,通过python语言实现常用的数据结构. ...
- 数据结构——哈希表的详解与实现
数据结构--哈希表(HashTable) 1.前言 当我们频繁的查找数据中的某个元素时,我们通常会选择数组来存放数据,因为数组的的内存是连续的,可以直接通过下标访问数据,但是它添加和删除数据比较麻 ...
- 数据结构哈希表的实现与设计
数据结构哈希表查找姓名的课程设计 有没有大神能帮忙写一下这道题,课设的题目.用C++语言 问题描述:针对某公司中花名设计哈希表,并完成相应的建表和查表程序,基本要求: (1)假设花名为汉字拼音形式.名 ...
- 算法笔记(三)特殊数据结构——哈希表、有序表、并查集、KMP、Manacher、单调栈、位图、大数据类题
layout: post title: 算法笔记(三)特殊数据结构--哈希表.有序表.并查集.KMP.Manacher.单调栈.位图.大数据类题 description: 算法笔记(三)特殊数据结构- ...
- 数据结构 — 哈希表
目录 文章目录 目录 哈希表 哈希表 哈希表,又称为散列表,是根据键值对(Key/Value)进行访问的数据结构,它让 Value 经过哈希函数的转换映射到哈希表对应的位置上,查找效率非常高.哈希索引 ...
- 哈希表数据结构_Java数据结构哈希表如何避免冲突
前言 一.哈希表是what? 这是百度上给出的回答: 简而言之,为什么要有这种数据结构呢? 因为我们想不经过任何比较,一次从表中得到想要搜索的元素.所以就构造出来了哈希表,通过某种函数(哈希函数)使元 ...
- openssl lhash 数据结构哈希表
哈希表是一种数据结构,通过在记录的存储位置和它的关键字之间建立确定的对应关系,来快速查询表中的数据: openssl lhash.h 为我们提供了哈希表OPENSSL_LHASH 的相关接口,我们可以 ...
- 数据结构-----------------------哈希表(最通俗易懂的文章)
哈希表 简要 通俗来讲,哈希表是通过函数 (映射关系) 来直接寻找表中存储的关键字,哈希表也是一种数据结构,它是表结构的一种升级拓展,哈希就是一种函数映射,表是一种数据结构,那么合起来就叫哈希表 那么 ...
- 浅谈算法和数据结构: 哈希表
作者: yangecnu(yangecnu's Blog on 博客园) 出处:http://www.cnblogs.com/yangecnu/ http://www.cnblogs.com/yan ...
最新文章
- select,poll,epoll区别面试常问
- 2.myql数据导入到solr,并建立solr索引(学习笔记)
- 托福试卷真题_托福反复考,反复不过百,你还不知道是谁的问题吗?
- 学习笔记(13):Python网络编程并发编程-解决粘包问题-终极版本
- 【每日scrum】NO.5
- 知道圆心半径取圆上的经纬度_作为一名台球高手,你应该知道的事
- java画板保存_java画板文件保存理解
- C/C++面试宝典2022版(最新版)
- IOTOS物联中台对接海康安防平台(iSecure Center)门禁系统
- 2022年上半年软考开始报名啦
- 错误码 0x8007007b 解决
- verilog实验1:基于FPGA蜂鸣器演奏乐曲并数码管显示
- 软件人才从这里飞翔——访北京大学软件学院院长陈钟博士
- 华为mate50pro和华为mate50RS的区别
- Android App性能优化之内存优化
- 404 jpeg图片_nginx中获取图片抛404错误
- 图像超分辨率重建(SISR)
- Spring Cloud概念+案例(eureka注册+拉取、ribbon负载均衡+重试)、netfix各组件介绍【上】
- 宝塔搭建TY博客附好看模板
- 计算机专业学生如何写一份优秀的校招简历(大三、研二学生请进)