上一节介绍了哈希表的原理与设计方法,这一节则直接python中现有的哈希表类型:哈希集合 set(集合)和哈希映射 dict(字典)来解决实际应用(刷题)。

零、概念
在介绍实际应用之前,有一个概念我认为是应该了解的,那就是可哈希hashable)。官方的术语介绍如下:

一个对象的哈希值如果在其生命周期内绝不改变,就被称为 可哈希 (它需要具有 __hash__() 方法),并可以同其他对象进行比较(它需要具有 __eq__() 方法)。可哈希对象必须具有相同的哈希值比较结果才会相同。

可哈希性使得对象能够作为字典键或集合成员使用,因为这些数据结构要在内部使用哈希值。

大多数 Python 中的不可变内置对象都是可哈希的;可变容器(例如列表或字典)都不可哈希;不可变容器(例如元组和 frozenset)仅当它们的元素均为可哈希时才是可哈希的。 用户定义类的实例对象默认是可哈希的。 它们在比较时一定不相同(除非是与自己比较),它们的哈希值的生成是基于它们的 id()

我的理解就是:由于python实现的集合和字典是基于哈希表或哈希函数的,为了确保键的唯一性(键与哈希值一 一对应),则规定集合成员字典中的键必须是可哈希的,这意味着其值在其生命周期内不会改变,所以又叫做不可变的。这样, Python 就可以创建一个唯一的哈希值来识别它,字典可以使用它来跟踪唯一键和集合来跟踪唯一值。

不可变类型(immutable types):int, float, decimal, complex, bool, string, tuple, range, frozenset, bytes

可变类型(mutable types):list, dict, set, bytearray, user-defined classes

一、哈希集合的应用

集合是用来存储非重复值的数据结构,因此,很自然地想到用集合进行查重和去重。

217.存在重复元素

class Solution:def containsDuplicate(self, nums: List[int]) -> bool:hashset = set()  # 初始化for i in nums:if i in hashset:  # 元素是否为集合的成员return Trueelse:hashset.add(i)  # 元素添加到集合return False

136. 只出现一次的数字

class Solution:def singleNumber(self, nums: List[int]) -> int:ans = set()for num in nums:if num in ans:ans.remove(num)else:ans.add(num)return ans.pop()

虽然可以用集合解决,但是此题最优的做法是位运算,原理是相同的数做异或运算 ^ 会得到0,而一个数与0做异或会得到这个数本身。所以,数组里面所有相同的数异或会得到0,而那个只出现一次的数再与0做异或,直接得到结果本身,代码如下:

class Solution:def singleNumber(self, nums: List[int]) -> int:ans = nums[0]for i in range(1, len(nums)):ans = ans ^ nums[i]return ans

349. 两个数组的交集

用自带的set,显然 return list(set(nums1) & set(nums2)) 即可,如果是自己实现取交集的操作呢?

class Solution:def intersection(self, nums1: List[int], nums2: List[int]) -> List[int]:set1 = set(nums1)set2 = set(nums2)return self.set_intersection(set1, set2)def set_intersection(self, set1, set2) -> List[int]:if len(set1) > len(set2):  #  考虑较小的数组return self.set_intersection(set2, set1)return [x for x in set1 if x in set2]

小技巧,两个数组的交集一定是在较小的数组当中。

202. 快乐数

class Solution:def isHappy(self, n: int) -> bool:notHappy = set()while True:numbers = list(str(n))total = 0for number in numbers:total += int(number) ** 2if total == 1:return Trueelif total in notHappy:  # 陷入无限循环return Falseelse:notHappy.add(total)n = total

不停重复这个过程,直到这个数等于1(是快乐数),或者这个数等于之前出现过的数(陷入无限循环)。

二、哈希映射的应用

哈希映射是用于存储 (key, value) 键值对的一种实现,这意味着,我们在需要存储比键 key 的信息更多的信息(值 value 的信息)时,需要用到哈希映射。python中的对应自带类型为字典 dict。

1. 两数之和

class Solution:def twoSum(self, nums: List[int], target: int) -> List[int]:record = dict()for i, num in enumerate(nums):if target - num in record:return [record[target - num], i]else:record[num] = i

这里的字典,就不仅存放了 nums 中不同元素的索引(作为键 key),还存放了 target - num 的值(作为值 value),这样当有元素等于这个值时,说明它们之和为target,同时可以输出它们的对应索引(键 key)。

更多关于两数、三数、四数之和的题解,可以看我的这篇文章。

205. 同构字符串

class Solution:def isIsomorphic(self, s: str, t: str) -> bool:s_table = dict()t_table = dict()for i in range(len(s)):if (s[i] in s_table and s_table[s[i]] != t[i]) or (t[i] in t_table and t_table[t[i]] != s[i]):return Falseelse: if s[i] not in s_table:s_table[s[i]] = t[i]  # s到t的关系if t[i] not in t_table:t_table[t[i]] = s[i]  # t到s的关系return True

判断两个字符串是否同构,即存在某种对应关系,注意这个关系得是双向成立的,因为可能字符串1中 a -> b 一定成立,但是字符串2中 b -> a 不一定成立。

599. 两个列表的最小索引总和

class Solution:def findRestaurant(self, list1: List[str], list2: List[str]) -> List[str]:RestaurantTable = dict()ans = list()num = 2005  # 大于2000即可for i, restaurant1 in enumerate(list1):RestaurantTable[restaurant1] = ifor j, restaurant2 in enumerate(list2):if restaurant2 in RestaurantTable and RestaurantTable[restaurant2] + j <= num:if RestaurantTable[restaurant2] + j < num:ans.clear()ans.append(restaurant2)num = RestaurantTable[restaurant2] + jelse:ans.append(restaurant2)return ans

用字典记录一个数组中的餐厅和对应索引值,再遍历另一个数组,如果出现同一个餐厅并且索引之和小于等于当前的最小值 num,则更新 ans 和 num(小于)或者添加餐厅到 ans(等于)。

387. 字符串中的第一个唯一字符

class Solution:def firstUniqChar(self, s: str) -> int:Hashtable = dict()for i, char in enumerate(s):if char in Hashtable:Hashtable[char] = -1else:Hashtable[char] = ians = len(s)for char in Hashtable:if Hashtable[char] != -1 and Hashtable[char] < ans:ans = Hashtable[char]return ans if ans != len(s) else -1

遍历字符串,新出现的字符记录其索引,后面如果重复出现该字符,则值变成 -1(无论多少次出现都是 -1)。然后从ans = len(s) 开始,找到具有最小索引值的字符,若不存在则返回 -1。

350. 两个数组的交集 II

class Solution:def intersect(self, nums1: List[int], nums2: List[int]) -> List[int]:if len(nums1) > len(nums2):return self.intersect(nums2, nums1)c = collections.Counter()for n in nums1:c[n] += 1     ans = list()for m in nums2:if m in c and c[m] > 0:ans.append(m)c[m] -= 1return ans

开头还是小技巧,交集一定在较小的数组中。然后这里用到的是计数器类型 collections.Counter(),它是一个 dict 的子类,用于计数可哈希对象。它的特点就是如果引用的键没有任何记录,就返回一个0,而不是报错 KeyError 。这里的计数器用于存放元素在数组 nums1 出现的次数,然后遍历数组 nums2,每次边添加结果边计数器减一。这样就能使得输出结果中每个元素出现的次数,与元素在两个数组中出现次数的最小值一致。

219. 存在重复元素 II

class Solution:def containsNearbyDuplicate(self, nums: List[int], k: int) -> bool:hashtable = dict()for i, num in enumerate(nums):if num in hashtable and abs(i - hashtable[num]) <= k:return Trueelse:hashtable[num] = ireturn False

用字典记录元素和它的索引值,后面出现相同元素时判断是否符合条件,不符合条件就更新索引值(离下一个相同元素更近)。

220. 存在重复元素 III

class Solution:def containsNearbyAlmostDuplicate(self, nums: List[int], k: int, t: int) -> bool:table = dict()for i in range(len(nums)):bucket_num = nums[i] // (t + 1) # 取商数作为桶的编号,每个桶大小为 t + 1# 存在当前编号的桶,即桶里面已经有东西了,则它们的值一定相差不大于 tif bucket_num in table:return Truetable[bucket_num] = nums[i]# 存在上一个编号的桶,到里面看看是否符合条件if (bucket_num - 1) in table and abs(table[bucket_num - 1] - nums[i]) <= t:return True# 存在下一个编号的桶,到里面看看是否符合条件if (bucket_num + 1) in table and abs(table[bucket_num + 1] - nums[i]) <= t:return True# 当 i 大于等于 k 时,下次遍历(i + 1)就不能考虑 nums[i-k] 了if i >= k:table.pop(nums[i - k] // (t + 1))return False

这题的核心思想就是分桶(分组),将遍历得到的数按数值范围放入不同的桶中(注意是取商数分桶而不是取余数),每个桶的大小为 t + 1。这样当有两个数出现在同一个桶时,它们的差距一定是小于等于 t 的;同一个桶中只有一个的话,就到相邻的桶看看是否符合条件,不相邻的桶就不用考虑了(值的差距一定大于 t);最后要把距离当前索引 k 的那个值对应的桶删掉(索引的差距大于 k)。

359. 日志速率限制器

class Logger:def __init__(self):"""Initialize your data structure here."""self.hashtable = dict()def shouldPrintMessage(self, timestamp: int, message: str) -> bool:"""Returns true if the message should be printed in the given timestamp, otherwise returns false.If this method returns false, the message will not be printed.The timestamp is in seconds granularity."""if message in self.hashtable:if timestamp >= self.hashtable[message]:self.hashtable[message] = timestamp + 10return Trueelse:return Falseelse:self.hashtable[message] = timestamp + 10return True

用字典记录信息和它下一次可以打印的时间,实际上只有打印过并且没到下一次时间的信息会返回False,其余都是更新时间并返回True。

哈希表(散列表)基础概念与经典题目(Leetcode题解-Python语言)之中——实际应用相关推荐

  1. 数据结构:哈希表(散列表)基础

    哈希表(散列表)基础 引入哈希表 什么是哈西表: 一种具有相同特性的数据元素的集合,每个元素具有唯一标识自己的关键字. 基本原理: 说明: 顺序查找.二分查找或者二叉树的查找是基于待查关键字与表中元素 ...

  2. 2.10_hash_table_哈希表 / 散列表

    链表类 class LinkedList(object):"""链表类"""class Node(object):def __init__( ...

  3. 哈希表(散列表)基础概念与经典题目(Leetcode题解-Python语言)之上——原理与设计

    哈希表(Hash table,也叫散列表),是根据键(Key)而直接访问数据在内存中的储存位置(又叫做存储桶,Buckets)的数据结构.也就是说,它通过计算一个关于键值的函数(哈希函数,Hash f ...

  4. 开局一张图帮你充分理解哈希表(散列表)

    目录 1哈希表的概念: 1.1哈希表的插入图示: 1.2哈希表的查询图示: 2.哈希冲突 2.1哈希冲突的概念: 2.2避免冲突 2.2.1哈希函数设计 2.2.2负载因子的调节 3.解决冲突 3.1 ...

  5. 算法小讲堂之哈希表|散列表|考研笔记

    文章目录 一. 基本概念 二. 哈希函数|散列函数 2.1 直接定址法 2.2 保留余数法 2.3 数字分析法 2.4 平方取中法 2.5 折叠法 2.6 随机数法 三.冲突处理 3.1 开放定址法 ...

  6. 哈希表(散列表)介绍

    目录 前言 一.哈希概念 1.1 什么时哈希表 1.2 哈希函数 1.3 哈希冲突 1.4 哈希冲突的解决 1.4.1 闭散列 1.4.2 开散列 1.4.3 问题 前言 哈希表时C++11两容器un ...

  7. 【数据结构笔记39】哈希表/散列表、(数据关键字/字符串关键字)散列构造函数

    本次笔记内容: 11.1.1 引子:散列的基本思路 11.1.2 什么是散列表 11.2.1 数据关键词的散列函数构造 11.2.2 字符串关键词的散列函数构造 文章目录 散列表背景 基本思想引出 已 ...

  8. JavaScript 哈希表(散列表)实现和应用

    查找的效率与比较次数密切相关.基于比较的程序,运算效率是比较低的.比如平时可以通过indexOf查找一个数据.但这是一个基于比较的一个实现.如果是淘宝那样有上亿个商品,那么用indeOf 来查数据就会 ...

  9. 链表基础概念与经典题目(Leetcode题解-Python语言)

    所谓链表,就是由链节点元素组成的表,那什么是链节点呢?直接上定义: class ListNode:def __init__(self, val=0, next=None):self.val = val ...

最新文章

  1. ASP.NET 2.0 页面编译方式
  2. 目录遍历漏洞:入侵检测php程序中的目录遍历漏洞,目录浏览(目录遍历)漏洞
  3. 解决 connect to host github.com port 22 operation timed out
  4. fatal error LNK1169: 找到一个或多个多重定义的符号 的解决方案
  5. 动态规划 —— 线性 DP
  6. 【Linuxamp;Unix--open/close/write/read系统调用】
  7. 解决用户意外退出在线列表无法及时更新问题2(转载)
  8. 【Java从0到架构师】Spring - 整合 MyBatis
  9. 黒猩猩盗猎越来越严重!新科技「猩脸辨识」技术诞生
  10. SQLite指南(1) -- SQLite的特性
  11. DataNucleus之JDO操作演示样例
  12. VMware安装Windows Server 2003提示Operating System not found
  13. 笔记本BIOS启动项中找不到新装的固态硬盘解决
  14. Egg.js VS Thinkjs 简单分析使用
  15. python 列表维度,python判断列表维度
  16. 阿里云SLB配置HTPPS方式访问
  17. html 根据坐标画多边形,Canvas多边形绘制的实现方法
  18. 华为防火墙用户与认证
  19. svn 禁止访问的问题
  20. 微信小程序 手机号码验证

热门文章

  1. 将excel多个工作表(表结构相同)合并后生成csv文件
  2. 学习C语言指针,这一篇案例教程就够够的了
  3. 定量遥感:计算地方时和太阳高度角(C++代码)
  4. C语言试题三十八之将s所指字符串中除了下标为偶数、同时ascii值也为偶数的字符外,其余的全都删除;串中剩余字符所形成的一个新串放在t所指的一个数组中。
  5. 判断一个字符串是否包含另一个字符串(用java但是不能用index()这个函数)
  6. attiny13a程序实例_ATtiny13A图文构成
  7. cake fork什么意思_Java7任务并行执行神器:Forkamp;Join框架
  8. 圆的面积公式的巧妙推导
  9. 在杭州,吃过这60样东西,人生才算完美!
  10. 有生之年必看!原来历史还可以这样震撼,看完我惊呆了...