使用BloomFilter布隆过滤器解决缓存击穿、垃圾邮件识别、集合判重
Bloom Filter是一个占用空间很小、效率很高的随机数据结构,它由一个bit数组和一组Hash算法构成。可用于判断一个元素是否在一个集合中,查询效率很高(1-N,最优能逼近于1)。
在很多场景下,我们都需要一个能迅速判断一个元素是否在一个集合中。譬如:
网页爬虫对URL的去重,避免爬取相同的URL地址;
反垃圾邮件,从数十亿个垃圾邮件列表中判断某邮箱是否垃圾邮箱(同理,垃圾短信);
缓存击穿,将已存在的缓存放到布隆中,当黑客访问不存在的缓存时迅速返回避免缓存及DB挂掉。
可能有人会问,我们直接把这些数据都放到数据库或者redis之类的缓存中不就行了,查询时直接匹配不就OK了?
是的,当这个集合量比较小,你内存又够大时,是可以这样做,你可以直接弄个HashSet、HashMap就OK了。但是当这个量以数十亿计,内存装不下,数据库检索极慢时该怎么办。
以垃圾邮箱为例
方案比较
优缺点
原理
使用BloomFilter布隆过滤器解决缓存击穿、垃圾邮件识别、集合判重相关推荐
- REDIS13_缓存雪崩、缓存穿透、基于布隆过滤器解决缓存穿透的问题、缓存击穿、基于缓存击穿工作实际案例
文章目录 ①. 缓存雪崩 ②. 缓存穿透 ③. 在centos7下布隆过滤器2种安装方式 ④. 缓存击穿 ⑤. 高并发的淘宝聚划算案例落地 ①. 缓存雪崩 ①. 问题的产生:缓存雪崩是指缓存数据大批量 ...
- 布隆过滤器解决缓存穿透_缓冲穿透/缓存击穿/缓存雪崩等问题解决办法
----------------------[感谢小昭提供的图片] 1.缓存穿透 定义:请求查询数据库中压根就不存在的数据,每次请求直接打在DB上,这种查询查询不存在数据的现象称为缓存穿透 穿透带来的 ...
- Redis实战(四):redis的消息订阅、pipeline、事务、modules、布隆过滤器、缓存LRU
啤酒理论 Buffer机制,减少没必要的来回调用 前置知识 只要和redis建立了连接,发送字符串,就能交互 管道 发布 / 订阅 help @pubsub 发送者 订阅者 PSUBSCRIBE pa ...
- 5redis-----------redis高级--GEO-查询附近的人、基数统计算法HLL 、布隆过滤器、缓存雪崩穿透击穿-------全栈式开发44
redis高级 一.GEO查询附近的人 二.基数统计算法-HyperLogLog 三.布隆过滤器 四.缓存雪崩&缓存穿透 (一)缓存雪崩 (二)缓存穿透 (三)缓存击穿 一.GEO查询附近的人 ...
- 分布式之一行代码解决缓存击穿问题
开局一张图,内容全靠编- 我只能说一言难尽--我只能说,感情影响了一名剑客拔剑的速度,就是这样! 引言 今天,重新回顾一下缓存击穿这个问题! 之所以写这个文章呢,因为目前网上流传的文章落地性太差(什么 ...
- BloomFilter 布隆过滤器
BloomFilter 定义: 空间效率高的概率型数据结构,用来检查一个元素是否在一个集合中 原理: 当一个元素被加入集合时,通过K个散列函数将这个元素映射成一个位数组中的K个点,把它们置为1.检索时 ...
- 谷粒商城 Day08 布隆过滤器与缓存切面
Day08 布隆过滤器与缓存切面 一.答疑 使用HashMap本地缓存,是使用内存还是硬盘?如果使用内存,是不是程序重启了,缓存就丢失了? 二.业务中缓存使用总结&问题&面试题 1.数 ...
- 布隆过滤器Redis缓存穿透雪崩击穿热点key
目录 布隆过滤器 Redis 缓存 穿透 雪崩 击穿 热点KEY 布隆过滤器 布隆过滤器(判断某个key一定不存在) 本质上布隆过滤器是一种数据结构,比较巧妙的概率型数据结构 特点是高效地插入和查询, ...
- 三十七 Python分布式爬虫打造搜索引擎Scrapy精讲—将bloomfilter(布隆过滤器)集成到scrapy-redis中...
Python分布式爬虫打造搜索引擎Scrapy精讲-将bloomfilter(布隆过滤器)集成到scrapy-redis中,判断URL是否重复 布隆过滤器(Bloom Filter)详解 基本概念 如 ...
最新文章
- maven在idea的配置
- 读取txt里面的数据进行计算
- 分享Kali Linux 2016.2第48周镜像文件
- python unpack函数_Python numpy.unpackbits函数方法的使用
- mysql里添加不了中文_为什么MySQL不能添加中文
- Java 成员变量和局部变量
- PPT幻灯片转换成word的软件
- asp.net中的窗体身份验证(分目录验证篇)
- 是否可以在最终课程中使用抽象方法?
- 独家:Havok 发布新的 AI 中间件
- 期刊投稿状态_这些SCI期刊的投稿显示状态是什么意思?
- 应力偏张量的物理意义_物理学中张量的由来
- SQL Server字符串左匹配
- Javascript 事件入门
- easyui下拉框,增加以及商品的上架,下架
- Java语言学习指导与习题解答_Java语言程序设计(第3版)学习指导与习题解析
- 电力设备管理杂志电力设备管理杂志社电力设备管理编辑部2022年第14期目录
- 永久免费!永洪科技发布桌面智能数据分析工具Desktop,推动数据应用平民化
- BT之家种子连接提取
- 今日新闻快讯摘要十条
热门文章
- outlook收件延迟严重_你(严重)对我不了解的五件事
- Spring的初始化和对象创建流程
- esp8266网络自动对时 串口字符连接 病显示 12864i2c u8g2库
- “独享宽带”是什么意思?
- QuickBooks 2016 for Mac(财务管理软件)
- c#五子棋实验报告_基于c#的五子棋游戏的设计与实现毕业论文.doc
- OpenWRT路由器使用ipv6拨号上网教程
- 2.1.3 毫米波雷达
- 一沙一世界(10亿光年),科学的图文介绍
- 恒讯科技分析:国内游戏服务器租用市场的大致情况怎么样呢?