layout: post
title: “一致性 hash 算法 — CARP”
date: 2020-05-11 3:44:09 +0800
categories: hash 一致性哈希 CARP 算法 分布式


  • 哈希算法的应用
  • DHT
    • 一致性 hash
    • CARP
      • 应用

哈希算法的应用

在分布式系统中,数据的分布,或者请求的路由是一个核心的问题,实现数据的分布我们经常使用到 hash 算法。这个非常容易理解,根据一个 key 计算一个 hash ,然后根据这个 hash 值得出你的索引。

比如,如下就是最简单的一个 hash 算法——除余:

h = num % 4

假设

  • key 从 1,2,3,4,5,6,7,8 开始输入
  • h = hash( key ) 假设 h 为1的时候,落到 A,为2落到 B,3落到 C,0 落到 D

那么散列的效果就如上图。非常容易看出来,这个散列均衡很好,但这个仅仅对于单机系统,无变化的系统。

现在假设增加一个节点 E:

  • key 的输入不变(1,2,3,4,5,6,7,8,9)
  • hash 算法得变下,h = num % 5 ,因为5个节点了嘛,那么现在就是 hash 值为 1 落到A,2落到B,3落到C,4落到D,0落到E

那么重新散列的分布如下图:

我们看到 hash 分布来了一个乾坤大挪移,失效的点非常多,假设如果我们这里实现的是一个缓存系统,那么就有一半的缓存都失效了。

分布式系统中,由于分布式的特点和网络的不可靠因素,增删节点是再正常不过的需求,所以我们再分布式系统中,一般使用分布式 hash 算法,简称 DHT 。DHT 不是特指一种算法,而是一类算法,是使用与分布式特性的 hash 算法,常常用来实现 DHT 的是一致性 hash 算法,本文要提的 CARP 算法就是其中一种。

DHT

大家可能认为 DHT 算法非常复杂,实现非常抽象,其实不然,我们常见的有两种解决方案:

  1. 环状的一致性 hash 算法
  2. 其他,比如 CARP 算法协议

一致性 hash

  1. 使用 hash 环,然后实际节点分配到这个环上,这样我们输入只需要 hash 到环上的节点即可,当有节点增删的时候,只需要前后移动即可;
  2. 第二种同样是 hash 环,只不过改进了点,使用虚拟的 hash 环,实际节点负责管理一定数量环上的节点,这样能做到更为灵活;

其实一致性 hash 有很多种实现形式,CARP 就是一种。

CARP

算法全称:Cache Array Route Protol,是一种缓存数组路由协议,常常用在缓存系统的客户端。本质要达到的目标:分布式系统在增删节点的时候,失效节点概率平均 1/N(N为节点数)。

怎么实现?

步骤一:根据 key 计算出每个节点的 hash 值

hash_v0 = hashof (node0, key)
hash_v1 = hashof (node1, key)
...
hash_vN = hashof (nodeN, key)

什么意思?就是以 key,nodeN 这两个参数作为输入,计算出所有节点的值。比如有 4 个节点:

hash_v0 = hashof (node0, key)
hash_v1 = hashof (node1, key)
hash_v2 = hashof (node2, key)
hash_v3 = hashof (node3, key)

得到一个列表 [ hash_v0, hash_v1, hash_v2, hash_v3 ],这就是第一步。

步骤二:按照固定规则,从列表中选一个 hash 值

怎么理解?这里有一个重要的点:固定规则。这个固定规则通常有两种规则:

  1. 选最大的
  2. 选最小的
hash_vX = min(hash_v0, hash_v1, ... ,  hash_vN)
或
hash_vX = max(hash_v0, hash_v1, ... ,  hash_vN)

这两种规则都可以,这样就完成啦,CARP 一致性算法就这么多了。

那么 CARP 算法怎么做到增删节点的时候,缓存失效概率 1/N 的呢?

现在添加一个节点,增加一个节点,我们第一步骤得出来的 hash 列表原有值不会变,只有多一个元属:hash_vN+1(思考下,为啥,因为原有节点的输入没有变哈), 对比来看如下:

hash_vX1 = min(hash_v0, hash_v1, ... ,  hash_vN)
hash_vX2 = min(hash_v0, hash_v1, ... ,  hash_vN, hash_vN+1)

划重点:那么我们要节点失效的话,其实就是要满足 hash_vX1 < hash_vX2 这个条件,而这在大数据的场景下是个概率条件,hash 函数足够散列的话 hash_vX2 < hash_vX1 的概率是 1/N 。

应用

我们常用 CARP 来做什么?最常见的,我们用在缓存系统中,比如你有一个分布式缓存系统,比如是 redis 集群之类的,客户端要根据 key 选择存放到哪个节点?这里就需要有个算法来保证均衡性,稳定性了。CARP 就是一个比较常见的选择。


坚持思考,方向比努力更重要。微信公众号关注我:奇伢云存储

一致性 hash 算法 — CARP 2020/5/11 19:38相关推荐

  1. 一致性hash算法虚拟节点_Hash算法和一致性Hash算法

    Hash算法 Hash 算法在路由算法应用中,为了保证数据均匀的分布,例如有 3 个桶,分别是 0 号桶, 1 号桶和 2 号桶:现在有 12 个球,怎么样才能让 12 个球平均分布到 3 个桶中呢? ...

  2. 对一致性Hash算法,Java代码实现的深入研究

    一致性Hash算法 关于一致性Hash算法,在我之前的博文中已经有多次提到了,MemCache超详细解读一文中"一致性Hash算法"部分,对于为什么要使用一致性Hash算法.一致性 ...

  3. MemCache和一致性Hash算法讲解

    文章目录 1 MemCache讲解 1.1 MemCache是什么 1.2 MemCache访问模型 1.3 MemCache写缓存流程 1.4 一致性Hash算法 1.4.1 余数Hash 1.4. ...

  4. 一致性Hash算法(JAVA版)(摘抄至五月的仓颉的博客)

    一致性Hash算法 关于一致性Hash算法,在我之前的博文中已经有多次提到了,MemCache超详细解读一文中"一致性Hash算法"部分,对于为什么要使用一致性Hash算法.一致性 ...

  5. 一致性hash算法简介

    一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法,设计目标是为了解决因特网中的热点(Hot spot)问题,初衷和CARP十分类似.一致性哈希修正了CARP使用的简单哈希 ...

  6. 一致性 Hash 算法学习(分布式或均衡算法)

    简介: 一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法,设计目标是为了解决因特网中的热点(Hot spot)问题,初衷和CARP十分类似.一致性哈希修正了CARP使用的 ...

  7. 10分钟了解一致性hash算法

    应用场景 当我们的数据表超过500万条或更多时,我们就会考虑到采用分库分表:当我们的系统使用了一台缓存服务器还是不能满足的时候,我们会使用多台缓存服务器,那我们如何去访问背后的库表或缓存服务器呢,我们 ...

  8. 5分钟带你理解一致性Hash算法

    转载自 5分钟带你理解一致性Hash算法 一致性Hash算法背景 一致性哈希算法在1997年由麻省理工学院的Karger等人在解决分布式Cache中提出的,设计目标是为了解决因特网中的热点(Hot s ...

  9. 关于一致性hash算法的几个问题

    本文来说下关于一致性hash算法的几个问题 文章目录 分布式系统的基本概念 分布式系统与高并发高可用 集群和分布式的区别与联系 分布式系统的分发 常用负载均衡策略 Hash取模策略 Hash取模的弊端 ...

最新文章

  1. Matlab编程与数据类型 -- 函数M文件的组成
  2. C语言--指针函数和函数指针
  3. js改变style样式和css样式
  4. Gstreamer基础知识介绍
  5. 【干货】周鸿祎谈雷军:能不能All In是一个核武器
  6. Linux下面护眼软件汇总
  7. 在JPA 2.1中使用@Convert正确完成映射枚举
  8. Windows Subsystem for Linux(WSL)安装emqx
  9. php curl 关闭tcp连接,BASH CURL:顺序运行时,请勿关闭请求之间的连接
  10. 拳王虚拟项目公社:免费虚拟副业项目,创业副业首选虚拟资源平台转化虚拟资源池
  11. ExtAspNet应用技巧(七) - ViewState优化
  12. JavaScript中的数据结构及实战系列(1):队列
  13. python中formatter的用法_python中 logging的使用详解
  14. mPaas集成项目、新建mPaaS项目
  15. 服务器wifi无线放大器,无线wifi中继放大器的使用方法
  16. Python 中 appium 环境搭建
  17. 运营商线路细分_国内三大运营商宽带线路及分级介绍
  18. 如何学好高中数学 提高高中数学成绩秒杀技巧(这几点很重要)
  19. 再见了,我的黄色文件夹(内置福利)
  20. 推荐系统初识-协同过滤

热门文章

  1. 纯js封装一个多功能弹出框
  2. Node.js内置模块 events的基本使用
  3. 全网最佳,第三方登录系列——苹果登录
  4. Unity 个人玩法Demo合集
  5. Indexes and Indexing
  6. does not specify a Swift version and none of the targets (`packager`) integrating it have the `SWIFT
  7. 未检测到扫描仪Win10解决 WIA服务1061
  8. 我眼中的Java大牛之孤尽老师
  9. Nexys2七段LED显示操作
  10. 三分钟带你领路Java-JFrame窗体美化