背景

Chord算法是DHT(Distributed Hash Table)的一种经典实现。下面从网上无节操盗了一段介绍性文字

Chord是最简单。最精确的环形P2P模型。“Chord”这个单词在英文中是指“弦”,在分布式系统中指“带弦环”,在P2P领域则指基于带弦环拓扑结构的分布式散列表(DHT)或者构建与其上的P2P网络。尽管MIT和UC Berkeley的研究早在2001年之前就开发了Chord及其应用系统,但有关Chord的正式论文[Stoica et al., 2001]发表在计算机通信领域著名会议ACM SIGCOMM’01 上,其它刊物和会议后来也有刊登Chord的论文的,如[Stoica et al., 2003]。Chord是结构化的P2P领域最著名的理论模型,到2006年已经被引用超过3000次。能够说。凡是研究过P2P的人。没有不知道Chord的。
假设只将Chord看成一个分布式散列表,那么它只支持结构化P2P最简单的功能:将节点和数据对象映射到覆盖网中。Chord基于安全的一致性散列函数来分配节点ID和对象ID。在一个有N个节点的网路中。每一个Chord节点保存O(logN)个其它节点的信息。查询数据对象须要的覆盖网络的路由跳数也是O(logN),当节点离开或者增加网络时,为了维持网络结构。保持自适应性所须要的的消息数在O(log2N)。作为分布式的散列表。Chord具有差点儿最优的路由效率,确定性的对象查询,负载均衡。高可扩展性以及良好的容错性与自适应性;但最重要的一点是:Chord简单,优美,这是它最为经典的直接原因。

Chord算法原理介绍能够先了解下,本文側重Chord的实现,详细是构造Chord环的实现,即怎样初始化和新增节点。其它对环的操作都能够类比。并且实现会更简单。

Chord的开源实现主要有两个,一个是单机版的jchord。还有一个是集群形式的open chord项目。下面描写叙述都是參考开源项目代码展开的。

单线程版

在单个线程里,Chord环类似是一个内存数据结构。Chord环的节点上能够存储数据,也能够起服务。这取决于你利用Chord来做什么。

下面的实现主要側重于新建Chord环,并能够添加节点。在添加节点的过程中,依照Chord的算法描写叙述,怎么样影响相关节点。怎么维护Finger表内容。

首先,Chord类维护ChordNode的一个List。createNode方法依据nodeId创建一个新的ChordNode。为其生成好NodeKey,为全部的ChordNode排好序(TreeMap)。

ChordNode表示环上的节点,包括这些元素:

nodeId, ChordKey,successor, predecessor和 FingerTable。

依据nodeId在生成ChordKey,即环上的位置,然后赋予后继和前继(顺时针方向为向后)。

FingerTable维护的是m个<index, ChordNode>,m为所选hash函数的hash值位数(比方选择SHA1,m等于hash位数160,即hash环最大值为2160-1),index为key+2i。i取0, 1, … ,m-1。

对于小型p2p网络来说,m的取值还是比較大的,导致节点的finger表冗余度可能会有90%以上(可能前50个值都指向N1,后100个都指向N2,最后的10个指向N5),只是这部分冗余倒不会对查找/路由性能带来什么明显影响。

FingerTable能够形象理解为,以本节点出发。将整个环切为m份,切的方式是按2的等比增长切,即1。2,4。8。…,2159,每一个index值为finger表里的一条记录的key,选择该index值为起点顺时针近期的后继节点作为该finger项的value。如此的话,每一个环上的节点都维护了一张全局的二分节点路由表。

然后。在建立新的Chord哈希环的时候,

1. 生成Chord,并创建若干个节点。

每一个节点在创建的时候,都相当于以自身为第一个节点创建了环。

2. 把创建好的节点逐个增加到某个节点的环上,增加过程仅仅会影响某几个节点

2.1 在指定的节点N0上join新节点Nk。join过程是借助已有节点N0的finger表为新的节点Nk找到后继Nsuc =N0.findSuccessor(Nk.key),此时Nk的前继为null

2.2  确认新节点Nk与后继节点Nsuc的相互关系。须要注意的是。这个确认过程指的是待确认节点的后继是不是如今的后继,以及,后继节点的前继

会不会因待确认节点的增加而更新。

由于可能后继节点Nsuc和新节点Nk之间还有节点Nbet。则须要更新Nk的后继节点为Nbet,且后继节点Nsuc和原前继之间增加了Nk之后,

原前继的后继要改变。

2.3  确认刚刚的后继节点Nsuc的原前继节点Npre =Nsuc.getPre()的后继节点。

因后继节点Nsuc的原前继节点Npre可能会由于新节点Nk的增加

而改变其后继节点。

2.2和2.3都是确认过程。仅仅是基于的点不一样,能够体会一下,思路是一样的。

3. 刷新每一个节点的finger表。该过程能够理解为,在各个节点都更新了各自的前继和后继节点之后。每一个节点再把自己的finger表过一遍,更新某些后继节点。

总结来说,如上图,Nk的增加仅仅会影响其后继节点Nx的前继节点选择,及Nx的前继节点Ny的后继节点选择,即这三个节点之间的互相指认可能会变化。

但前提是Nx和Ny必须是最接近Nk的直接前继和直接后继。如右側图中在Ny前面,会不会有Nz更接近Nk,而应该是Nk的后继呢?答案是否定的。从原理角度看,Chord算法保证了这件事(Finger表和直接前/后继的定义有一定的特殊性)。还有一方面,事实上上面的图中的N0节点可能并非处在那个位置。为了帮助理解,以下具体说明当N0在join这步为Nk第一次找后继的过程。

在第一次选择Nx的时候。是通过N0的findSuccessor(key)找的(即2.1步骤做的事)。

给定一个key位置。查找successor:

1.    推断key位置是否在本节点和本节点后继节点之间,假设是,那么就把本节点的后继节点返回。否则进入2。

2.    为该key找本节点近期的前继节点(不一定是本节点的直接后继节点),利用本节点前继节点的findSuccessor方法来找该key的后继节点,即进入递归,回到1。

要注意的是找近期的前继节点这一步。依赖的是本节点的finger表。按finger表倒序找。找到那个节点满足finger节点在目标key位置和本节点之间。就ok。

从直观上理解,finger表里的倒序第一个点距离本节点的距离最多是半个环。即2m-1。倒序第二个的距离是2m-1+2m-2。也就是说,这样的倒序找是非常大范围的找,以这样的方式找到节点再调用findSuccessor方法找key的后继,能够脑补一下这样的扫环的方式。(为帮助理解。画了一个饼)

所以N0第一次帮Nk找的后继Nx,以及Nx本身的前驱Ny,它们这四个点之间的位置关系,事实上出现情况非常复杂。不一定像我上面画的那样分布,我画的图甚至可能是错的,比例也全然不是那样的。

怎样证明Nz的不存在性,相信在了解Chord数学原理后应该能够比較好地理解。

上述描写叙述了Chord环的生成过程和新增节点具体实现。

集群版

集群版指节点之间可能是存在于local的一个JVM内的Chord网络,也能够是存在于多个JVM之间的remote的Chord网络。

假设是Remote情况下的话,对照上述实现,节点的join步骤会添加节点之间通信环节。总体实现思路是一致的,仅仅是集群形式要处理的内容会更丰富些。

针对通信这点,Open chord提供chord node之间的几种通信协议:Local的话是在单个JVM内。Remote的话包含rmi和socket。

Open chord还提供了在每一个节点上同意存储序列化后的java对象。实际上是在Chord算法基础上对节点的一种利用。在此不展开。

ChordImpl

ChordImpl包括元素:

NodeImpl(localNode),Entries,线程池,HashFunction,References,URL,ID

NodeImpl代表着Chord环上的节点,具备一些能够被远程节点调用的操作。

Entries是数据K,V对;

References里包含了一个前继。一串后继和数据Entries;

URL和ID是localNode的url和id;

findSuccessor(key)过程:

首先检查本节点有没有后继,假设没有,说明是唯一的环上的点,返回本节点就能够了。

然后检查key是不是在本节点和后继之间,假设是的话,返回后继节点。在这一步里,本来在返回后继之前。会进行一次ping来检查后继是否正常存活,只是这段被凝视掉了。弥补的做法是返回后继过程中假设出异常,就觉得后继节点联系不上,那么把它从reference表里删除,隐式效果就是后继list里会有新的后继节点占领list首位。所以继续递归findSuccessor(key)操作。

假设以上情况都不是,那么就找一个最接近该key的前继节点。调用那个节点的findSuccessor(key)递归查找,和单线程版里的实现是一致的。这个查找最接近该key的前继节点的过程详细是Refereces类的getClosestPrecedingNode(key)方法。不会检測存活性,是个同步方法。这种方法逻辑比較复杂。

节点操作

create

多个create方法,终于使用createHelp(),作用是创建一个新的ring,前提是localURL和localID都已经设置好了。

create的过程是,把entries(存数据),references(引用node)。localNode(为了通信)都初始化出来。然后调用createTasks操作,createTasks操作利用线程池。定时运行三种任务,各自是周期性稳固与后继的关系(StabilizeTask)、周期性更新finger表(FixFingerTask)、周期性检測前继节点健康情况(CheckPredecessorTask)。最后,调用localNode的acceptEntries方法接收其它node传来的处理entries的通信操作。

周期性稳固与后继的关系(StabilizeTask):

检測后继节点的前继节点有没有由于本节点发送变化。在单线程实现版本号里,这个非常好了解,可是open chord里的实现没怎么看明确。

周期性更新finger表(FixFingerTask):

採用生成随机数的方式,随机检測一个值相应的successor,假设这个节点不在references内部维护的内容(finger表或前继或后继列表)里。则添加该节点的引用

周期性检測前继节点健康情况(CheckPredecessorTask):

从References里得到前继,不为空的话则进行一次ping操作。Ping事实上什么也没做,但能返回不出异常的话。说明节点正常存活着。

join

多个join方法,终于调用joinHelp(bootstrapURL)方法,用于把本ChordNode增加到指定的URL的Chord ring里。

前提是localURL和localID都已经设置好了。

join的过程是,把entries(存数据),references(引用node),localNode(为了通信)都初始化出来。然后通过Proxy.createConnection(localUrl,bootstrapUrl)来连接本节点和目标URL,Proxy类用于代表本节点外的其它nodes,有LocalThread,RMI,Socket三种实现,相应的是不同的通信协议。

连接完后返回一个远程node,然后调用远程node的findSuccessor方法找到本节点的后继。

然后调用远程node的notifyAndCopyEntries把它的前继、后继列表和entries引用都取过来,利用这个ref集合,首先建立本节点的前驱,即假设ref大小是1,那么说明ring里就两个node,那么后继也是本节点的前继;假设ref大于1,那么取出第一个节点。即后继的原前继,比較本节点是否在他俩之间,假设是的话。本节点的前继就是后继的原前继,否则后继节点是错误的,把ref里的第一个节点作为后继,调用notifyAndCopyEntries。循环上述步骤找出本节点的正确前继。这个过程中。会不断往references里加入节点,也解释了为什么reference里存的是一个后继list。

确定完前继和后继后,把entries的引用加入为本节点的entries,最后运行本节点的acceptEntries和createTasks方法(同create的最后两步)。

leave

leave操作,关闭本节点线程池,并通知前继和后继,本节点要离开网络。然后让localNode断开连接,赋null。

数据存取操作

insert

Insert(key,data),依照key的hash值在环上找到相应node,让node把这个序列化后的data和key以Entry的形式存起来。调用的是node的insertEntry方法。找node过程调用的是本节点的findSuccessor(key)方法。

retrieve

Retrieve(key),依照key的hash值在环上找到相应node,调用node的retrieveEntries方法得到一个entry的Set返回。找node过程调用的是本节点的findSuccessor(key)方法。

remove

Remove(key,data)。依照key的hash值在环上找到相应node,调用的是node的removeEntry方法。找node过程调用的是本节点的findSuccessor(key)方法。

以上三种操作还配有异步方法。详细不展开。

命令行操作

把Chord放到集群环境里之后,除了对节点进行join来增加已有网络外。更多操作都会涉及类似的若干次通信,包含移除节点,展示节点Finger表等操作。

这些操作的实现,通过上述描写叙述的新增节点。实现上应该非常好理解。以下列举了open chord的命令行提供的对local或remote chord网络进行的操作列表:

  • CreateNode,创建多个节点
  • Insert,插入数据到local网络里
  • InsertNetwork,插入数据到remote网络里
  • CrashNodes,消灭local网络里的若干个节点
  • JoinNetwork,增加节点到remote网络里
  • LeaveNetwork。离开remote网络
  • Remove。从local网络里删除数据
  • RemoveNetwork,从remote网络里删除数据
  • Retrieve,从local网络里获取数据
  • RetrieveNetwork,从remote网络里获取数据
  • ShowEntries。展示local网络里每一个node的entry
  • ShowEntriesNetwork,展示remote网络里每一个node的entry
  • ShowFingerTable,展示local网络里指定node的finger table
  • ShowFingerTableNetwork,展示remote网络里指定node的finger table
  • ShowNodes。展示local网络里全部nodes
  • ShowSuccessorList,展示local网络里指定node的后继列表
  • ShutdownNodes。关闭一系列nodes
  • Wait,堵塞console一段时间

local/单JVM下创建环样例:

oc > create -names n1
Creating new chord network.
oc > show
Node list in the order as nodes are located on chord ring:
Node n1 with id 65 52 9C 8C
oc > help
For help with any command, type name of command plus '-h' or '-help'.
Parameters of commands are always passed to them in the format '-parametername parametervalue'.
Some parameters require no value, so only the parameter name has to be provided to the command.
Commands available from this console:
-----
insert, retrieveN, insertN, refs, cprotocol,
executeMacro, removeN, refsN, entriesN, create,
entries, retrieve, successors, wait, shutdown,
crash, exit, help, joinN, displaySystemOut,
show, remove, leaveN
-----
Note: Commands and parameters are case sensitive.
oc > create -names n2_n3 -bootstraps n1
Starting node with name 'n2' with bootstrap node 'n1'
Starting node with name 'n3' with bootstrap node 'n1'
oc > show
Node list in the order as nodes are located on chord ring:
Node n1 with id 65 52 9C 8C
Node n2 with id 9B 1A 3A B3
Node n3 with id 9C 47 20 AB
oc > refs -node n1
Retrieving node n1
Node: 65 52 9C 8C , oclocal://n1/
Finger table:9B 1A 3A B3 , oclocal://n2/ (0-157)
Successor List:9B 1A 3A B3 , oclocal://n2/9C 47 20 AB , oclocal://n3/
Predecessor: 9C 47 20 AB , oclocal://n3/
oc > create  -names  n22_b1_o1p3_o2_ooi1_onf8_jiow_09ni_90j0_jfn_n23_j902n_j9_noi32_n9_j92 -bootstraps n2_n3
Starting node with name 'n22' with bootstrap node 'n2'
Starting node with name 'b1' with bootstrap node 'n3'
Starting node with name 'o1p3' with bootstrap node 'n3'
Starting node with name 'o2' with bootstrap node 'n3'
Starting node with name 'ooi1' with bootstrap node 'n3'
Starting node with name 'onf8' with bootstrap node 'n3'
Starting node with name 'jiow' with bootstrap node 'n3'
Starting node with name '09ni' with bootstrap node 'n3'
Starting node with name '90j0' with bootstrap node 'n3'
Starting node with name 'jfn' with bootstrap node 'n3'
Starting node with name 'n23' with bootstrap node 'n3'
Starting node with name 'j902n' with bootstrap node 'n3'
Starting node with name 'j9' with bootstrap node 'n3'
Starting node with name 'noi32' with bootstrap node 'n3'
Starting node with name 'n9' with bootstrap node 'n3'
Starting node with name 'j92' with bootstrap node 'n3'
oc > refs -node n1
Retrieving node n1
Node: 65 52 9C 8C , oclocal://n1/
Finger table:9B 1A 3A B3 , oclocal://n2/ (0-157)BB 5B 1A 3D , oclocal://j902n/ (158)E7 9D 67 6A , oclocal://n23/ (159)
Successor List:9B 1A 3A B3 , oclocal://n2/9C 47 20 AB , oclocal://n3/
Predecessor: 5D FC 4C 35 , oclocal://o1p3/
oc > refs -node n23
Retrieving node n23
Node: E7 9D 67 6A , oclocal://n23/
Finger table:F8 FE D0 C3 , oclocal://n22/ (0-156)0E AF 2E B7 , oclocal://09ni/ (157)2C F2 8A 7F , oclocal://ooi1/ (158)9B 1A 3A B3 , oclocal://n2/ (159)
Successor List:F8 FE D0 C3 , oclocal://n22/F9 19 F3 7F , oclocal://b1/
Predecessor: CE 4B 77 E3 , oclocal://jfn/
oc > joinN
Creating new chord overlay network!
URL of created chord node ocsocket://10.65.17.185/.

总结

以下简单总结我对Chord的理解。

Chord这样的DHT的实现。本质上是在一致性哈希的基础上,添加了Finger表这样的高速路由信息,通过在节点上保存整个网络的部分信息,让节点的查找/路由以O(logN)的代价实现,适合大型p2p网络。

所以,我理解的Chord基本就等于一致性哈希+Finger表。

Chord算法实现具体相关推荐

  1. 【学术之门之P2P算法研读】P2P中的Chord算法

    P2P的一个常见问题是如何高效的定位节点,也就是说,一个节点怎样高效的知道在网络中的哪个节点包含它所寻找的数据,如下图: 对此,有三种比较典型的来解决这个问题. Napster:使用一个中心服务器接收 ...

  2. “分布式哈希”和“一致性哈希”的概念与算法实现

    分布式哈希和一致性哈希是分布式存储和p2p网络中说的比较多的两个概念了.介绍的论文很多,这里做一个入门性质的介绍. 分布式哈希(DHT) 两个key point:每个节点只维护一部分路由:每个节点只存 ...

  3. 一致性hash算法简介

    一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法,设计目标是为了解决因特网中的热点(Hot spot)问题,初衷和CARP十分类似.一致性哈希修正了CARP使用的简单哈希 ...

  4. hash算法_hash一致性算法

    一致性hash算法是,1097麻省理工提出的分布式hashDHT实现算法,极倔internet的热点问题 平衡性 hash结果尽可能的分布到所有的缓存中去,缓冲空间利用率最高 单调性 保持已有的缓存能 ...

  5. Hash一致性算法(分片机制)

    一 哈希简介 1.1 简介 我们首先来简单介绍一下什么是哈希(以下简称hash),hash本质来说就是映射,或者说是键值对key-value,不同的hash之间不过就是实现key-value映射的算法 ...

  6. 负载均衡一致性哈希算法实现 | nginx 负载均衡一致性哈希源码分析 | ngx_http_upstream_consistent_hash_module 源码分析

    这是本学期分布式计算/系统课程负载均衡节的课后作业,理解七层反向代理的负载均衡 Nginx 中使用的的一致性哈希算法.开头只是讲一些没用的东西,后面主要是分析 Nginx 的 O(1) 时间复杂度的一 ...

  7. 一致性哈希算法的原理与实现

    分布式系统中对象与节点的映射关系,传统方案是使用对象的哈希值,对节点个数取模,再映射到相应编号的节点,这种方案在节点个数变动时,绝大多数对象的映射关系会失效而需要迁移:而一致性哈希算法中,当节点个数变 ...

  8. JAVA实现一致性Hash算法

    介绍 一致性Hash算法是实现负载均衡的一种策略,后续会写如何实现负载均衡 一致哈希是一种特殊的哈希算法. 在使用一致哈希算法后,哈希表槽位数(大小)的改变平均只需要对 K/n个关键字重新映射,其中K ...

  9. linux注入内存泄露,Linux 内存泄露小结

    本文仅限记录自己的一次 内存泄露追踪小记. 可能并不十分适用与大家的情况.而且方法也并不是很smart.仅做记录,能提供个思路更好. 一. 要问调试程序遇到什么问题最头疼, 内存泄露肯定能排在前几名里 ...

最新文章

  1. 重庆python培训-重庆Python培训班学完能做什么
  2. 【Floyed】工厂的烦恼(ssl 1762)
  3. [MySQL FAQ]系列 -- 数据不算大,备份却非常慢
  4. python2.7入门---内置函数
  5. VUe3 @cli(axios)跨域访问
  6. C#初学的一些注意点
  7. Promise 必知必会(十道题)
  8. FragmentPagerAdapter加载fragment并使用setUserVisibleHint()处理预加载时遇到的坑,给textview赋值时出现的空指针异常...
  9. 如何用matlab画圆的图像,matlab在图像上画圆
  10. 姓潘取名:潘姓有气质的女孩名字
  11. matlab 传函将s换为jw,2010MATLAB及控制系统仿真_总复习.ppt
  12. 手机安装pem_手机安装Charles证书
  13. laravel where in 查询缓慢优化
  14. 易班APP登录密码加密、sig逆向分析
  15. oracle中索引的使用
  16. 创新教育实例之“三国人物关系模型”
  17. Arduino串口控制DY-SV5W音频播放
  18. Android客户端——寒假实习面经-实习初体验
  19. Hyper Thread
  20. 云服务器+ngrok搭建内网穿透服务(只有公网ip无域名)

热门文章

  1. UA PHYS515 电磁理论II 静电场问题4 用Green函数法求解Dirichlet问题
  2. windows下mysql安装配置启动
  3. 分布式常见问题解决方案
  4. 有这10个特征的项目领导者做的项目,失败率增加60%
  5. 让mysql支持emoji表情
  6. Java JDBC数据库 之 DBUtil 封装类
  7. poj 2482 Stars in Your Window (线段树扫描线)
  8. React 入门之路
  9. 自己写一个图片按钮(XAML)
  10. USACO1.4.2(The clocks)BFS