在程序中,我们经常需要知道事件序列,在单体应用中,事件序列是较为简单的,最简单的办法就是用时间戳,但在分布式系统中,事件序列是很困难的,Leslie Lamport大神在论文Time, Clocks, and the Ordering of Events in a Distributed System讨论了在分布式系统中时间、时钟和事件序列的问题。

【1】分布式系统中物理时钟存在的问题

逻辑时钟是相对物理时钟这个概念的,为什么要提出逻辑时钟,因为物理时钟在分布式系统中存在一系列问题。在一台机器上的多个进程可以从一个物理时钟中获取时间戳,不管这个物理时钟是否准确,只要是从一个物理时钟获取时间戳,我们都能获得多个事件的相对时间顺序。但是在分布式系统中,我们无法从一个物理时钟获取时间戳,只能从各自机器上物理时钟获取时间戳,而各台机器的物理时钟是很难完全同步的,即使有NTP,精度也是有限的。所以在分布式系统中,是不能通过物理时钟决定事件序列的。

物理时钟在分布式系统中也不是毫无用处,至少它一定程度上可以判断在一台机器上的事件顺序,同时分布式系统中还是有必要让不同机器上的物理时钟在一定精度内同步时间的,只是不作为决定事件序列的方法。

【2】偏序(Partial Ordering)

事件序列有两种:偏序事件序列和全序事件序列。所谓的偏序指的是只能为系统中的部分事件定义先后顺序。这里的部分其实是有因果关系的事件。在论文Time, Clocks, and the Ordering of Events in a Distributed System中,偏序是由“happened before”引出的,我们先看一下"happened before"(表示为“->”)的定义:

Definition. The relation "->"on the set of events of a system is the smallest relation satisfying the following three conditions:

(1) If a and b are events in the same process, and a comes before b, then a->b.

(2) If a is the sending of a message by one process and b is the receipt of the same message by another process, then a->b.

(3) If a->b and b->c then a->c.

在分布式系统中,只有两个发生关联的事件(有因果关系),我们才会去关心两者的先来后到关系。对于并发事件,他们两个谁先发生,谁后发生,其实我们并不关心。偏序就是用来定义两个因果事件的发生次序,即‘happens before’。而对于并发事件(没有因果关系),并不能决定其先后,所以说这种‘happens before’的关系,是一种偏序关系。

If two entities do not exchange any messages, then they probably do not need to share a common clock; events occurring on those entities are termed as concurrent events.”

【3】逻辑时钟

论文原文中有这样一句:We begin with an abstract point of view in which a clock is just a way of assigning a number to an event, where the number is thought of as the time at which the event occurred. 这句话的意思是,可以把时间进行抽象,把时间值看成是事件发生顺序的一个序列号,这个值可以<20190515,20190516,20190517>,也可以是<1,2,3>。后面就有了逻辑时钟的概念。定义如下:
we define a clock Ci for each process Pi to be a function which assigns a number Ci(a) to any event a in that process.

Clock Condition. For any events a,b: if a->b then C(a) < C(b).
C1. If a and b are events in process Pi, and a comes before b, then Ci(a) < Ci(b).
C2. If a is the sending of a message by process Pi and b is the receipt of that message by process Pi, then Ci(a) < Ci(b).

具体的,根据上面的定义条件,我们做如下实现规则:

  • 每个事件对应一个Lamport时间戳,初始值为0
  • 如果事件在节点内发生,本地进程中的时间戳加1
  • 如果事件属于发送事件,本地进程中的时间戳加1并在消息中带上该时间戳
  • 如果事件属于接收事件,本地进程中的时间戳 = Max(本地时间戳,消息中的时间戳) + 1

根据上面的定义,我们知道a->bC(a)<C(b),但如果C(a)=C(b),那么a,b是什么顺序呢?它们肯定不是因果关系,所以它们之间的先后其实并不会影响结果,我们这里只需要给出一种确定的方式来定义它们之间的先后就能得到全序关系。

一种可行的方式是利用给进程编号,利用进程编号的大小来排序。假设a、b分别在节点P、Q上发生,Pi、Qj分别表示我们给P、Q的编号,如果 C(a)=C(b) 并且 Pi<Qj,同样定义为a发生在b之前,记作 a⇒b(全序关系)。假如我们上图的A、B、C分别编号Ai=1、Bj=2、Ck=3,因 C(B4)=C(C3) 并且 Bj<Ck,则 B4⇒C3

通过以上定义,我们可以对所有事件排序,获得事件的全序关系(total order)。上图例子,我们可以进行排序:C1⇒B1⇒B2⇒A1⇒B3⇒A2⇒C2⇒B4⇒C3⇒A3⇒B5⇒C4⇒C5⇒A4。观察上面的全序关系你可以发现,从时间轴来看B5是早于A3发生的,但是在全序关系里面我们根据上面的定义给出的却是A3早于B5,这是因为Lamport逻辑时钟只保证因果关系(偏序)的正确性,不保证绝对时序的正确性。

【4】尝试用逻辑时钟解决分布式锁的问题

单机多进程程序可由锁进行同步,那是因为这些进程都运行在操作系统上,有center为它们的请求排序,这个center知道所有需要进行同步的进程的所有信息。但是在分布式系统中,各个进程运行在各自的主机上,没有一个center的概念,那分布式系统中多进程该怎么进行同步呢?或者说分布式锁该怎么实现呢?论文中提出了解决这一问题的算法要满足下面三个条件:

(I) A process which has been granted the resource must release it before it can be granted to another process.

(II) Different requests for the resource must be granted in the order in which they are made.

(III) If every process which is granted the resource eventually releases it, then every request is eventually granted.
为了简化问题,我们做如下假设:

  • 任何两个进程PiPj它们之间接收到的消息的顺序与发送消息的顺序一致,并且每个消息一定能够被接收到。
  • 每个进程都维护一个不被其他进程所知的请求队列。并且请求队列初始化为包含一个T0:P0请求,P0用于该共享资源,T0是初始值小于任何时钟值

算法如下:

  1. To request the resource, process Pi sends the message Tm:Pi requests resource to every other process, and puts that message on its request queue, where Tm is the timestamp of the message.(请求资源,发送请求给其他进程,在自己的请求队列中添加该请求)
  2. When process Pj receives the message Tm:Pi requests resource, it places it on its request queue and sends a (timestamped) acknowledgment message to Pi.(收到其他进程的请求,放到请求队列中,回应发起请求的进程)
  3. To release the resource, process Pi removes any Tm:Pi requests resource message from its request queue and sends a (timestamped) Pi releases resource message to every other process.(释放资源,从请求队列中移除该资源请求,发送给其他进程,告诉它们我释放了该资源)
  4. When process Pj receives a Pi releases resource message, it removes any Tm:Pi requests resource message from its request queue.(收到其他进程释放资源的消息,从请求队列中移除该资源请求)
  5. Process Pi granted the resource when the following two conditions are satisfied: (i) There is a Tm:Pi requests resource message in its request queue which is ordered before any other request in its queue by the relation . (ii) Pi has received a message from every other process timestamped later than Tm.
    (判断自己是否可以获得该资源,有两个条件:其一,按全序排序后,Tm:Pi请求在请求队列的最前面;其二,自己Pi已经收到了所有其他进程的时戳大于Tm的消息)

下面我们举个例子说明上面的算法过程:
初始状态为P0拥有资源,请求队列中为0:0(T0:P0的简写),而后P1请求资源,将1:1添加到请求队列中,此时P0让占有资源,P1还无法获取资源,等到P0释放资源后,0:0从请求队列中移除(下图中没有画出),此时请求队列中1:1的请求在最前面,同时P1收到了其他两个进程的大于1的回应消息,满足了占有资源的条件,此时P1占有资源。

其实关键思想很简单,既然分布式系统中没有“center”的概念,那我请求共享资源时我就让其他所有进程都知道我要请求该资源,拥有资源的进程释放资源时也告诉所有进程,我要释放该资源,想请求该资源的你们可以按序(逻辑时钟的作用,这里再次说明一下,并不能保证在绝对物理时间上请求的排序)请求了。这样每个进程都知道其他进程的状态,就相当于有个“center”。

对于分布式锁问题,多个请求不一定是一定按照绝对物理时钟排序才可以,只要我们有这样一个算法,这个算法可以保证多个进程的请求按照这个算法总能得到同一个排序,就可以了,按照绝对物理时钟排序只是其中一个可行的算法。

到这里是否就万事大吉了呢,其实并没有,这个实现是很脆弱的,它要求所有进程都非常可靠,一旦一个进程挂了或出现网络分区的情况,是无法工作的,同时我们提出的网络要求也非常严格,要求发出的消息一定被接收到,这个在实用的系统中是很难做到的。所以这是一个理想状况下的算法实现,并不是一个可以工业级应用的算法实现。但它仍然是非常有意义的,给了我们关于分布式系统中解决一致性、共识算法等思想启迪。

参考文档:
大神论文:Time, Clocks, and the Ordering of Events in a Distributed System
Lamport timestamps
分布式系统:Lamport 逻辑时钟

关注微信公众号,每天进步一点点!

转载于:https://www.cnblogs.com/s-lisheng/p/11307212.html

分布式系统:时间、时钟和事件序列相关推荐

  1. c++ 获取时间戳_分布式系统理论基础三-时间、时钟和事件顺序

    现实生活中时间是很重要的概念,时间可以记录事情发生的时刻.比较事情发生的先后顺序.分布式系统的一些场景也需要记录和比较不同节点间事件发生的顺序,但不同于日常生活使用物理时钟记录时间,分布式系统使用逻辑 ...

  2. 1.1.0-简介-P5-时间、时钟和事件顺序

    文章目录 1.世界 物理时钟 vs 逻辑时钟 Lamport timestamps Vector clock Version vector 参考资料: 1.世界 现实生活中时间是很重要的概念,时间可以 ...

  3. matlab 延迟算子,时间序列分析-----2---时间序列预处理

    既然有了序列,那怎么拿来分析呢? 时间序列分析方法分为描述性时序分析和统计时序分析. 1.描述性时序分析 通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析. 描 ...

  4. 时间序列分析-----2---时间序列预处理

    既然有了序列,那怎么拿来分析呢? 时间序列分析方法分为描述性时序分析和统计时序分析. 1.描述性时序分析 通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析. 描 ...

  5. 时钟翻转事件_开发人员和时钟翻转

    时钟翻转事件 Let's party like it's 1999! 让我们狂欢吧,就像1999年一样! You have probably written programs with a bug r ...

  6. 学习笔记 | TNNLS 2022 THPs:学习事件序列因果结构的拓扑霍克斯过程

    文章目录 一.序言 二.Introduction 三.Related Work 四.拓扑霍克斯过程 五.总结 CSDN 叶庭云:https://yetingyun.blog.csdn.net/ 一.序 ...

  7. 3款动态网页时间时钟HTML5源码

    介绍: 3款动态网页时间时钟HTML5源码 网盘下载地址: http://kekewangLuo.cc/H5VLrhVBiis0 图片:

  8. 网络计划法中的最早时间和最迟时间以及关键事件。

    网络计划法定义:网络计划法是用网状图表安排与控制各项活动的方法,可通过对网状图的分析,方便地确定完成整个工程至少需要多少时间,以及哪些子工程是影响工程进度的关键.一般适应于工作步骤密切相关.错综复杂的 ...

  9. php显示时间秒针走,Android_TextView显示系统时间(时钟功能带秒针变化,我们开启一个线程,线程每隔 - phpStudy...

    TextView显示系统时间(时钟功能带秒针变化 我们开启一个线程,线程每隔一秒发送一次消息,我们在消息中更新TextView上显示的时间就ok了. 首先我们在布局文件中放一个TextView用来显示 ...

最新文章

  1. dialog监听点击空白关闭_为什么App Store打开一片空白?尝试这样解决
  2. ActivityManager
  3. php银行转账,php+mysqli事务控制实现银行转账实例_PHP教程
  4. AT1219-歴史の研究(历史研究)【回滚莫队】
  5. 计算机二级选择题复习整理(公共基础部分)
  6. [转]cubemap soft shadow
  7. 剪枝实践:图像检索如何加速和省显存 ?
  8. java web 手机验证_JAVA-WEB,好知网,登录注册,手机验证
  9. 2021-09-18牛客SQL32,SQL33,SQL35,SQL36,SQL37,SQL38,SQL40
  10. Spring的Bean属性依赖注入
  11. 如何做好大型数据中心的运维
  12. 9.数据库服务器部署之------3步实现远程访问
  13. 小议数据库主键选取策略(转)
  14. Python全栈之路系列----之-----守护进程\进程锁\队列\生产者消费者模式\数据共享\进程池(同步,异步)\回调函数\concurrent.futures模块...
  15. Cook‘n Recipe Organizer X3 Mac(食谱管理器)激活版
  16. Java的新项目学成在线笔记-day1(一)
  17. 机械工程专业英语词汇
  18. Part I. S3. 区间直觉模糊集理论
  19. JAVA习题001--产生多个随机数并使用冒泡排序将数字从小到大排序
  20. 行云Talk|开发工具一体化,在线IDE会不会成为一种趋势呢?

热门文章

  1. Flutter 导航栏AppBar
  2. 安全生产通用培训课件(50页)PPTX(附下载)
  3. 如何在 ASP.NET 中下载文件
  4. 计算机不能代替人类英语作文,经济学人:约翰逊语言专栏--机器写手无法完全取代人类(1)...
  5. 淘宝各行业NO.1名店
  6. 由参数方程确定的函数的一阶导数与二阶导数
  7. html边框凹陷样式设置,你不知道的CSS(边框塌陷)?
  8. blackberry平台J2ME编程指南(四)
  9. springboot高校二手服饰交易系统服装商城idea mysql
  10. 相机计算坐标公式_相机标定后,从图像坐标(像素)向物理坐标的转换计算,...