本文是基于 apache dubbo 2.7.0 版本的源码和参考官网的集群章节而成。



 为了避免单点故障,现在的应用通常至少会部署在两台服务器上。对于一些负载比较高的服务,会部署更多的服务器。这样,在同一环境下的服务提供者数量会大于1。对于服务消费者来说,同一环境下出现了多个服务提供者。这时会出现一个问题,服务消费者需要决定选择哪个服务提供者进行调用。另外服务调用失败时的处理措施也是需要考虑的,是重试呢,还是抛出异常,亦或是只打印异常等。为了处理这些问题,Dubbo 定义了集群接口 Cluster 以及 Cluster Invoker。集群 Cluster 用途是将多个服务提供者合并为一个 Cluster Invoker,并将这个 Invoker 暴露给服务消费者。这样一来,服务消费者只需通过这个 Invoker 进行远程调用即可,至于具体调用哪个服务提供者,以及调用失败后如何处理等问题,现在都交给集群模块去处理。集群模块是服务提供者和服务消费者的中间层,为服务消费者屏蔽了服务提供者的情况,这样服务消费者就可以专心处理远程调用相关事宜。比如发请求,接受服务提供者返回的数据等。这就是集群的作用。

一 选择集群容错方式

 集群容错机制是交由 org.apache.dubbo.rpc.cluster.Cluster 接口的子类处理,为了清楚该接口有哪些扩展类,不妨打开该类的 Dubbo SPI 配置文件(扩展点的全限定名)一观:

mock=org.apache.dubbo.rpc.cluster.support.wrapper.MockClusterWrapper
failover=org.apache.dubbo.rpc.cluster.support.FailoverCluster
failfast=org.apache.dubbo.rpc.cluster.support.FailfastCluster
failsafe=org.apache.dubbo.rpc.cluster.support.FailsafeCluster
failback=org.apache.dubbo.rpc.cluster.support.FailbackCluster
forking=org.apache.dubbo.rpc.cluster.support.ForkingCluster
available=org.apache.dubbo.rpc.cluster.support.AvailableCluster
mergeable=org.apache.dubbo.rpc.cluster.support.MergeableCluster
broadcast=org.apache.dubbo.rpc.cluster.support.BroadcastCluster
registryaware=org.apache.dubbo.rpc.cluster.support.RegistryAwareCluster

 理论上来说,Dubbo 的集群容错机制就有以上 10 种,且还可从 Cluster 接口上的 @SPI 可知,其默认的扩展类为 FailoverCluster

@SPI(FailoverCluster.NAME)
public interface Cluster {@Adaptive<T> Invoker<T> join(Directory<T> directory) throws RpcException;
}

 那么在真正调用时,可通过设置 <dubbo:service> 标签中 cluster 属性,其值分别对应Cluster 扩展点配置文件中的 key,以匹配对应的容错机制。

二 前置动作

 集群容错真正发生在消费端。当消费端发起调用时,会先从服务目录查询满足需求的服务提供者信息,在此基础上进行路由,路由后的结果才会真正进行容错处理。所以,就会有如下的活动图:

三 容错机制原理

3.1 Failover Cluster

失败自动切换机制是由 FailoverClusterInvoker 类控制。在调用失败时,会自动切换服务提供者信息进行重试。通常用于读操作,但重试会带来更长延迟。默认配置下,Dubbo 会使用这种机制作为缺省集群容错机制。下图展示了 Failover Cluster 机制的工作原理。

 如上,首先是获取重试次数,然后根据重试次数进行循环调用,失败后进行重试。在循环内,首先是通过负载均衡组件选择一个 Invoker,然后再通过这个 Invoker 的 invoke 方法进行远程调用。如果失败了,记录下异常,并进行重试。

 在源码中是通过如下代码获取重试次数:

int len=getUrl().getMethodParameter(methodName, Constants.RETRIES_KEY,Constants.DEFAULT_RETRIES)+1;

 其中,常量 Constants.RETRIES_KEY 的值为 “retries”,Constants.DEFAULT_RETRIES 的值为 2。表示:从 url 中获取该方法中 retries 属性的值,值为空时取默认值 2。但是在最后还有一个 +1 的动作,表示获取的最终值为 重试次数 + 1,即执行远程调用的最大次数为重试次数 + 1次。

3.2 Failback Cluster

失败自动恢复会在调用失败后,返回一个空结果给服务消费者。并通过定时任务对失败的调用进行重试,适合执行消息通知等操作。下面来看一下它的实现逻辑。

3.3 Failfast Cluster

快速失败只会进行一次调用,失败后立即抛出异常。适用于幂等操作,比如新增记录。实现逻辑如下:

3.4 Failsafe Cluster

失败安全是指,当调用过程中出现异常时,仅会打印异常,而不会抛出异常。适用于写入审计日志等操作。

3.5 Forking Cluster

并行调用多个服务提供者会在运行时通过线程池创建多个线程,并发调用多个服务提供者。只要有一个服务提供者成功返回了结果,doInvoke 方法就会立即结束运行。ForkingClusterInvoker 的应用场景是在一些对实时性要求比较高读操作(注意是读操作,并行写操作可能不安全)下使用,但这将会耗费更多的资源。下面来看该类的实现原理。

3.6 Broadcast Cluster

 BroadcastClusterInvoker 会逐个调用每个服务提供者,如果其中一台报错,再循环调用结束后,BroadcastClusterInvoker 会抛出异常。该类通常用于通知所有提供者更新缓存或日志等本地资源信息。

TODO
 其他的容错机制原理待补充。

Dubbo的容错机制原理相关推荐

  1. Dubbo的底层实现原理和机制

    Dubbo :是一个RPC框架,SOA框架: Dubbo缺省协议采用单一长连接和NIO异步通讯,适合于小数据量大并发的服务调用,以及服务消费者机器数远大于服务提供者机器数的情况. 作为RPC:支持各种 ...

  2. Spring - Dubbo的底层实现原理和机制

    Dubbo :是一个RPC框架,SOA框架: Dubbo缺省协议采用单一长连接和NIO异步通讯,适合于小数据量大并发的服务调用,以及服务消费者机器数远大于服务提供者机器数的情况. 作为RPC:支持各种 ...

  3. dubbo的常用容错机制

    容器机制分析 FailoverClusterInvoker (dubbo默认的容错机制)失败重试机制.失败自动切换,当出现失败,重试其它服务器.支持重试的,查询接口,支持幂等的写接口 Failsafe ...

  4. Flink/Blink 原理漫谈(六)容错机制(fault tolerance)详解

    系列文章目录 Flink/Blink 原理漫谈(零)运行时的组件 Flink/Blink 原理漫谈(一)时间,watermark详解 Flink/Blink 原理漫谈(二)流表对偶性和distinct ...

  5. Dubbo服务Spi机制和原理

    ​ 什么是Dubbo的spi机制? SPI 全称为 Service Provider Interface,是一种服务发现机制.SPI 的本质是将接口实现类的全限定名配置在文件中,并由服务加载器读取配置 ...

  6. dubbo重试机制原理_Dubbo超时和重连机制

    dubbo启动时默认有重试机制和超时机制. 超时机制的规则是如果在一定的时间内,provider没有返回,则认为本次调用失败, 重试机制在出现调用失败时,会再次调用.如果在配置的调用次数内都失败,则认 ...

  7. dubbo重试机制原理_[转]dubbo重试机制和超时机制

    dubbo启动时默认有重试机制和超时机制. 超时机制的规则是如果在一定的时间内,provider没有返回,则认为本次调用失败, 重试机制在出现调用失败时,会再次调用.如果在配置的调用次数内都失败,则认 ...

  8. Dubbo——远程(RPC)调用原理

    摘要 服务暴露和服务引入两个流程了,而这两个流程就是为了服务的调用,本博文将详细的介绍Dubbo的服务调用流程. PRC架构组件 一个基本的RPC架构里面应该至少包含以下4个组件: 客户端(Clien ...

  9. Dubbo的使用及原理浅析.

    前面几个博文中关于SSM 框架已经搭建完成, 这里来讲下项目中使用到的Dubbo以及自己了解到的关于Dubbo的一些知识. Dubbo是什么? Dubbo是阿里巴巴SOA服务化治理方案的核心框架,每天 ...

最新文章

  1. C#利用ICSharpCode.SharpZipLib.dll压缩文件和解压文件
  2. 网络安全-NTFS权限和445文件共享
  3. Java Syncrhonisers
  4. Redis简单命令(部分示例代码)
  5. 奇偶数对调,保持顺序 —— 剑指Offer
  6. Java8新特性(Arrays)
  7. JS获取短信验证码60秒
  8. bzoj 1924 所驼门王的宝藏
  9. (王道408考研操作系统)第一章计算机系统概述-第一节1、2:操作系统概念、概念和特征
  10. 计算机组成原理累加器实验a r0,计算机组成原理实验箱 介绍.ppt
  11. 游戏建模学习技巧分享
  12. el-form的入门学习
  13. 奔腾处理器_编号和非编号的奔腾处理器之间有什么区别?
  14. 如何用echarts组件制作图表
  15. 超百万人用它生成3D头像,这项技术刚刚中选了SIGGRAPH Asia 2022
  16. 罗永浩微博发声,锤子或再出新一代坚果手机?
  17. Newton牛顿法(一)| 基本思想+迭代公式
  18. idea中找不到maven projects的集中解决办法
  19. 8 种实现垂直和水平居中元素的方法汇总
  20. 给女朋友写的h5(移动端)小游戏,超简单

热门文章

  1. python 自定义排序
  2. 【Comsol学习】二维稳态热传导问题
  3. HSV介绍二:HSV颜色识别-HSV基本颜色分量范围
  4. oracle 获取最大id
  5. tp5模型能实现事务吗_实现工作单元-通过事务模型处理域对象
  6. 社区活动|隐语成长报告,好礼回馈社区
  7. 如果高考考Python,这些题目你会做吗?
  8. 说程序员不懂浪漫?七夕节教你如何花式表白!
  9. System.NullReferenceException HResult=0x80004003 Message=未将对象引用设置到对象的实例。
  10. SLAM研究方向及知识点汇总