今天这篇文章介绍一下Seata如何实现TCC事务模式,文章目录如下:

目录

 

什么是TCC模式?

TCC(Try Confirm Cancel)方案是一种应用层面侵入业务的两阶段提交。是目前最火的一种柔性事务方案,其核心思想是:针对每个操作,都要注册一个与其对应的确认和补偿(撤销)操作。

TCC分为两个阶段,分别如下:

  • 第一阶段:Try(尝试),主要是对业务系统做检测及资源预留 (加锁,锁住资源)

  • 第二阶段:本阶段根据第一阶段的结果,决定是执行confirm还是cancel

  1. Confirm(确认):执行真正的业务(执行业务,释放锁)

  2. Cancle(取消):是预留资源的取消(出问题,释放锁)

TCC

为了方便理解,下面以电商下单为例进行方案解析,这里把整个过程简单分为扣减库存,订单创建 2 个步骤,库存服务和订单服务分别在不同的服务器节点上。

假设商品库存为 100,购买数量为 2,这里检查和更新库存的同时,冻结用户购买数量的库存,同时创建订单,订单状态为待确认。

①Try 阶段

TCC 机制中的 Try 仅是一个初步操作,它和后续的确认一起才能真正构成一个完整的业务逻辑,这个阶段主要完成:

  • 完成所有业务检查( 一致性 ) 。

  • 预留必须业务资源( 准隔离性 ) 。

  • Try 尝试执行业务。

Try阶段

②Confirm / Cancel 阶段

根据 Try 阶段服务是否全部正常执行,继续执行确认操作(Confirm)或取消操作(Cancel)。

Confirm 和 Cancel 操作满足幂等性,如果 Confirm 或 Cancel 操作执行失败,将会不断重试直到执行完成。

Confirm:当 Try 阶段服务全部正常执行, 执行确认业务逻辑操作,业务如下图:

Try->Confirm

这里使用的资源一定是 Try 阶段预留的业务资源。在 TCC 事务机制中认为,如果在 Try 阶段能正常的预留资源,那 Confirm 一定能完整正确的提交。

Confirm 阶段也可以看成是对 Try 阶段的一个补充,Try+Confirm 一起组成了一个完整的业务逻辑。

Cancel:当 Try 阶段存在服务执行失败, 进入 Cancel 阶段,业务如下图:

Try-Cancel

Cancel 取消执行,释放 Try 阶段预留的业务资源,上面的例子中,Cancel 操作会把冻结的库存释放,并更新订单状态为取消。

 

TCC模式的三种类型?

业内实际生产中对TCC模式进行了扩展,总结出了如下三种类型,其实从官方的定义中无此说法,不过是企业生产中根据实际的需求衍生出来的三种方案。

1、通用型 TCC 解决方案

通用型TCC解决方案是最经典的TCC事务模型的实现,正如第一节介绍的模型,所有的从业务都参与到主业务的决策中。

通用型TCC

适用场景:

由于从业务服务是同步调用,其结果会影响到主业务服务的决策,因此通用型 TCC 分布式事务解决方案适用于执行时间确定且较短的业务,比如电商系统的三个核心服务:订单服务、账户服务、库存服务。

这个三个服务要么同时成功,要么同时失败。

当库存服务、账户服务的第二阶段调用完成后,整个分布式事务完成。

2、异步确保型 TCC 解决方案

异步确保型 TCC 解决方案的直接从业务服务是可靠消息服务,而真正的从业务服务则通过消息服务解耦,作为消息服务的消费端,异步地执行。

异步确保型

可靠消息服务需要提供 Try,Confirm,Cancel 三个接口。Try 接口预发送,只负责持久化存储消息数据;Confirm 接口确认发送,这时才开始真正的投递消息;Cancel 接口取消发送,删除消息数据。

消息服务的消息数据独立存储,独立伸缩,降低从业务服务与消息系统间的耦合,在消息服务可靠的前提下,实现分布式事务的最终一致性。

此解决方案虽然增加了消息服务的维护成本,但由于消息服务代替从业务服务实现了 TCC 接口,从业务服务不需要任何改造,接入成本非常低。

适用场景:

由于从业务服务消费消息是一个异步的过程,执行时间不确定,可能会导致不一致时间窗口增加。因此,异步确保性 TCC 分布式事务解决方案只适用于对最终一致性时间敏感度较低的一些被动型业务(从业务服务的处理结果不影响主业务服务的决策,只被动的接收主业务服务的决策结果)。比如会员注册服务和邮件发送服务:

3、补偿型 TCC 解决方案

补偿型 TCC 解决方案与通用型 TCC 解决方案的结构相似,其从业务服务也需要参与到主业务服务的活动决策当中。但不一样的是,前者的从业务服务只需要提供 Do 和 Compensate 两个接口,而后者需要提供三个接口。

Do 接口直接执行真正的完整业务逻辑,完成业务处理,业务执行结果外部可见;Compensate 操作用于业务补偿,抵消或部分抵消正向业务操作的业务结果,Compensate操作需满足幂等性。

与通用型解决方案相比,补偿型解决方案的从业务服务不需要改造原有业务逻辑,只需要额外增加一个补偿回滚逻辑即可,业务改造量较小。但要注意的是,业务在一阶段就执行完整个业务逻辑,无法做到有效的事务隔离,当需要回滚时,可能存在补偿失败的情况,还需要额外的异常处理机制,比如人工介入。

适用场景:

由于存在回滚补偿失败的情况,补偿型 TCC 分布式事务解决方案只适用于一些并发冲突较少或者需要与外部交互的业务,这些外部业务不属于被动型业务,其执行结果会影响主业务服务的决策。

以上部分内容参考自:https://seata.io/zh-cn/blog/tcc-mode-applicable-scenario-analysis.html?utm_source=gold_browser_extension

 

TCC事务模式的落地实现

当然Seata支持的事务模式不局限于AT模式,还有TCC模式、SAGA模式、XA模式,下面整合一下TCC模式。

1、演示场景

就以电商系统中下订单为例,为了演示,直接去掉账户服务,以订单服务、库存服务为例介绍。

具体的逻辑如下:

  1. 客户端调用下订单接口

  2. 扣库存

  3. 创建订单

  4. 请求完成

根据上面的逻辑可知,订单服务肯定是主业务服务,事务的发起方,库存服务是从业务服务,参与事务的决策。

Seata的AT模式解决方案伪代码如下:

@GlobalTransactional
public Result<Void> createOrder(Long productId,Long num,.....){//1、扣库存reduceStorage();//2、创建订单saveOrder();
}

@GlobalTransactional这个注解用于发起一个全局事务。

但是AT模式有局限性,如下:

  • 性能低,锁定资源时间太长

  • 无法解决跨应用的事务

因此对于要求性能的下单接口,可以考虑使用TCC模式进行拆分成两阶段执行,这样整个流程锁定资源的时间将会变短,性能也能提高。

此时的TCC模式的拆分如下:

1、一阶段的Try操作

TCC模式中的Try阶段其实就是预留资源,在这个过程中可以将需要的商品数量的库存冻结,这样就要在库存表中维护一个冻结的库存这个字段。

伪代码如下:

@Transactional
public boolean try(){//冻结库存frozenStorage();//生成订单,状态为待确认saveOrder();
}

注意:@Transactional开启了本地事务,只要出现了异常,本地事务将会回滚,同时执行第二阶段的cancel操作。

2、二阶段的confirm操作

confirm操作在一阶段try操作成功之后提交事务,涉及到的操作如下:

  1. 释放try操作冻结的库存(冻结库存-购买数量)

  2. 生成订单

伪代码如下:

@Transactional
public boolean confirm(){//释放掉try操作预留的库存cleanFrozen();//修改订单,状态为已完成updateOrder();return true;
}

注意:这里如果返回false,遵循TCC规范,应该要不断重试,直到confirm完成。

3、二阶段的cancel操作

cancel操作在一阶段try操作出现异常之后执行,用于回滚资源,涉及到的操作如下:

  1. 恢复冻结的库存(冻结库存-购买数量、库存+购买数量)

  2. 删除订单

伪代码如下:

@Transactional
public boolean cancel(){//释放掉try操作预留的库存rollbackFrozen();//修改订单,状态为已完成delOrder();return true;
}

注意:这里如果返回false,遵循TCC规范,应该要不断重试,直到cancel完成。

2、TCC事务模型的三个异常

实现TCC事务模型涉及到的三个异常是不可避免的,实际生产中必须要规避这三大异常。

1、空回滚

定义:在未调用try方法或try方法未执行成功的情况下,就执行了cancel方法进行了回滚。

怎么理解呢?未调用try方法就执行了cancel方法,这个很容易理解,既然没有预留资源,那么肯定是不能回滚。

try方法未执行成功是什么意思?

可以看上节中的第一阶段try方法的伪代码,由于try方法开启了本地事务,一旦try方法执行过程中出现了异常,将会导致try方法的本地事务回滚(注意这里不是cancel方法回滚,而是try方法的本地事务回滚),这样其实try方法中的所有操作都将会回滚,也就没有必要调用cancel方法。

但是实际上一旦try方法抛出了异常,那么必定是要调用cancel方法进行回滚,这样就导致了空回滚。

解决方案:

解决逻辑很简单:在cancel方法执行操作之前,必须要知道try方法是否执行成功。

2、幂等性

TCC模式定义中提到:如果confirm或者cancel方法执行失败,要一直重试直到成功。

这里就涉及了幂等性,confirm和cancel方法必须保证同一个全局事务中的幂等性。

解决方案:

解决逻辑很简单:对付幂等,自然是要利用幂等标识进行防重操作。

3、悬挂

事务协调器在调用 TCC 服务的一阶段 Try 操作时,可能会出现因网络拥堵而导致的超时,此时事务管理器会触发二阶段回滚,调用 TCC 服务的 Cancel 操作,Cancel 调用未超时;

在此之后,拥堵在网络上的一阶段 Try 数据包被 TCC 服务收到,出现了二阶段 Cancel 请求比一阶段 Try 请求先执行的情况,此 TCC 服务在执行晚到的 Try 之后,将永远不会再收到二阶段的 Confirm 或者 Cancel ,造成 TCC 服务悬挂。

解决方案:

解决逻辑很简单:在执行try方法操作资源之前判断cancel方法是否已经执行;同样的在cancel方法执行后要记录执行的状态。

4、总结

针对以上三个异常,落地的解决方案很多,比如维护一个事务状态表,每个事务的执行阶段全部记录下来。

  • 幂等:在执行confirm或者cancel之前根据事务状态表查询当前全局事务是否已经执行过confirm或者cancel方法

  • 空回滚:在执行cancel之前才能根据事务状态表查询当前全局事务是否已经执行成功try方法

  • 悬挂:在执行try方法之前,根据事务状态表查询当前全局事务是否已经执行过cancel方法

 

Seata整合TCC实现

本节只介绍关键代码

源码目录如下:

源码目录

项目启动所需要的相关文件如下图:

nacos目录中的SEATA_GROUP是Seata事务服务端和客户端所需要的相关配置,直接导入nacos即可。

seata目录中的conf是1.3.0版本服务端的配置

SQL目录是相关的几个数据库。

1、TCC接口定义

在order-boot模块创建OrderTccService,代码如下:

代码中注释已经很完整了,下面挑几个重点介绍一下:

  1. @LocalTCC:该注解开启TCC事务

  2. @TwoPhaseBusinessAction:该注解标注在try方法上,其中的三个属性如下:

    1. name:TCC事务的名称,必须是唯一的

    2. commitMethod:confirm方法的名称,默认是commit

    3. rollbackMethod:cancel方法的名称,,默认是rollback

  3. confirm和cancel的返回值尤为重要,返回false则会不断的重试。

2、TCC接口实现

定义有了,总要实现,如下:

1、try方法

try方法

①处的代码是为了防止悬挂异常,从事务日志表中获取全局事务ID的状态,如果是cancel状态则不执行。

②处的代码冻结库存

③处的代码生成订单,状态为待确认

④处的代码向幂等工具类中添加一个标记,key为当前类和全局事务ID,value为当前时间戳。

注意:必须要开启本地事务,如上代码使用@Transactional开启本地事务

2、confirm方法

confirm方法

①处的代码从幂等工具类中根据当前类和全局事务ID获取值,由于try阶段执行成功会向其中添加值,confirm方法执行成功会移出这个值,因此在confirm开头判断这个值是否存在就起到了幂等效果,防止重试的效果。

⑥处的代码从幂等工具类中移出try方法中添加的值。

②处的代码是从BusinessActionContext中获取try方法中的入参。

③处的代码是释放掉冻结的库存

④处的代码是修改订单的状态为已完成。

注意:1. 开启本地事务  2. 注意返回值,返回false时将会重试

3、cancel方法

cancel方法

①处的代码是向事务日志记录表中插入一条数据,标记当前事务进入cancel方法,用来防止悬挂,这个和try方法中的①处的代码相呼应。

②处的代码是为了防止幂等和空回滚,因为只有当try方法中执行成功幂等工具类中对应的当前类和全局事务ID才会存储该值。这样既防止了幂等,也防止了空回滚。

③处的代码恢复冻结的库存。

④处的代码删除这笔订单

⑤处的代码是移出幂等工具类当前类和全局事务ID对应的值。

3、如何防止TCC模型的三个异常?

实现方法有很多,有些案例是全部使用事务日志表记录当前的状态,这样完美的解决了幂等、空回滚、悬挂的问题。

陈某这里为了方便,使用了两种方案,如下:

1、幂等、空回滚

使用了一个幂等工具类,其中是个Map,key为当前类和全局事务ID,value是时间戳。

代码如下:

思路如下:

  1. 在try方法最后使用幂等工具类中的add方法添加值

  2. 在confirm、cancel方法中使用幂等工具类中的remove方法移出值

  3. 在confirm、cancel方法中使用幂等工具类中get方法获取值,如果为空,则表示已经执行过了,直接返回true,这样既防止了幂等,也防止了空回滚。

2、悬挂

悬挂的实现依靠的是事务日志表,表结构如下:

CREATE TABLE `transactional_record` (`id` bigint(11) NOT NULL AUTO_INCREMENT,`xid` varchar(100) NOT NULL,`status` int(1) DEFAULT NULL COMMENT '1. try  2 commit 3 cancel ',PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

其中的xid是全局事务ID,status是事务的状态。

其他的字段自己可以扩展

解决悬挂问题的逻辑如下:

  1. cancel方法中将当前全局事务ID记录到事务日志表中,状态为cancel

  2. try方法执行资源操作前检查事务日志表中当前全局事务ID是否已经是cancel状态

4、创建订单的业务方法

上面只是完成了TCC的三个方法,主业务事务发起方还未提供,代码如下:

@GlobalTransactional这个注解开启了全局事务,是事务的发起方。

内部直接调用的TCC的try方法。

5、其他的配置

以上只是列出了关键的步骤,剩余其他的配置自己根据案例源码完善,如下:

  1. 接口测试

  2. 整合nacos

  3. 整合feign

  4. 整合seata,TCC模式中的配置和AT模式的Seata配置相同

注意:一定要配置Seata的事务组tx-service-group,配置方法见之前的文章。

有道无术,术可成;有术无道,止于术

欢迎大家关注Java之道公众号

好文章,我在看❤️

实战!阿里神器 Seata 实现 TCC模式 解决分布式事务,真香!相关推荐

  1. 实战~阿里神器 Seata 实现 TCC模式 解决分布式事务,真香

    今天这篇文章介绍一下Seata如何实现TCC事务模式,文章目录如下: 什么是TCC模式? TCC(Try Confirm Cancel)方案是一种应用层面侵入业务的两阶段提交.是目前最火的一种柔性事务 ...

  2. seata 1.3.0 四种模式解决分布式事务(AT、TCC、SAGA、XA)

    前言 1.seata版本 1.3.0 2.基础项目结构,大家只需要关注 设备模块 device和工单模块 order即可. - 项目 说明 api-gateway 网关模块 common 基础模块 d ...

  3. Spring Cloud综合实战 - 基于TCC补偿模式的分布式事务

    2019独角兽企业重金招聘Python工程师标准>>> 本文通过使用Spring Cloud和Docker构建了一个常见的Microservice体系. Spring Cloud为开 ...

  4. seata 如何开启tcc事物_分布式事务Seata-TCC源码分析

    为了更好理解分布式事务,首先提出一个问题: 假设数据库中有两个表ta,tb,我们要分别更改ta表中的ra记录和tb表中的rb记录,但要求ra和rb记录都修改成功,才认为此次操作时成功,或者需要失败回滚 ...

  5. 解决分布式事务,Seata真香

    目录 背景介绍 什么是分布式事务 什么叫做逆向补偿呢 互联网最流行的分布式事务组件seata 总结 背景 大家好,今天给大家分享一个在 2022 年出去面试 Java 几乎必问的一个技术,那就是 se ...

  6. 分布式事务 - 如何解决分布式事务问题?

    分布式事物 - 如何解决分布式事务问题? 面试题 分布式事务了解吗?你们是如何解决分布式事务问题的? 面试官心理分析 只要聊到你做了分布式系统,必问分布式事务,你对分布式事务一无所知的话,确实会很坑, ...

  7. 基于消息中间件解决分布式事务的开源框架Myth

    基于消息中间件的解决分布式事务框架:https://github.com/yu199195/myth 1.rpc框架支持 : dubbo,motan,springcloud. 2.消息中间件支持 : ...

  8. rabbitmq 查询版本_基于rabbitmq解决分布式事务

    分布式事务要解决的问题是保证二个数据库数据的一致性,本地事务ACID属于刚性事务,基于CAP理论,分布式事务的核心要点柔性事务,最终一致性. 基于rabbitmq解决分布式事务要点如下 生产者采用发送 ...

  9. 搞懂分布式技术19:使用RocketMQ事务消息解决分布式事务

    搞懂分布式技术19:使用RocketMQ事务消息解决分布式事务 初步认识RocketMQ的核心模块 rocketmq模块 rocketmq-broker:接受生产者发来的消息并存储(通过调用rocke ...

最新文章

  1. python基础知识面试题-python的一些基本概念知识和面试题
  2. linux cp -d复制软链接文件
  3. 您的支持是作者写作最大的动力!
  4. eclipse export jar file 和 runnable jar file 的区别
  5. 最近碰的的一些问题及心得
  6. Struts2教程3:struts.xml常用配置解析
  7. 原来Android还可以这样通过反射,获取jar包属性及方法
  8. 行政区域村级划分数据库_两区划定数据库规范(试行)
  9. 基础知识 | 贴片电阻快速扫盲
  10. 基于蒙特卡诺的风场景模型出力(Matlab代码实现)
  11. 毕业论文用尾注添加参考文献
  12. 建站手册-网站构建:万维网联盟(World Wide Web Consortium)
  13. 记一次疑难杂症-HTTP请求RST
  14. 我的世界我服务器注册密码大全,网易账号密码大全我的世界 | 手游网游页游攻略大全...
  15. 面试前夕,我建议你还是先来看看阿里和京东面试都问些啥?
  16. Linux系统代理上网
  17. 机器学习线性回归算法实验报告_机器学习笔记 线性回归
  18. 铸造数据安全堤坝,华为云数据灾备解决方案就是强
  19. 谈谈温度、压力、同位素设定对量子化学计算结果产生的影响
  20. 【企业】财务思维之如何通过财报分析企业

热门文章

  1. c++ 记忆化搜索_2010/12区间动态规划及记忆化搜索
  2. python开发项目架构图_我的第一个python web开发框架(8)——项目结构与RESTful接口风格说明...
  3. java dump分析工具_Java虚拟机详解(七)------虚拟机监控和分析工具(1)
  4. 输入域html,我可以让HTML输入表单域成为可选的吗?
  5. 简述运行PHP文件的步骤,简述PHP运行机制
  6. 在linux下解压jdk时出现的问题
  7. 操作系统之进程管理:11、用信号量机制实现进程同步、互斥、前驱关系
  8. Python数据结构:序列(列表[]、元组())与映射(字典{})语法总结
  9. 什么叫中断隐指令,具体做哪三件事呢?
  10. 边界信任模型,零信任模型