Seata-AT 如何保证分布式事务一致性

作者 | 陈健斌(funkye) github id: a364176773

Seata 是一款开源的分布式事务解决方案,star 高达 18100+,社区活跃度极高,致力于在微服务架构下提供高性能和简单易用的分布式事务服务,本文将剖析 Seata-AT 的实现原理,让用户对 AT 模式有更深入的认识。

Seata 事务模式是什么?

1. Seata 对事务的定义

Seata 定义了全局事务的框架。

全局事务定义为若干分支事务的整体协调:

1. TM 向 TC 请求发起(Begin)、提交(Commit)、回滚(Rollback)全局事务。

2. TM 把代表全局事务的 XID 绑定到分支事务上。

3. RM 向 TC 注册,把分支事务关联到 XID 代表的全局事务中。

4. RM 把分支事务的执行结果上报给 TC。(可选)

5. TC 发送分支提交(Branch Commit)或分支回滚(Branch Rollback)命令给 RM。

Seata 的全局事务处理过程,分为两个阶段:

执行阶段 :执行分支事务,并保证执行结果满足是可回滚的(Rollbackable)和持久化的(Durable)。

完成阶段 :根据执行阶段结果形成的决议,应用通过 TM 发出的全局提交或回滚的请求给 TC, TC 命令 RM 驱动 分支事务 进行 Commit 或 Rollback。

Seata 的所谓事务模式是指:运行在 Seata 全局事务框架下的分支事务的行为模式。 准确地讲 ,应该叫作 分支事务模式

不同的事务模式区别在于分支事务使用不同的方式达到全局事务两个阶段的目标。 即,回答以下两个问题:

执行阶段 :如何执行并保证执行结果满足是可回滚的(Rollbackable)和持久化的(Durable)。

完成阶段 :收到 TC 的命令后,做到事务的回滚/提交。

2. 其它二阶段事务如何在 Seata 事务框架下运转

1)TCC 事务模式

首先来看下 TCC 事务如何融合在 Seata 事务框架中:

可以发现,其实跟 Seata 的事务框架图长得非常像,而区别为 RM 负责管理就是一阶段的 try 执行和二阶段的 confirm/cancel,一样是由 TM 进行事务的 Begin(发起),RM 被 TM 调用后执行一阶段的 Try 方法,等待调用链路走完的时候,TM 向 TC 告知二阶段决议,此时 TC 对 RM 驱动二阶段执行(下发通知,RM 执行 confirm/cancel)。

2)XA 事务模式

如图所示,XA 模式其实就是 Seata 底层利用了 XA 接口,在一阶段二阶段时自动处理。如一阶段时,XA 的 RM 通过代理用户数据源,创建 XAConnection,进行开启 XA 事务(XA start)和 XA-prepare(此时 XA 的任何操作都会被持久化,即便宕机也能恢复),在二阶段时,TC 通知 RM 进行 XA 分支的 Commit/Rollback 操作。

AT 模式是什么?

首先来看一个例子。

1. 一阶段

业务 sql: update product set name = ‘GTS’ where name = ‘TXC’。

一阶段的执行过程对用户是无感知的,用户侧的业务 sql 保持不变,而 AT 模式下一阶段具体发生了什么?接下来,简单说下。

  • 解析 sql 并查询得到前镜像:select id, name, since from product where name = ‘TXC’。

  • 执行业务 sql。

  • 查询执行后的数据作为后镜像:select id, name, since from product where id = 1。

2. 二阶段

提交:仅需把事务相关信息删除即可(理论上不删除也没问题)。

回滚:取出前镜像进行回滚。

通过上述简单的例子,其实可以发现,AT 模式就是自动补偿式事务,那 AT 具体都做了哪些呢?下文将会讲述。

AT 如何保证分布式事务一致性?

先来看这个图:

可能很多人刚看到上图会有疑问,其实这个就是无侵入式 AT 模式的做法示意图。首先用户还是从接口进入,到达事务发起方,此时对业务开发者来说,这个发起方入口就是一个业务接口罢了,一样地执行业务 sql,一样地 return 响应信息给客户端并没有什么改变。而背后就是用户的 sql 被 Seata 代理所托管,Seata-AT 模式能感知到用户的所有 sql,并对之进行操作,来保证一致性。

Seata-AT 是怎么做到无侵入的呢?

如图所示,应用启动时 Seata 会自动把用户的 DataSource 代理,对 JDBC 操作熟悉的用户其实对 DataSource 还是比较熟悉的,拿到了 DataSource,就等于掌握了数据源连接,也就能在背后做些“小动作”,此时对用户来讲也是无感知无入侵。

之后业务有请求进来,执行业务 sql 时,Seata 会解析用户的 sql,提取出表元数据,生成前镜像,再通过执行业务 sql,保存执行 sql 后的后镜像(至于后镜像的介绍之后会讲到),生成行锁之后在注册分支时携带到 Seata-Server,也就是 TC 端。

到此为止,在 Client 端的一阶段操作就已经完成了,无感知、无入侵。此时如果思考下,会发现这里其实有一个行锁,这个行锁是干什么用的呢?这就是要接着讲到 Seata-AT 是如何保证分布式下的事务隔离性,这里直接拿官网的示例来说。

1. 写隔离

  • 一阶段本地事务提交前,需要确保先拿到 全局锁

  • 拿不到 全局锁 ,不能提交本地事务。

  • 全局锁 的尝试被限制在一定范围内,超出范围将放弃,并回滚本地事务,释放本地锁。

以一个示例来说明:

两个全局事务 tx1 和 tx2,分别对 a 表的 m 字段进行更新操作,m 的初始值 1000。

tx1 先开始,开启本地事务,拿到本地锁,更新操作 m = 1000 – 100 = 900。本地事务提交前,先拿到该记录的 全局锁 ,本地提交释放本地锁。tx2 后开始,开启本地事务,拿到本地锁,更新操作 m = 900 – 100 = 800。本地事务提交前,尝试拿该记录的 全局锁 ,tx1 全局提交前,该记录的全局锁被 tx1 持有,tx2 需要重试等待 全局锁

tx1 二阶段全局提交,释放 全局锁 。tx2 拿到 全局锁 提交本地事务。

如果 tx1 的二阶段全局回滚,则 tx1 需要重新获取该数据的本地锁,进行反向补偿的更新操作,实现分支的回滚。

此时如果 tx2 仍在等待该数据的 全局锁 ,同时持有本地锁,则 tx1 的分支回滚会失败。分支的回滚会一直重试,直到 tx2 的 全局锁 等锁超时,放弃 全局锁 并回滚本地事务释放本地锁,tx1 的分支回滚最终成功。

因为整个过程 全局锁 在 tx1 结束前一直是被 tx1 持有的,所以不会发生 脏写 的问题。

这个时候隔离性想必大家已经比较明白了,此时一阶段的大部分操作相信大家也比较明白了,接下来我们继续往下一阶段解析。

2. AT 模式二阶段处理

由上图可见,在二阶段提交时,TC 仅是下发一个通知 :把之前一阶段做记录的 undoLog 删除,并把相关事务信息如:行锁删除,之后让因为在竞争锁被阻塞的事务顺利进行。

而二阶段是回滚时,则要多做一些处理。

首先在 Client 端收到 TC 告知的二阶段是回滚时,会去查到对应的事务的 undolog,取出后镜像,对比当前的数据(因为 SeataAT 是从业务应用层面进行保护分布式事务,如果此时在数据库层面直接修改了库内信息,这个时候 SeataAT 的行锁不起隔离性作用),如果出现了在全局事务以外的数据修改,此时判定为脏写,而 Seata 因为无法感知这个脏写如何发生,此时只能打印日志和触发异常通知,告知用户需要人工介入(规范修改数据入口可避免脏写)。

而如果没有发生脏写就比较简单了,拿出前镜像,众所皆知事务是需要有原子性的,要么一起发生,要么都不发生,此时前镜像记录了发生之前的数据,进行回滚后,就达到了类似本地事务那样的原子性效果。回滚后,再把事务相关信息,如 undolog,行锁进行删除。二阶段回滚算是告一段落了。

既然介绍完了 AT 模式的一阶段及二阶段的原理思想方式,那么 AT 在 Seata 的分布式事务框架下是怎么样的呢?

可以看到,AT 与其它事务模式在 Seata 事务框架中,会多出一个 undolog 的表(相对其它模式的入侵点),但是除此之外,对业务来说,几乎是零入侵性,这也就是为什么 AT 模式在 Seata 中受众广泛的原因。

3. AT 模式与 Seata 支持的其它二阶段模式区别

首先应该明白,目前为止,不存在有任何一种分布式事务的可以满足所有场景。

无论 AT 模式、TCC 模式还是 Saga 模式,这些模式的提出,本质上都源自 XA 规范对某些场景需求的无法满足。

目前分为 3 点来做出对比:

  • 数据锁定

AT 模式使用全局锁保障基本的写隔离,实际上也是锁定数据的,只不过锁在 TC 侧集中管理,解锁效率高且没有阻塞的问题。

TCC 模式无锁,利用本地事务排他锁特性,可预留资源,在全局事务决议后执行相应操作。

XA 模式在整个事务处理过程结束前,涉及数据都被锁定,读写都按隔离级别的定义约束起来。

  • 死锁(协议阻塞)

XA 模式 prepare 后(老版本的数据库中,需要 XA END 后,再下发 prepare <三阶段由来>),分支事务进入阻塞阶段,收到 XA commit 或 XA rollback 前必须阻塞等待。

AT 可支持降级,因为锁存储在 TC 侧,如果 Seata 出现 bug 或者其它问题,可直接降级,对后续业务调用链无任何影响。

TCC 无此问题。

  • 性能

性能的损耗主要来自两个方面:一方面,事务相关处理和协调过程,增加单个事务的 RT;另一方面,并发事务数据的锁冲突,降低吞吐。其实主要原因就是上面的协议阻塞跟数据锁定造成。

XA 模式它的一阶段不提交,在大并发场景由于锁存储在多个资源方(数据库等),加剧了性能耗损。

AT 模式锁粒度细至行级(需要主键),且所有事务锁存储在 TC 侧,解锁高效迅速。

TCC 模式性能最优,仅需些许 RPC 开销,及 2 次本地事务的性能开销,但是需要符合资源预留场景,且是对业务侵入性较大(需要业务开发者每个接口分为 3 个,一个 try,2 个二阶段使用的 confirm 和 cancel )。

可能很多同学对 XA 和 AT 的锁 & 协议阻塞不是特别理解,那么直接来看下图:

可以试着猜一下是哪个是 XA?其实下图的是 XA,因为它带来的锁粒度更大,且锁定时间更久,导致了并发性能相对 AT 事务模型来说,差的比较多,所以至今XA模式的普及度都不很太高。

Seata 近期规划

  • 控制台

首先控制台是 Seata 用户暴露已久的一个问题,没有一个可视化界面,使得用户对 Seata 的可靠性出现了怀疑,更由于没有控制台,局限了很多在 Seata 上可人工介入分布式事务的可能性等问题,所以未来在 1.5.0 的版本会带来控制台的加入,也欢迎更多的同学加入进来一起共建!

  • Raft 集成

Raft 集成的原因,可能大部分用户不是特别知晓,首先要知道目前 TC 端的事务信息都是存储在外部存储器,比如数据库、redis、mongodb(PR 阶段),这就造成了如果外部存储宕机,Seata-Server 集群的完全不可用。即便 Server 是集群部署,有 10 个甚至更多节点,都会因此而不可用,这是不可接受的。

所以引入 Raft 来让每个 Seata-Server 的事务信息达到一致,即便某个节点宕机,也不会破坏事务信息准确性,从而也让分布式事务的一致性得到了更好的保证。(关于 Seata-Server raft 的实现之后会以新篇章来分享。)

  • undoLog 压缩

这个是 1.5.0 AT 模式比较大的性能优化,由于一阶段操作的数据多且大,因为 Seata 在背后为用户插入了 undolog 信息,由此可能也会变得大,有造成了入库缓慢的可能,所以要把 undolog 进行压缩,使 undolog 的插入不再成为 AT 事务在分支数据量大的时候成为一个大的心梗开销。

以下是 Seata 的交流群欢迎大家加入:

  • 钉钉群:识别下方二维码或直接搜索群号:32033786 进群

  • QQ 群:直接搜索 216012363 进群

识别二维码直接进群

总结

AT 说到底就是实现对资源操作的代理,并记录原先 & 变更后的状态,并用锁保证该数据的隔离性。在调用链中出现异常时,还原所有分支数据,达到分布式事务下的“原子性”。

未来呢?redis,mongodb,mq? 尽情期待。

Seata 项目的最核心的价值在于: 构建一个全面解决分布式事务问题的标准化平台。

基于 Seata,上层应用架构可以根据实际场景的需求,灵活选择合适的分布式事务解决方案,非常欢迎大家参与到项目的建设中,共同打造一个标准化的分布式事务平台。

阿里巴巴云原生
我还没有学会写个人说明!
上一篇

Volcano在中科类脑云OS中的落地实践

下一篇

Pulsar 社区周报| 2020-12-12 ~ 2020-12.18

你也可能喜欢

评论已经被关闭。

插入图片