news 2026/4/10 2:25:11

关于 RocketMQ 事务消息的正确打开方式 → 你学废了吗

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
关于 RocketMQ 事务消息的正确打开方式 → 你学废了吗

知识回顾

本文不讲什么是 RocketMQ ,不讲它的实现原理,只想和大家探讨下它的事务消息的正确使用方式

再探讨之前,先带大家回顾下知识点

事务消息的设计原理

RocketMQ 在 4.3.0 版中已经支持分布式事务消息,采用 2PC 的思想实现事务消息提交,同时增加一个补偿逻辑来处理二阶段超时或者失败的消息,如下图所示

什么,英文看不懂?贴心的我早已想到,中文版的也有

其中有两个点:半事务、回查事务状态,值得我们重点回顾

Half 消息

何谓 half 消息?

消息发送方把消息发送到 MQ 服务,但是此消息的状态被标记为不能投递,处于这种状态下的消息称为 half 消息;消费方不能消费 half 消息

发送方对 half 消息二次确认后,也就是 Commit 之后,消费方才可以消费到;如果是 Rollback,该消息则会被删除,永远不会被消费到

事务状态回查

如果在 RocketMQ 事务消息的二阶段过程中失败了,例如在做 Commit 操作时(上图中的第 4 步),出现网络问题导致 Commit 失败,那么需要通过一定的策略使这条消息最终被 Commit

RocketMQ 采用了一种补偿机制,称为“回查”。Broker 端对未确定状态的消息发起回查,将消息发送到对应的 Producer 端(同一个 Group 的 Producer),由 Producer 根据消息来检查本地事务的状态,进而执行 Commit 或者 Rollback

值得注意的是,RocketMQ 并不会无休止的的信息事务状态回查,默认回查 15 次,如果 15 次回查还是无法得知事务状态,RocketMQ 默认回滚该消息

更多细节请查看:事务消息

实战示例

理论知识理解之后,就需要我们进行实操与分析了

需求背景

假设我们有两个服务:订单服务、积分服务,当用户成功下单之后,需要给用户加相应的积分

实现方式有很多种,你知道哪些?

假设我们用 RocketMQ 事务消息来保证最终一致性,我们又该如何实现?

环境准备

RocketMQ:4.8.0

rocketmq-client:4.9.2

Spring Boot:2.1.0.RELEASE

MySQL:5.7.29

MyBatis Plus:3.4.2

建表 SQL

View Code

项目地址:spring-boot-rocketmq-order,spring-boot-rocketmq-points

后续只会对关键代码进行讲解,所以建议大家把代码 down 下来看看,保证有个基本的印象

回到标题,楼主为什么会强调:正确的打开方式

你猜对了,RocketMQ 事务消息的使用方式有很多种,楼主就结合工作项目中的使用方式,来和大家一起讨论下,哪些方式是正确的,哪些方式是不正确的(以及不正确的原因)

结合 Half 消息发送的时机,大致可分为三种:

根据 half 消息的位置,我们暂且将这三种方式命名为:half 消息后置、half 消息中置、half 消息前置

我们逐个来讨论使用是否正确

half 消息后置

这种方式有没有觉得似曾相识?与发普通消息是不是很类似? 本地业务执行完之后,发普通消息给积分中心,是不是熟悉的味道?

但还是有区别的,至少有回查机制,我们结合伪代码具体看看

我们来分析下各种异常情况,看看这种方式是否有问题

1、订单数据或订单事务日志落库异常,事务回滚,half 消息不会发送,没问题

2、half 消息发送异常,事务会回滚,没问题

3、half 消息发送未发生异常,但返回的不是 SEND_OK 状态,代码抛出了异常,事务回滚,没问题

思考:如果我们不关注 half 消息发送的结果,像这样

最终,消息会推送给积分服务吗?

虽然看起来怪怪的,但又挑不出毛病

half 消息中置

我们直接看伪代码

我们来分析下各种异常情况,看看这种方式是否有问题

1、订单数据落库异常,事务回滚,half 消息不会发送,没问题

2、half 消息发送异常,事务会回滚,没问题

3、half 消息发送未发生异常,但返回的不是 SEND_OK 状态,代码抛出异常,事务会回滚,没问题

思考:与之前的思考问题一样,如果我们不关注 half 消息发送的结果,最终消息会推送给积分服务吗?

只有发送 half 消息成功,并且发送状态为 SEND_OK ,才会执行 executeLocalTransaction ,向 t_order_transaction_log 表写入事务日志

那么即使 Broker 回查事务状态,它得到的结果始终是 UNKNOW ,最终 half 消息会被回滚,积分服务收不到消息

导致的问题就是:用户下单成功,但却没有增加积分

可见关注 half 消息发送结果的重要性

4、half 消息发送成功,且返回的是 SEND_OK 状态,但 executeLocalTransaction 执行异常了,会是什么结果?

代码很明显,我们进行了 catch ,异常不会向上抛,订单落库还是成功的,只是订单事务日志落库失败了

返回 ROLLBACK_MESSAGE ,half 消息会回滚,积分服务收不到消息

那么同样的问题又出现了:用户下单成功,但却没有增加积分

如果我们不 catch ,像这样

理论上来讲,异常往上抛,订单数据会回滚, Broker 回查事务状态,一直返回 UNKNOW ,最终积分服务收不到消息

理论上来讲没问题,但事实呢? 我们来实践一下

哦豁,竟然没有打印异常日志,也就说异常被 catch 没有往外抛,订单数据也落库了

那么又会出现同样的问题:用户下单成功,但却没有增加积分

至于谁把异常 catch 了没往外抛,相信大家都能想到,这算是 rocketmq-client 的一个 bug ;源码稍后再跟,我们先看完前置

half 消息前置

直接上伪代码

我们来分析下各种异常情况,看看这种方式是否有问题

1、half 消息发送异常,本地事务不会执行,没问题

2、half 消息发送未发生异常,但返回的不是 SEND_OK 状态,代码抛出异常,本地事务不会执行,没问题

思考:与之前的思考问题一样,如果我们不关注 half 消息发送的结果,会是什么结果?

只有 half 消息发送成功,且返回状态是 SEND_OK 才会执行 executeLocalTransaction

即使 Broker 回查事务状态,得到的结果始终是 UNKNOW ,最终 half 消息会被回滚,积分服务收不到消息

订单服务与积分服务都没有落库成功,也就说是没问题的

3、half 消息发送成功,且返回的状态是 SEND_OK ,但 executeLocalTransaction 执行异常了,会是什么结果

也就是 save 方法执行异常了,我们来实践下

异常还是被 catch 了没往外抛,但是订单数据却回滚了,就结果而言是没问题的

half 消息发送成功了,但是 Broker 一直未收到本地事务的确认消息, Broker 会回查,得到的结果始终是 UNKNOW ,最终 half 消息会被回滚,积分服务收不到消息

订单数据回滚了,积分服务未收到消息,那么此种情况是没问题的

看起来挺顺眼,异常情况下也没什么问题

rocketmq-client 的 bug

需要弄清楚的问题有两个:

1、half 消息中置, executeLocalTransaction 的异常为什么没有抛出来

2、half 消息前置, 异常同样没有抛出来,为什么订单数据却回滚了

先看第一个问题,我们来跟下源码

rocketmq-client 捕获了异常,但并未向外抛

其实 RocketMQ 是有打印日志的,只是楼主的日志配置的不对,导致控制台未打印出来

对于第 1 个问题,相信大家已经清楚了

关于第 2 个问题,我就不具体分析了,我给个提示,从事务 AOP 的控制范围与异常抛出点来考虑,如下图

最终一致性

前面讲了那么多,都是讲的订单服务,总结起来就是:事务消息(而非 half 消息)发送成功,那么本地事务一定是执行成功的

保证的是事务消息的发送与订单服务的强一致

如果积分服务消费异常呢?

那对不起,RocketMQ 事务消息处理不了这种情况,回滚不了订单服务的数据,只能通过补偿机制(比如人工修复)修复积分服务的数据

总结

1、三种方式的抉择

half 消息中置,问题比较多,不推荐

half 消息后置,看起来挺别扭的(难道只是楼主这么觉得?),倒是没什么问题

half 消息前置,符合 RocketMQ 事务消息的设计原理,推荐采用此种方式

2、一定要关注 half 消息发送的结果,不抛异常不代表一定成功了,必要时需要根据 half 消息发送的结果做后续逻辑处理

3、最终一致性

RocketMQ 考虑的是数据最终一致性,上游服务提交之后,下游服务最终只能成功,做不到回滚上游服务的数据

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/1 22:18:11

32、合并用户数据库与拼写检查:Unix 工具的实用应用

合并用户数据库与拼写检查:Unix 工具的实用应用 合并用户数据库 在处理多系统用户数据时,常常需要合并不同计算机的密码文件,以实现文件共享。下面将详细介绍合并用户数据库的相关操作及注意事项。 生成最终密码文件 首先需要将三个 unique 文件合并生成最终的密码文件…

作者头像 李华
网站建设 2026/4/8 14:16:33

40、深入了解Shell:下载、版本与初始化指南

深入了解Shell:下载、版本与初始化指南 1. 下载bash和ksh93源代码 在开始介绍之前,先了解一些逻辑表达式的示例,比如 $((3 > 2)) 的值为1, $(( (3 > 2) || (4 <= 1) )) 的值也为1,因为两个子表达式中至少有一个为真。 1.1 下载bash bash可以从自由软件基…

作者头像 李华
网站建设 2026/4/8 13:44:19

41、深入了解Shell的可移植性、启动终止及安全脚本编写

深入了解Shell的可移植性、启动终止及安全脚本编写 1. Shell会话与Z-Shell启动终止 1.1 Shell会话类型 Shell会话分为交互式和非交互式两种。交互式会话仅调用单个文件,例如: $ bash Start an interactive session DEBUG: This is /home/bones/.bashrc $ exit Terminate…

作者头像 李华
网站建设 2026/4/9 13:24:04

压力测试瓶颈定位分析法:从现象到根因的系统性解决方案

压力测试中的瓶颈挑战 在软件开发生命周期中&#xff0c;压力测试是确保系统在高并发、高负载环境下稳定性的关键环节。然而&#xff0c;许多测试团队常面临瓶颈定位模糊、响应时间骤增或资源耗尽等问题&#xff0c;导致测试效果大打折扣。本文针对软件测试从业者&#xff0c;…

作者头像 李华
网站建设 2026/4/9 23:37:34

46、Unix 文件系统深入解析

Unix 文件系统深入解析 1. 访问控制列表(ACLs) 部分 Unix 系统支持访问控制列表(ACLs)这一特性,它能够对访问权限进行更精细的控制,可给特定用户或用户组分配非默认的权限。然而,不同系统用于设置和显示 ACLs 的工具差异很大,这使得 ACLs 在异构环境中用处不大,情况…

作者头像 李华