浅谈分布式事务

现今互联网界，分布式系统和微服务架构盛行。一个简单操作，在服务端非常可能是由多个服务和数据库实例协同完成的。在一致性要求较高的场景下，多个独立操作之间的一致性问题显得格外棘手。

基于水平扩容能力和成本考虑，传统的强一致的解决方案（e.g.单机事务）纷纷被抛弃。其理论依据就是响当当的CAP原理。往往为了可用性和分区容错性，忍痛放弃强一致支持，转而追求最终一致性。

分布式系统的特性

在分布式系统中，同时满足CAP定律中的一致性 Consistency、可用性 Availability和分区容错性 Partition Tolerance三者是不可能的。在绝大多数的场景，都需要牺牲强一致性来换取系统的高可用性，系统往往只需要保证最终一致性。

CAP理解：

Consistency：强一致性就是在客户端任何时候看到各节点的数据都是一致的（All nodes see the same data at the same time）。
Availability：高可用性就是在任何时候都可以读写（Reads and writes always succeed）。
Partition Tolerance：分区容错性是在网络故障、某些节点不能通信的时候系统仍能继续工作（The system continue to operate despite arbitrary message loss or failure of part of the the system）。以实际效果而言，分区相当于对通信的时限要求。系统如果不能在时限内达成数据一致性，就意味着发生了分区的情况，必须就当前操作在C和A之间做出选择。

ACID理解：

Atomicity 原子性：一个事务中的所有操作，要么全部完成，要么全部不完成，不会结束在中间某个环节。事务在执行过程中发生错误，会被回滚到事务开始前的状态，就像这个事务从来没有执行过一样。
Consistency 一致性：在事务开始之前和事务结束以后，数据库的完整性没有被破坏。
Isolation 隔离性：数据库允许多个并发事务同时对其数据进行读写和修改的能力，隔离性可以防止多个事务并发执行时由于交叉执行而导致数据的不一致。
Durability 持久性：事务处理结束后，对数据的修改就是永久的，即便系统故障也不会丢失。

分布式事务的基本介绍

分布式事务服务（Distributed Transaction Service，DTS）是一个分布式事务框架，用来保障在大规模分布式环境下事务的最终一致性。

CAP理论告诉我们在分布式存储系统中，最多只能实现上面的两点。而由于当前的网络硬件肯定会出现延迟丢包等问题，所以分区容忍性是我们必须需要实现的，所以我们只能在一致性和可用性之间进行权衡。

为了保障系统的可用性，互联网系统大多将强一致性需求转换成最终一致性的需求，并通过系统执行幂等性的保证，保证数据的最终一致性。

数据一致性理解：

强一致性：当更新操作完成之后，任何多个后续进程或者线程的访问都会返回最新的更新过的值。这种是对用户最友好的，就是用户上一次写什么，下一次就保证能读到什么。根据 CAP 理论，这种实现需要牺牲可用性。
弱一致性：系统并不保证后续进程或者线程的访问都会返回最新的更新过的值。系统在数据写入成功之后，不承诺立即可以读到最新写入的值，也不会具体的承诺多久之后可以读到。
最终一致性：弱一致性的特定形式。系统保证在没有后续更新的前提下，系统最终返回上一次更新操作的值。在没有故障发生的前提下，不一致窗口的时间主要受通信延迟，系统负载和复制副本的个数影响。DNS 是一个典型的最终一致性系统。

常用的分布式技术说明

1. 本地消息表

这种实现方式的思路是源于ebay，其基本的设计思想是将远程分布式事务拆分成一系列的本地事务。

举个经典的跨行转账的例子来描述。

第一步伪代码如下，扣款1W，通过本地事务保证了凭证消息插入到消息表中。

Begin transaction
    update A set amount = amount - 10000 where userId = 1;
    insert into message(userId, price, status) values(1, 10000, 1);
End transaction
commit;

第二步，通知对方银行账户上加1W了，通常采用两种方式：

采用时效性高的MQ，由对方订阅消息并监听，有消息时自动触发事件。
采用定时轮询扫描的方式，去检查消息表的数据。

**2. 消息中间件
**

非事务性的消息中间件

还是以上述提到的跨行转账为例，我们很难保证在扣款完成之后对MQ投递消息的操作就一定能成功。这样一致性似乎很难保证。

try { 
    bool result = dao.update(model); // 操作数据库失败，会抛出异常
    if (result) { 
        mq.send(model); // 如果mq方式执行失败，会抛出异常
    }
} catch(Exception e) { 
    rollback(); // 如果发生异常，则回滚
}

我们来分析下可能的情况：

操作数据库成功，向MQ中投递消息也成功，皆大欢喜。
操作数据库失败，不会向MQ中投递消息了。
操作数据库成功，但是向MQ中投递消息时失败，向外抛出了异常，刚刚执行的更新数据库的操作将被回滚。

从上面分析的几种情况来看，基本上能保证发送者发送消息的可靠性。我们再来分析下消费者端面临的问题：

消息出列后，消费者对应的业务操作要执行成功。如果业务执行失败，消息不能失效或者丢失。需要保证消息与业务操作一致。
尽量避免消息重复消费。如果重复消费，也不能因此影响业务结果。

This chapter requires login to view full content. You are viewing a preview.

Course Curriculum

编程根基：数据结构、算法与系统基础

掌握常用数据结构与算法思想，理解操作系统进程/内存管理及网络 TCP/IP 模型，为后续性能分析、并发设计和系统调优提供底层认知支撑。

01 链 Link

02 栈 Stack

03 队列 Queue

04 树 Tree

05 堆 Heap

06 词典 Dictionary

07 散列 hasing

08 为什么计算机用补码存储数据

09 服务器并发处理能力 - 1

10 服务器并发处理能力 - 2

11 现代操作系统 - 存储设备

12 现代操作系统 - 进程与线程

13 现代操作系统 - 内存管理

Java 内核：JVM 与并发编程

深入 JVM 内存布局、垃圾回收机制与 Java 内存模型，熟练使用并发工具类与锁原语，写出线程安全、低延迟、可诊断的高性能 Java 代码。

14 为什么你看到的“传引用”其实是“传值

15 一个对象引用的思考

16 Java try-with-resource

17 Java 8 Convert List to Map

18 深入理解 ConcurrentHashMap

19 Java 自动装箱和自动拆箱

20 Java 内存模型与线程

21 浅谈 Java 内存模型

22 Java 应用 CPU 使用率为什么飚升？

23 内存栅栏和内存对齐

24 JVM 内存预警排查

25 JVM 体系结构

26 Linux与JVM的内存关系

27 浅谈 G1 垃圾收集器

28 详解 G1 垃圾收集器

29 GC 为何会导致线程数降低？

30 线程的状态和生命周期

31 深入浅出java线程池

32 一台Java服务器跑多少个线程

33 线程安全CopyOnWriteArrayList

34 静态方法、实例化方法与线程安全

35 利用Condition来实现阻塞队列

36 Java多线程Semaphore

37 ThreadPoolExecutor

38 ThreadPoolExecutor参数设置

39 SimpleDateFormat非线程安全

40 WeakReference和StrongReference

41 Threadlocal是否存在内存泄露

42 ArrayBlockingQueue

43 Java并发编程：线程安全性

44 Java并发编程：对象的共享

45 Java并发编程：内存模型

46 性感的 Guava

47 Guava Multimap putAll OOM?

48 RateLimiter 与 Semaphore

49 Google Guava Cache

50 Guava cache asynchronous reload

框架与 I/O：Spring、Netty 与 Web 容器

理解 Spring Boot 自动装配、AOP 与事务原理，掌握 Netty Reactor 模型及 Tomcat 连接处理机制，构建高内聚、易扩展的应用服务层。

51 Servlet3 异步原理与实践

52 理解Servlet的单实例多线程

53 Spring事务配置的五种方式

54 Spring的XML扩展特性

55 Singleton模式的线程安全

56 使用 Java SPI 简单示例

57 基于 Spring & SPI 实现动态服务配置实践

58 深入剖析Tomcat容器

59 深度解读Tomcat中的NIO模型

60 分析Tomcat内存溢出

61 Tomcat 6引发的定时Full GC问题

62 了解 Web 及网络基础

63 HTTP 中 GET 与 POST 的区别

64 Java NIO

65 NIO 堆外内存

66 解读 I/O 多路复用技术

67 Netty Overview

68 Netty 笔记整理

69 Netty 中的 Future & Promise

70 Netty 死锁异常

71 Netty IdleStateHandler心跳机制

72 高性能Server - Reactor模型

73 Netty I/O 多路复用

74 Netty Channel.isWritable 返回 false

75 SocketChannel & ServerSocketChannel

76 Netty 解决 TCP 粘包或半包问题

77 Netty 中的零拷贝机制

78 深入拆解Tomcat & Jetty：整体架构

79 深入拆解Tomcat & Jetty：Endpoint

80 深入拆解Tomcat & Jetty：Executor

81 深入拆解Tomcat & Jetty：Context 容器

82 深入拆解Tomcat & Jetty：性能优化

83 Netty in Action：异步和事件驱动

84 Netty in Action：Netty 的组件和设计

85 Netty in Action：传输

86 Netty in Action：ChannelHandler和ChannelPipeline

87 Netty in Action：EventLoop和线程模型

高性能中间件：消息、缓存与存储

熟练运用 MySQL 索引/事务、Redis 缓存策略、Kafka/RocketMQ 消息可靠性，以及 ZooKeeper 分布式协调，搭建稳定、解耦的分布式数据底座。

88 MySQL执行UPDATE语句错误

89 联合索引致SQL查询效率慢

90 MySQL datetime 精度

91 浅谈数据库连接池

92 配置MySQL数据库超时设置

93 MySQL InnoDB 存储引擎大观

94 浅谈 DDL 技术解密

95 Binlog 的三个业务应用场景

96 Binlog + Flink 实现多表数据同构

97 MySQL主从同步那点事儿

98 浅谈 MySQL binlog 主从同步

99 数据库读写分离与事务纠缠

100 MySQL 实战：Server层和存储引擎

101 MySQL 实战：日志和索引

102 MySQL 实战：锁和性能

103 “SELECT LAST_INSERT_ID 总是为1”

104 Redis 内存使用优化与存储

105 Redis 事务

106 Redis 管道、事务与Lua脚本

107 解析 reids dump.rdb

108 百万级消息推送 Redis 性能排查

109 浅谈分布式事务

110 浅谈分布式服务协调技术

111 Zookeeper中组成员的关系

112 RocketMQ 持久化

113 RocketMQ & Kafka 消息消费与消息重试

114 RocketMQ 技术内幕：路由中心

115 RocketMQ 技术内幕：消息发送

116 RocketMQ 技术内幕：消息存储

117 RocketMQ 技术内幕：消息消费

118 浅谈分布式消息技术 Kafka

119 KafkaProducer 技术内幕

120 Kafka 核心技术与实战：Kafka 入门

121 Kafka 核心技术与实战：客户端

122 Kafka 核心技术与实战：消费者

123 Kafka 核心技术与实战：深入内核

124 Kafka 核心技术与实战：Kafka 控制器

125 Kafka权威指南：初识 Kafka

126 Kafka权威指南：Kafka生产者

127 Kafka权威指南：Kafka消费者

128 Kafka权威指南：深入Kafka

129 Flink 原理与实现

130 Flink 基础教程

131 HBase 权威指南

架构能力：高可用、DDD 与系统设计

基于领域驱动设计划分限界上下文，结合限流、熔断、多活容灾等手段，设计可演进、可观测、故障自愈的大规模业务系统。

132 设计模式基础

133 设计模式中的类关系

134 小谈实践封装与多态

135 浅谈泛型对方法传参的扩展

136 Bridge设计模式

137 Composite 设计模式

138 Proxy / Delegate设计模式

139 重构实践之责任链模式

140 重构实践之桥接模式

141 策略模式实践

142 责任链模式实践

143 单例模式的常用写法

144 架构风格与协同之间设计考量

145 领域驱动设计下的服务高可用设计

146 Log4j 日志输出性能优化

147 监控告警三级治理策略

148 502 Bad Gateway 引起的反思

149 502 Bad Gateway 引起的反思2

150 RPC 框架异常引起的系统崩溃

151 一次网关事故的总结

152 记一次接口性能优化

153 RPC 调用 msgpack 序列化问题

154 从0开始学架构

155 亿级流量网站架构核心技术

156 高可用可伸缩微服务架构

157 架构整洁之道

158 高并发系统设计

159 凤凰架构

Java架构师核心突破指南

一本为Java工程师量身定制的实战突破手册，带你亲手将单体应用演进为分布式、云原生的企业级架构。

¥ 0.0 Free

No cost, unlimited access

Speaker

Songran Zhang

@Aliyun | Qwen Chat

Songran Zhang is senior systems architect at Aliyun, a speaker, and an author. Over the past 15 years, he's mastered architectures from cloud-native systems to AI-powered LLM platforms, building deep technical expertise across large-scale, high-availability systems.

Java架构师核心突破指南

Navigate to specific sections in the content

Loading table of contents...

浅谈分布式事务

Course Curriculum

编程根基：数据结构、算法与系统基础

Java 内核：JVM 与并发编程

框架与 I/O：Spring、Netty 与 Web 容器

高性能中间件：消息、缓存与存储

架构能力：高可用、DDD 与系统设计

Java架构师核心突破指南

Speaker

Java架构师核心突破指南

Related Courses

敏捷开发实战 (2013-2019)

Java开发者速通Python核心

架构演进思维：驾驭复杂系统

Get in Touch

Hello there! 👋

Email

GitHub

Scan to Connect