分布式事务反直觉坑位与避坑实战指南

国医中兴

81人浏览 · 2026-06-07 10:18:38

国医中兴 · 2026-06-07 10:18:38 发布

分布式事务反直觉坑位与避坑实战指南

一、分布式事务的本质挑战：从 ACID 到 BASE 的跨越

分布式事务是分布式系统领域中最具挑战性的问题之一。当一个业务操作涉及多个数据节点时，如何保证这些节点上的数据变更要么全部成功、要么全部回滚，是分布式事务要解决的核心问题。理解这个问题的本质，需要从本地事务的 ACID 属性说起。

传统的本地事务（基于单个数据库连接）能够轻松保证 ACID 属性：原子性由数据库的 undo log 保证；一致性由约束检查和级联回滚机制维护；隔离性由锁机制和 MVCC 实现；持久性由事务提交时的 redo log 写入保障。这些机制在单一数据库节点内运行，不需要跨网络协调。

然而，当业务扩展到多个数据库节点、甚至多种数据源（数据库、消息队列、分布式缓存等）时，ACID 的保证变得困难重重。网络延迟、节点故障、消息丢失等问题使得跨节点的协调变得复杂。CAP 定理告诉我们，在存在网络分区的情况下，一致性和可用性不可兼得。这迫使我们在强一致性和系统可用性之间做出权衡。

二、两阶段提交协议的隐藏陷阱

2.1 协调者故障与数据不一致

两阶段提交（2PC）是最经典的分布式事务协议，但其存在一个致命的缺陷——协调者故障可能导致数据处于不确定状态。考虑以下场景：

sequenceDiagram
    participant C as 协调者
    participant P1 as 参与者1
    participant P2 as 参与者2
    
    Note over C,P2: 第一阶段：准备
    C->>P1: PREPARE
    P1-->>C: VOTE_COMMIT
    C->>P2: PREPARE
    Note over P2: 协调者消息丢失
    P2-->>C: (未响应)
    
    Note over C,P2: 协调者超时等待
    C->>P2: COMMIT
    Note over C: 协调者认为 P2 已提交
    
    Note over P1,P2: 实际状态：P1 已提交，P2 不确定

在这个场景中，P2 在收到 PREPARE 后可能已经提交或回滚，但它的响应在网络中丢失。协调者超时后发送 COMMIT 指令，但无法确定 P2 的实际状态。

# 2PC 协调者的简化实现
class TwoPhaseCommitCoordinator:
    def __init__(self, transaction_id, participants):
        self.transaction_id = transaction_id
        self.participants = participants
        self.state = 'INIT'
        
    def commit(self):
        # 第一阶段：准备
        self.state = 'PREPARING'
        votes = []
        for participant in self.participants:
            try:
                response = participant.prepare()
                votes.append(response.vote)
            except TimeoutError:
                votes.append('NO')
        
        if all(v == 'COMMIT' for v in votes):
            # 第二阶段：提交
            self.state = 'COMMITTING'
            for participant in self.participants:
                try:
                    participant.commit()
                except:
                    # 提交失败后的处理
                    self.handle_commit_failure(participant)
        else:
            self.state = 'ROLLING_BACK'
            self.rollback()
            
    def handle_commit_failure(self, participant):
        """
        处理提交失败
        这里存在不确定性：参与者可能已提交，也可能还未提交
        """
        # 尝试重试
        for attempt in range(3):
            try:
                participant.commit()
                return
            except:
                continue
                
        # 重试失败，将失败记录写入事务日志
        # 等待人工干预或自动恢复
        self.write_transaction_log({
            'transaction_id': self.transaction_id,
            'participant': participant.id,
            'status': 'COMMIT_FAILED',
            'timestamp': time.time(),
        })

2.2 参与者超时后的决策困境

当参与者在"准备"阶段后等待协调者的最终指令时，如果协调者发生故障，参与者面临一个艰难的选择：无限期等待，还是单方面决定提交或回滚？

class Participant:
    def __init__(self, resource_id):
        self.resource_id = resource_id
        self.state = 'INIT'
        self.transaction_log = []
        
    def prepare(self):
        """
        执行准备阶段
        """
        try:
            # 尝试获取资源锁
            self.acquire_resource_lock()
            
            # 执行undo日志记录
            self.record_undo_log()
            
            self.state = 'PREPARED'
            return VoteResponse(vote='COMMIT')
            
        except Exception as e:
            self.state = 'ABORTED'
            return VoteResponse(vote='ABORT', reason=str(e))
            
    def wait_for_decision(self, timeout_seconds=30):
        """
        等待协调者的最终决策
        超时后的处理策略
        """
        import time
        
        deadline = time.time() + timeout_seconds
        
        while time.time() < deadline:
            if self.state in ['COMMITTED', 'ABORTED']:
                return self.state
            time.sleep(0.1)
            
        # 超时后的处理——这是反直觉的关键点
        # 不应该盲目回滚，而应该通过其他参与者判断全局状态
        return self.query_peers_for_decision()
    
    def query_peers_for_decision(self):
        """
        询问其他参与者关于全局事务状态的判断
        这是避免单方面决定导致不一致的关键
        """
        # 向其他参与者查询
        # 如果多数参与者已经提交，则提交
        # 如果多数参与者已经回滚，则回滚
        # 如果无法确定，维持当前状态并等待
        pass

三、TCC 模式的操作语义陷阱

3.1 Try-Confirm-Cancel 的幂等性挑战

TCC（Try-Confirm-Cancel）模式将事务分为三个阶段：

Try：预留资源
Confirm：确认使用预留资源
Cancel：释放预留资源

TCC 的关键特性是每个阶段都支持重试，这要求 Try、Confirm、Cancel 操作都是幂等的。然而，幂等性的实现远比想象中复杂。

class TCCTransaction:
    def __init__(self, transaction_id):
        self.transaction_id = transaction_id
        self.branches = []
        
    def try_phase(self):
        """
        Try 阶段：预留资源
        """
        for branch in self.branches:
            result = branch.try_reserve()
            if not result.success:
                # Try 失败，需要释放已预留的资源
                self.cancel_phase()
                return False
                
        return True
        
    def confirm_phase(self):
        """
        Confirm 阶段：确认使用预留资源
        """
        for branch in self.branches:
            # 幂等性保证：使用事务ID作为幂等键
            branch.confirm(idempotency_key=self.transaction_id)
            
    def cancel_phase(self):
        """
        Cancel 阶段：释放预留资源
        """
        for branch in self.branches:
            # 幂等性保证：使用事务ID作为幂等键
            branch.cancel(idempotency_key=self.transaction_id)

3.2 空回滚与悬挂问题

空回滚是指 Try 阶段未执行成功，但 Cancel 阶段被调用的情况。悬挂是指 Try 阶段执行超时失败，但 Confirm 阶段稍后被调用的情况。这两种异常场景需要特别处理。

class TCCParticipant:
    def __init__(self, resource_id):
        self.resource_id = resource_id
        self.state = 'INIT'
        self.try_result = None
        
    def try_reserve(self):
        """
        Try 阶段：尝试预留资源
        """
        try:
            # 预留资源
            self.try_result = self.do_reserve()
            self.state = 'TRIED'
            return TryResult(success=True)
        except Exception as e:
            self.state = 'TRY_FAILED'
            return TryResult(success=False, reason=str(e))
            
    def confirm(self, idempotency_key=None):
        """
        Confirm 阶段：确认预留
        """
        # 空确认检查：如果从未执行 Try，直接返回成功
        if self.state == 'INIT':
            return ConfirmResult(success=True, reason='empty_confirm')
            
        # 悬挂检查：如果 Try 失败，不应 Confirm
        if self.state == 'TRY_FAILED':
            return ConfirmResult(success=False, reason='try_failed_cannot_confirm')
            
        # 执行确认
        self.do_confirm()
        self.state = 'CONFIRMED'
        return ConfirmResult(success=True)
        
    def cancel(self, idempotency_key=None):
        """
        Cancel 阶段：释放预留
        """
        # 空回滚检查：如果从未执行 Try，直接返回成功
        if self.state == 'INIT':
            return CancelResult(success=True, reason='empty_cancel')
            
        # 悬挂检查：如果 Try 未完成，不应 Cancel
        if self.state not in ['TRIED', 'TRY_FAILED']:
            return CancelResult(success=False, reason='invalid_state_for_cancel')
            
        # 执行取消
        self.do_cancel()
        self.state = 'CANCELLED'
        return CancelResult(success=True)

四、分布式事务与本地消息表的实践

4.1 本地消息表的实现原理

本地消息表是一种将分布式事务转化为多个本地事务的解决方案。其核心思想是：把分布式事务的参与者拆分为若干个本地事务，通过消息队列协调它们之间的执行。

class LocalMessageTable:
    """
    本地消息表实现
    """
    def __init__(self, db_connection):
        self.db = db_connection
        
    def send_message(self, destination, message_body, idempotency_key=None):
        """
        发送消息到本地消息表
        这是一个独立的事务
        """
        with self.db.transaction():
            # 消息状态：PENDING, SENT, CONFIRMED, FAILED
            self.db.execute("""
                INSERT INTO local_messages (
                    idempotency_key, destination, body, status, created_at
                ) VALUES (?, ?, ?, 'PENDING', NOW())
            """, (idempotency_key, destination, message_body))
            
    def mark_as_sent(self, message_id):
        """标记消息已发送"""
        self.db.execute("""
            UPDATE local_messages 
            SET status = 'SENT', sent_at = NOW()
            WHERE id = ?
        """, (message_id,))
        
    def mark_as_confirmed(self, message_id):
        """标记消息已确认"""
        self.db.execute("""
            UPDATE local_messages 
            SET status = 'CONFIRMED', confirmed_at = NOW()
            WHERE id = ?
        """, (message_id,))
        
    def get_pending_messages(self, batch_size=100):
        """获取待发送消息（用于后台轮询）"""
        return self.db.query("""
            SELECT * FROM local_messages 
            WHERE status = 'PENDING'
            ORDER BY created_at
            LIMIT ?
        """, (batch_size,))

4.2 消息发送的事务性保证

本地消息表的核心价值在于：将"业务操作"和"消息发送"放在同一个本地事务中，要么都成功，要么都回滚。

class TransactionalOutboxPattern:
    """
    事务性发件箱模式
    """
    def execute_order_payment(self, order_id, amount):
        """
        订单支付——业务操作和消息发送在同一个事务中
        """
        with self.db.transaction() as tx:
            # 1. 扣减账户余额
            self.db.execute("""
                UPDATE accounts 
                SET balance = balance - ?
                WHERE user_id = ? AND balance >= ?
            """, (amount, user_id, amount))
            
            # 2. 更新订单状态
            self.db.execute("""
                UPDATE orders 
                SET status = 'PAID', paid_at = NOW()
                WHERE id = ?
            """, (order_id,))
            
            # 3. 写入本地消息表（在同一事务中）
            self.message_table.send_message(
                destination='order.payment.completed',
                message_body={
                    'order_id': order_id,
                    'amount': amount,
                    'paid_at': datetime.now().isoformat(),
                },
                idempotency_key=f'order_payment_{order_id}'
            )
            
        # 事务已提交，消息一定会被发送
        # 后台轮询会读取消息表并发送到 MQ
        # 如果发送失败，会重试直到成功
        
    def process_pending_messages(self):
        """
        后台进程：处理待发送消息
        """
        pending = self.message_table.get_pending_messages()
        
        for message in pending:
            try:
                # 发送到消息队列
                self.mq_client.send(
                    destination=message.destination,
                    body=message.body
                )
                
                # 发送成功，标记为已确认
                self.message_table.mark_as_confirmed(message.id)
                
            except Exception as e:
                # 发送失败，稍后重试
                # 注意：不要标记为失败，否则消息可能丢失
                continue