Pin、Unpin 与 Tokio 异步运行时：自引用结构在异步环境中的内存安全保证

邵宇然

171人浏览 · 2026-06-09 11:40:35

邵宇然 · 2026-06-09 11:40:35 发布

Pin、Unpin 与 Tokio 异步运行时：自引用结构在异步环境中的内存安全保证

cover

一、异步代码中的"地址敏感"困境：为什么 Future 不能被移动

Rust 的所有权系统在编译期保证了内存安全，但异步编程引入了一个新的挑战：Future 对象中可能包含自引用结构。当一个 async 函数被编译为状态机时，跨 await 点的局部变量会被保存在状态机的字段中。如果某个局部变量引用了同一状态机中的另一个字段，就形成了自引用——字段 A 的值是指向字段 B 的指针。

问题在于，Rust 的所有权模型默认允许值被移动（move），而移动会改变值的内存地址。如果包含自引用的 Future 被移动，内部指针仍然指向旧地址，形成悬垂指针——这是 Rust 安全性保证中最严重的违反。Pin 正是为了解决这个问题而引入的语言机制：通过类型系统约束，阻止包含自引用结构的值被移动。

二、Pin/Unpin 的类型系统设计：编译期约束与运行时保证的分层机制

Pin 的设计哲学是"零运行时开销的安全保证"。它通过两层机制协同工作：Unpin trait 作为编译期的"豁免标记"，Pin 包装器作为运行时的"地址锁定"。

graph TB
    subgraph 类型系统分层
        A[Unpin Trait<br/>自动实现的豁免标记<br/>表示类型可以安全移动]
        B[Pin&lt;P&gt; 包装器<br/>运行时地址锁定<br/>阻止被包装值移动]
    end

    subgraph 类型分类
        C[Unpin 类型<br/>大多数 Rust 类型<br/>String, Vec, HashMap<br/>可以自由移出 Pin]
        D[!Unpin 类型<br/>包含自引用的结构<br/>async fn 生成的 Future<br/>PhantomPinned 标记类型<br/>不能安全移出 Pin]
    end

    A --> C
    A -.->|未实现| D
    B --> D

    subgraph Pin 保证链路
        E[Pin&lt;&mut T&gt;<br/>可变引用被 Pin 包装] --> F[get_mut 方法<br/>T: Unpin 时可用<br/>否则返回 &mut 不安全]
        E --> G[get_unchecked_mut<br/>Unsafe 方法<br/>调用者保证不移动]
    end

    D --> E

Unpin 是默认行为。绝大多数 Rust 类型都自动实现了 Unpin trait——String、Vec、HashMap、所有基本类型。这些类型不包含自引用，移动它们不会破坏任何内部指针。对于 Unpin 类型，Pin 包装器实际上没有任何约束效果，Pin<&mut T> 和 &mut T 完全等价。

!Unpin 是例外情况。编译器为 async 函数生成的 Future 状态机通常不实现 Unpin，因为状态机字段之间可能存在自引用。开发者也可以通过嵌入 PhantomPinned 标记类型，手动将自定义结构标记为 !Unpin。

Pin 的保证机制。Pin<P> 包装一个指针类型 P，承诺被指向的值不会被移动。这个保证通过两个层面实现：对于 Unpin 类型，Pin 不提供任何额外保证（因为移动本身就是安全的）；对于 !Unpin 类型，Pin 的 get_mut 方法不可用，只有 get_unchecked_mut 可以获取可变引用，但调用者必须承诺不移动值。

三、Tokio 运行时中 Pin 的实际应用代码

以下代码展示在 Tokio 异步运行时中，Pin 如何保证 Future 的内存安全，以及如何正确处理 !Unpin 类型。

use std::pin::Pin;
use std::marker::PhantomPinned;
use std::future::Future;
use std::task::{Context, Poll};

/// 自引用结构：buffer 持有数据，pointer 引用 buffer 中的内容
/// 必须标记为 !Unpin，因为移动后 pointer 将成为悬垂指针
struct SelfReferential {
    buffer: String,
    pointer: *const str,       // 指向 buffer 内部的裸指针
    _pinned: PhantomPinned,    // 标记为 !Unpin
}

impl SelfReferential {
    /// 在 Pin 内部初始化自引用结构
    /// 这是唯一安全的构造方式：先创建再固定
    fn new(s: String) -> Pin<Box<Self>> {
        let mut boxed = Box::pin(SelfReferential {
            buffer: s,
            pointer: std::ptr::null(),  // 临时空指针
            _pinned: PhantomPinned,
        });

        // 在 Pin 保证下设置自引用指针
        // 安全性：boxed 已被 Pin 包装，后续不会被移动
        let self_ptr: *const String = &boxed.buffer;
        let buffer_content_start = (*self_ptr).as_ptr();
        let len = boxed.buffer.len();

        unsafe {
            // 创建指向 buffer 内容的胖指针
            let slice_ptr = std::ptr::slice_from_raw_parts(buffer_content_start, len);
            boxed.as_mut().get_unchecked_mut().pointer = slice_ptr as *const str;
        }

        boxed
    }

    /// 安全地读取自引用指针指向的内容
    fn get_content(self: &Pin<Box<Self>>) -> &str {
        // 安全性：self 被 Pin 保证不会被移动，pointer 始终有效
        unsafe { &*self.pointer }
    }
}

/// 自定义 Future：演示 Tokio 中 Pin 的使用
struct DelayedComputation {
    data: Pin<Box<SelfReferential>>,
    delay_ms: u64,
    started: bool,
}

impl Future for DelayedComputation {
    type Output = String;

    fn poll(mut self: Pin<&mut Self>, cx: &mut Context<'_>) -> Poll<Self::Output> {
        if !self.started {
            self.started = true;
            // 注册 waker，在延迟后被唤醒
            let waker = cx.waker().clone();
            let delay = self.delay_ms;
            std::thread::spawn(move || {
                std::thread::sleep(std::time::Duration::from_millis(delay));
                waker.wake();
            });
            return Poll::Pending;
        }

        // 计算完成，返回结果
        let content = self.data.get_content().to_string();
        Poll::Ready(content)
    }
}

/// 在 Tokio 运行时中使用
#[tokio::main]
async fn main() {
    let data = SelfReferential::new("hello, async world!".to_string());
    let future = DelayedComputation {
        data,
        delay_ms: 100,
        started: false,
    };

    // Tokio 的 spawn 要求 Future: Send + 'static
    // Pin 保证 Future 在执行期间不会被移动
    let handle = tokio::spawn(future);

    match handle.await {
        Ok(result) => println!("计算结果: {}", result),
        Err(e) => eprintln!("任务失败: {}", e),
    }
}

四、Pin 机制的代价：API 复杂度与 Unsafe 边界的权衡

Pin 机制虽然解决了自引用结构的内存安全问题，但引入了显著的 API 复杂度。

Pin 包装的类型传染。一旦一个类型被标记为 !Unpin，所有持有该类型的容器和 Future 都需要使用 Pin 包装。这种"传染性"导致异步代码的类型签名变得复杂——Pin<Box<dyn Future<Output = T>>> 比 Box<dyn Future<Output = T>> 更难阅读和理解。对于不熟悉 Pin 机制的开发者，这种复杂度会增加代码理解的门槛。

Unsafe 边界的扩大。Pin 的核心保证依赖 get_unchecked_mut 这个 unsafe 方法。在标准库和 Tokio 的实现中，unsafe 块的数量和范围比同步代码显著增加。虽然这些 unsafe 调用都经过了严格审查，但它们仍然是潜在的 UB（未定义行为）风险点。任何错误地使用 get_unchecked_mut 并移动了 !Unpin 的值，都会导致难以调试的内存安全问题。

与第三方库的兼容性。某些库的 API 设计没有考虑 Pin 约束，直接要求 &mut T 而非 Pin<&mut T>。将 !Unpin 类型与这些库集成时，需要额外的适配层，增加了代码复杂度。

适用边界。Pin 机制是 Rust 异步编程的底层基础设施，大多数开发者不需要直接操作 Pin——async/await 语法糖会自动处理。只有当需要手动实现 Future trait、构建自引用数据结构、或实现底层的异步运行时时，才需要深入理解 Pin 的机制。对于应用层开发者，理解"Future 不能被移动"这个约束就足够了。

五、总结

Pin 和 Unpin 是 Rust 异步运行时的基石机制，解决了自引用 Future 在移动后产生悬垂指针的内存安全问题。Unpin 作为编译期的豁免标记，让大多数类型免受 Pin 约束；Pin 包装器作为运行时的地址锁定，确保 !Unpin 类型的值在固定地址上存活。Tokio 运行时通过 Pin 保证 Future 在 poll 之间的地址稳定性，使得 async/await 语法能够安全地编译为状态机。Pin 的代价在于 API 复杂度和 unsafe 边界的扩大，但这些代价被限制在运行时和库的底层实现中，应用层开发者很少需要直接面对。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

深度学习模型优化利器：AIFengheshu/Plug-play-modules即插即用模块库深度解析与实战应用指南

极大地降低了深度学习模型改进的门槛。它让开发者不再受限于基础架构，而是能够像搭积木一样，灵活尝试各种前沿的注意力机制与卷积策略。无论是为了在学术竞赛中提升名次，还是在工业界落地中优化模型精度，这个项目都是一个值得深入挖掘和使用的强大工具库。

AtomGit开源社区

单相整流器整流电路pwm并网模型仿真研究（Simulink仿真实现）

单相PWM整流器作为低压并网发电、分布式储能、智能家居供电系统的核心电力电子装置，具备电能双向流动、电网谐波抑制、单位功率因数运行等优势，有效解决了传统二极管整流器谐波污染大、功率因数低、电能利用率不足的问题。为探究单相PWM整流器并网运行的稳态特性、动态响应及电能质量控制效果，本文依托电力电子仿真平台，搭建完整的单相PWM整流器并网仿真模型。