深入Rust的Waker机制：手写Future与执行器

初学者，亦行者

698人浏览 · 2025-10-29 16:42:20

初学者，亦行者 · 2025-10-29 16:42:20 发布

下面这篇文章面向已经写过 async/await 的工程师，深入解析 Rust 的 Waker 与唤醒机制：从 poll 协议的底层语义，到如何手写 Future 与轻量执行器（executor），再到工程落地中的可证明性、可观测性与常见坑。

1. 心智模型：`poll`、`Context`、`Waker`

Rust 的异步是显式轮询模型：

每个 Future 实现 poll(self: Pin<&mut Self>, cx: &mut Context<'_>) -> Poll<T>。
若计算未准备好，返回 Poll::Pending，并注册一个唤醒器 Waker（从 cx.waker() 获取）。
当底层资源变为可继续（I/O 就绪、计时器触发、消息到达…），必须调用 Waker::wake() 或 wake_by_ref()，通知执行器“此任务可再次 poll”。
执行器负责在合适时机重新调度该 Future::poll。

Waker 不是“回调管道”，它只是一个轻量的可重入通知；真正的重复 poll 由执行器驱动。

2. `Waker` 的来源与形态

Waker 本质是一个类型擦除的 vtable 指针（RawWaker），包含三件事：clone、wake、wake_by_ref、drop。常见构造方式：

使用生态执行器（Tokio/async-std/Smol），由运行时生成；
用 futures 的 task::waker/ArcWake 自己构造（教学、内嵌场景常用）；
在自研执行器中手写 RawWakerVTable（进阶）。

语义差异：

wake(self) 按值消费 Waker；
wake_by_ref(&self) 借用唤醒，常用于不转移所有权的场景（大多数情况下推荐）。

3. 从零实现一个可被唤醒的 `Future`

我们实现一个“手动复位事件（ManualResetEvent）”式 Future：外部线程调用 set()，触发唤醒；Future 被再次 poll，返回 Ready.

use std::{
    future::Future, pin::Pin, task::{Context, Poll, Waker},
    sync::{Arc, Mutex}, sync::atomic::{AtomicBool, Ordering}
};

#[derive(Clone, Default)]
struct Inner {
    ready: AtomicBool,
    // 这里只缓存“最后一次”注册的 Waker；多消费者时应用更强的数据结构
    waker: Mutex<Option<Waker>>,
}

#[derive(Clone, Default)]
struct ManualReset {
    inner: Arc<Inner>,
}

impl ManualReset {
    fn new() -> Self { Self::default() }
    fn set(&self) {
        // 先置位，再唤醒（避免 lost wakeup）
        self.inner.ready.store(true, Ordering::Release);
        if let Some(w) = self.inner.waker.lock().unwrap().take() {
            w.wake(); // 通知执行器重新 poll
        }
    }
    fn reset(&self) {
        self.inner.ready.store(false, Ordering::Release);
    }
}

impl Future for ManualReset {
    type Output = ();
    fn poll(self: Pin<&mut Self>, cx: &mut Context<'_>) -> Poll<()> {
        // 快速路径：已准备好
        if self.inner.ready.load(Ordering::Acquire) {
            return Poll::Ready(());
        }
        // 未就绪：注册/更新 waker
        {
            let mut slot = self.inner.waker.lock().unwrap();
            // 只在必要时替换，减少可观测的唤醒风暴
            let replace = match slot.as_ref() {
                Some(old) => !old.will_wake(cx.waker()), // will_wake: 等价性判断
                None => true,
            };
            if replace {
                *slot = Some(cx.waker().clone());
            }
        }
        // 再次检查（“先注册再检查”可避免竞争时遗漏）
        if self.inner.ready.load(Ordering::Acquire) {
            Poll::Ready(())
        } else {
            Poll::Pending
        }
    }
}

关键工程点

顺序问题：set() 中“先置位，再唤醒”，poll() 中“先注册，再检查”。这对避免 lost wakeup 至关重要。
内存序：用 Release/Acquire 保证状态对被唤醒者可见。
waker 去重：will_wake 避免重复写入 Mutex<Option<Waker>> 导致的抖动。

4. 一个最小执行器：`ArcWake` + 工作队列

下面构造教学用单线程执行器：wake 时把任务重新推回队列，再 poll。

use futures::task::{ArcWake, waker_ref};
use std::{sync::{Arc, Mutex}, task::Context, future::Future, pin::Pin, collections::VecDeque};

struct Task {
    fut: Mutex<Pin<Box<dyn Future<Output=()> + Send>>>,
    queue: Arc<Queue>,
}
struct Queue {
    inner: Mutex<VecDeque<Arc<Task>>>,
}
impl Queue {
    fn push(&self, t: Arc<Task>) {
        self.inner.lock().unwrap().push_back(t);
    }
    fn pop(&self) -> Option<Arc<Task>> {
        self.inner.lock().unwrap().pop_front()
    }
}
impl ArcWake for Task {
    fn wake_by_ref(arc_self: &Arc<Self>) {
        arc_self.queue.push(arc_self.clone()); // 仅入队，不做重活
    }
}
fn run(mut tasks: Vec<Pin<Box<dyn Future<Output=()> + Send>>>) {
    let q = Arc::new(Queue { inner: Mutex::new(VecDeque::new()) });
    for fut in tasks.drain(..) {
        let t = Arc::new(Task { fut: Mutex::new(fut), queue: q.clone() });
        q.push(t);
    }
    // 事件循环
    while let Some(t) = q.pop() {
        let waker = waker_ref(&t);
        let mut cx = Context::from_waker(&waker);
        let mut fut = t.fut.lock().unwrap();
        if let std::task::Poll::Pending = fut.as_mut().poll(&mut cx) {
            // 未完成：等待下一次 wake 入队
        }
    }
}

将前面的 ManualReset 接入：

fn main() {
    let evt = ManualReset::new();
    let evt2 = evt.clone();
    let job = Box::pin(async move {
        // 等待被外界 set
        evt2.await;
        println!("resumed!");
    });
    // 在另一个线程触发 set
    std::thread::spawn({
        let evt3 = evt.clone();
        move || {
            std::thread::sleep(std::time::Duration::from_millis(100));
            evt3.set();
        }
    });
    run(vec![job]);
}

5. 从驱动到落地：与 I/O、计时器的对接

真实系统不靠 std::thread::sleep，而是把外部事件回调接到 Waker：

I/O：用 mio/epoll/kqueue 注册 fd，事件到达后在回调里 waker.wake()；Future::poll 中把 fd 注册到 reactor 并缓存 waker。
计时器：时间轮/小根堆管理到期时间；到期时 wake_by_ref；poll 中根据当前时间返回 Pending 或 Ready。
通道/队列：生产者在入队变非空时 wake；消费者的 Future::poll 注册 waker 并检查队列。

工程化要点

不要在 wake 里做重活：它只负责“入队或标记”，避免阻塞其他唤醒。
避免持锁回调 wake：把唤醒放到锁外，降低优先级反转与死锁风险。
多生产者：若一个 Future 需要多个来源唤醒，使用并发安全的 waker 列表（无锁栈/跨线程 mpsc），并做好去重或合并。

6. 常见坑与可证明性

lost wakeup（最致命）：错误的顺序会导致错过一次唤醒。牢记：
- 生产者：先置位，再唤醒；
- poll：先注册，再检查。
频繁 clone/替换 waker：使用 will_wake 减少不必要的写入；在高频 poll 的场景可显著降低锁竞争。
wake 风暴：多个事件源集中唤醒同一任务，入队去重（如任务状态 CAS 置位）降低无效调度。
跨线程可见性：选择合适的 Ordering（通常 Release/Acquire 即可），并确保唤醒与状态写入之间有因果。
错误处理：优先 Result/try_* 组合子，让“失败即短路唤醒”具备明确语义；在执行器统计“唤醒 → poll → 准备就绪”的命中率以观察抖动。

7. 与 Tokio 等运行时的关系

Tokio 同样基于 Future/Waker 协议，但提供：

更丰富的 reactor（I/O/计时器/信号）、调度器（多队列工作窃取）、任务取消/配额、阻塞隔离等；
任务生命周期管理（取消、预算、背压）与诊断（tracing）。
理解 Waker 让你能：
写出定制 Future（比如协议层零拷贝收发）；
在无需完整运行时时嵌入极小的执行器（嵌入式/插件场景）；
解读“为什么有时 await 频繁唤醒但性能不佳”，并从 粒度、去重、可见性 角度对症下药。

8. 小结

Waker 是 Rust 异步的“通知针脚”：它不做工作，只告诉执行器“请再 poll 我”。真正的正确性来自轮询协议（先注册再检查）与内存可见性，真正的性能来自粒度控制、唤醒去重、唤醒不做重活。当你能自信地手写上面的 ManualReset 与最小执行器，就具备了在生产里解释现象→定位抖动→精确修复的能力。🚀