`await` 到底在等什么？从 Python 初学者到异步实战的完整理解

清水白石008

374人浏览 · 2026-04-25 07:28:48

清水白石008 · 2026-04-25 07:28:48 发布

`await` 到底在等什么？从 Python 初学者到异步实战的完整理解

如果你刚开始学习 Python 编程，第一次看到下面这段代码，很容易产生一种直觉：

async def fetch():
    data = await client.get("/users")
    return data

你可能会想：await 的意思是不是“等一下”？既然要等，那程序是不是就停住了？如果程序停住了，异步编程又为什么能提高性能？

这正是很多新人理解 asyncio 时最容易卡住的地方。

await 的确是在“等待”，但它等待的不是时间流逝，也不是让整个程序原地发呆；它等待的是一个可等待对象完成，并在等待期间把控制权交还给事件循环。

换句话说：

await 暂停的是当前协程，不是整个程序。

这篇文章会从 Python 语言设计、事件循环、协程调度、实战代码和最佳实践几个角度，把 await 讲透。

Python 诞生于 20 世纪 90 年代初，由 Guido van Rossum 创建，最初受到 ABC 语言影响，强调可读性、简洁性和高层数据结构表达能力。今天，它已经从脚本语言成长为 Web 开发、自动化、数据科学、人工智能和工程工具链中的核心语言之一。Python 官方文档也明确记录了它由 Guido 在 CWI 创建，并作为 ABC 语言的继任者发展而来。(Python documentation) Stack Overflow 2025 开发者调查提到，Python 从 2024 到 2025 的采用率继续明显增长，尤其受益于 AI、数据科学和后端开发场景。(Stack Overflow) 这也是为什么理解 Python 异步编程，已经不只是“高级技巧”，而是现代 Python 实战中的基本功。

一、`await` 等的到底是什么？

先给结论：

await 等的是一个 awaitable，也就是“可等待对象”的完成。

在 Python 里，常见的可等待对象主要有三类：

协程对象：由 async def 函数调用后返回。
Task：把协程包装成任务，交给事件循环调度。
Future：表示一个未来才会完成的异步结果。

Python 官方 asyncio 文档也把协程、Task 和 Future 归入异步编程中核心的 awaitable 类型；其中 Future 表示异步操作的最终结果，而 Task 用于调度协程运行。(Python documentation)

来看一个最小示例：

import asyncio

async def hello():
    return "Hello, asyncio"

async def main():
    result = await hello()
    print(result)

asyncio.run(main())

当执行到：

result = await hello()

程序做了几件事：

调用 hello()，得到一个协程对象
        ↓
await 这个协程对象
        ↓
当前 main 协程暂停
        ↓
事件循环开始/继续调度 hello
        ↓
hello 完成后返回结果
        ↓
main 从 await 处恢复执行

注意关键词：当前协程暂停。

不是线程暂停，不是进程暂停，也不是整个程序暂停。

二、用一句话解释 `await`

如果要用一句话给团队新人解释，可以这样说：

await 是当前协程对事件循环说：“我这里要等一个异步结果，你先去运行别的任务，结果好了再叫我回来。”

这句话里有三个关键点：

第一，await 发生在当前协程里。

第二，await 会把控制权交还给事件循环。

第三，事件循环可以趁等待期间去执行其他已经准备好的任务。

这就是为什么“等待”不等于“阻塞整个程序”。

三、为什么等待不等于阻塞整个程序？

我们先看同步版本。

import time

def fetch_user(user_id):
    time.sleep(1)
    return {"id": user_id}

start = time.time()

for i in range(5):
    print(fetch_user(i))

print("cost:", time.time() - start)

这里每次 time.sleep(1) 都会阻塞当前线程。5 个任务串行执行，总耗时大约 5 秒。

再看异步版本：

import asyncio
import time

async def fetch_user(user_id):
    await asyncio.sleep(1)
    return {"id": user_id}

async def main():
    start = time.time()

    tasks = [
        asyncio.create_task(fetch_user(i))
        for i in range(5)
    ]

    results = await asyncio.gather(*tasks)

    print(results)
    print("cost:", time.time() - start)

asyncio.run(main())

这段代码总耗时大约 1 秒。

原因不是 Python 突然让 5 个任务在 5 个 CPU 核心上并行计算，而是因为这 5 个任务大部分时间都在“等待”。当第一个任务执行到：

await asyncio.sleep(1)

它会暂停自己，把控制权还给事件循环。事件循环马上去推进第二个、第三个、第四个任务。等 1 秒后，这些任务陆续恢复。

事件循环的角色可以这样理解：

┌──────────────┐
│ 事件循环      │
└──────┬───────┘
       │
       ├── 运行 Task A
       │       └── 遇到 await，挂起
       │
       ├── 运行 Task B
       │       └── 遇到 await，挂起
       │
       ├── 运行 Task C
       │       └── 遇到 await，挂起
       │
       └── 等待 I/O 完成后恢复对应任务

Python 官方文档把事件循环称为每个 asyncio 应用的核心，它负责运行异步任务和回调，执行网络 I/O，并运行子进程。(Python documentation)

所以，await 的“等”不是傻等，而是让出执行权后的协作式等待。

四、回到场景代码：`await client.get("/users")`

再看这段代码：

async def fetch():
    data = await client.get("/users")
    return data

这里真正发生的事情取决于 client.get("/users") 返回什么。

如果 client 是一个异步 HTTP 客户端，那么 client.get("/users") 通常会返回一个协程对象，或者某种 awaitable。await 会等待这个 HTTP 请求完成。

大致流程是：

fetch 开始执行
    ↓
调用 client.get("/users")
    ↓
发起非阻塞网络请求
    ↓
当前 fetch 协程挂起
    ↓
事件循环去调度其他任务
    ↓
操作系统通知 socket 可读/请求完成
    ↓
事件循环恢复 fetch
    ↓
data 获得响应结果

这就是异步 I/O 的核心价值：网络请求在等待服务端响应时，CPU 不需要陪它一起发呆。

不过，这里有一个非常重要的前提：

client.get() 本身必须是异步友好的。

也就是说，它内部不能偷偷使用阻塞式网络请求。

比如下面这种写法是错误示范：

import requests

async def fetch_bad():
    response = requests.get("https://example.com/users")
    return response.text

虽然函数用了 async def，但 requests.get() 是同步阻塞调用。它会阻塞当前线程，也就阻塞了事件循环。

正确方向是使用异步 HTTP 客户端，例如：

import httpx
import asyncio

async def fetch_users():
    async with httpx.AsyncClient() as client:
        response = await client.get("https://example.com/users")
        return response.json()

asyncio.run(fetch_users())

这才是 await client.get(...) 真正发挥作用的场景。

五、`await` 不是“创建并发”的全部

很多新人还会犯另一个错误：以为只要写了 await，多个请求就会自动并发。

看下面这段代码：

async def main():
    user1 = await fetch_user(1)
    user2 = await fetch_user(2)
    user3 = await fetch_user(3)

    print(user1, user2, user3)

这其实是顺序等待。

执行顺序是：

等待 user1 完成
    ↓
等待 user2 完成
    ↓
等待 user3 完成

如果每个请求 1 秒，总耗时大约 3 秒。

要并发推进，需要先创建任务：

async def main():
    task1 = asyncio.create_task(fetch_user(1))
    task2 = asyncio.create_task(fetch_user(2))
    task3 = asyncio.create_task(fetch_user(3))

    user1, user2, user3 = await asyncio.gather(task1, task2, task3)

    print(user1, user2, user3)

或者更简洁：

async def main():
    results = await asyncio.gather(
        fetch_user(1),
        fetch_user(2),
        fetch_user(3),
    )

    print(results)

这时三个请求会被事件循环并发调度。

这里要记住一句工程口诀：

await 负责等待结果，create_task / gather 负责组织并发。

六、`await` 背后的底层模型：Future 与回调

为了更深入理解，我们可以把 await 想象成对一个“未来结果”的订阅。

比如：

data = await client.get("/users")

可以理解为：

我现在需要 data
但 data 还没准备好
所以我先暂停
等这个 Future 完成时
请从这里恢复我

Future 本质上代表一个未来才会出现的结果。它可能成功完成，也可能失败，也可能被取消。

Future 状态变化：

PENDING  ─────→  FINISHED
   │              │
   │              └── result / exception
   │
   └─────→  CANCELLED

当 Future 完成后，事件循环会恢复等待它的协程。

这就是为什么 await 写起来像同步代码，但执行模型是异步的。PEP 492 引入 async / await 的目标之一，就是让显式异步并发代码更容易书写、更接近同步代码的心智模型。(Python Enhancement Proposals (PEPs))

这也是 Python 异步语法优雅的地方：它没有让开发者满屏写回调，而是把“等待异步结果”的动作写成了直观的顺序代码。

七、实战案例：批量获取用户信息

假设我们要调用一个用户服务，一次获取 20 个用户信息。如果同步请求，接口响应慢时会很痛苦。下面用 asyncio.sleep() 模拟网络延迟。

import asyncio
import random
import time

async def fetch_user(user_id: int) -> dict:
    delay = random.uniform(0.3, 1.2)
    await asyncio.sleep(delay)

    return {
        "id": user_id,
        "name": f"user-{user_id}",
        "delay": round(delay, 2),
    }

async def main():
    start = time.time()

    tasks = [
        asyncio.create_task(fetch_user(i))
        for i in range(1, 21)
    ]

    users = await asyncio.gather(*tasks)

    for user in users:
        print(user)

    print("total cost:", round(time.time() - start, 2))

asyncio.run(main())

这段代码的总耗时通常接近最慢的那个请求，而不是 20 个请求耗时相加。

但在真实项目中，不能无限制并发。否则可能造成：

对方 API 被打爆；
本机连接数耗尽；
服务触发限流；
错误重试形成雪崩。

更稳妥的做法是加并发限制：

import asyncio
import random

sem = asyncio.Semaphore(5)

async def fetch_user(user_id: int) -> dict:
    async with sem:
        delay = random.uniform(0.3, 1.2)
        await asyncio.sleep(delay)

        return {
            "id": user_id,
            "name": f"user-{user_id}",
            "delay": round(delay, 2),
        }

async def main():
    results = await asyncio.gather(
        *(fetch_user(i) for i in range(1, 21))
    )
    print(results)

asyncio.run(main())

Semaphore(5) 的意思是：最多同时运行 5 个请求。

这就是 Python 实战里非常重要的一条经验：

异步不是并发越高越好，而是用可控并发换取稳定吞吐。

八、超时、异常与取消：生产代码不能只写 happy path

真实系统里，接口会超时，网络会抖动，服务会返回错误。好的异步代码必须处理这些问题。

1. 给请求加超时

import asyncio

async def fetch_with_timeout(user_id: int):
    try:
        return await asyncio.wait_for(fetch_user(user_id), timeout=1.0)
    except asyncio.TimeoutError:
        return {"id": user_id, "error": "timeout"}

2. 收集部分成功结果

默认情况下，asyncio.gather() 里某个任务抛异常，可能影响整体流程。可以这样处理：

async def safe_fetch(user_id: int):
    try:
        return await fetch_user(user_id)
    except Exception as exc:
        return {"id": user_id, "error": str(exc)}

async def main():
    results = await asyncio.gather(
        *(safe_fetch(i) for i in range(10))
    )
    print(results)

3. 取消任务

async def main():
    task = asyncio.create_task(fetch_user(1))

    await asyncio.sleep(0.1)

    task.cancel()

    try:
        await task
    except asyncio.CancelledError:
        print("task was cancelled")

取消任务在服务关闭、用户主动断开连接、批处理超时控制中非常常见。

九、常见误区：这些代码会阻塞事件循环

误区一：在异步函数里使用 `time.sleep`

import time

async def bad():
    time.sleep(3)

这是阻塞的。

正确写法：

import asyncio

async def good():
    await asyncio.sleep(3)

误区二：在异步函数里直接用同步 HTTP 库

import requests

async def bad_fetch():
    return requests.get("https://example.com").text

这会阻塞事件循环。

应该使用异步客户端，或者把同步阻塞函数放到线程里：

import asyncio
import requests

def blocking_fetch():
    return requests.get("https://example.com").text

async def main():
    html = await asyncio.to_thread(blocking_fetch)
    print(html[:100])

asyncio.run(main())

Python 文档中也把在线程中运行阻塞函数作为 asyncio 的一类常见能力，用于避免阻塞事件循环。(Python documentation)

误区三：CPU 密集计算也用 `await`

async def cpu_heavy():
    total = 0
    for i in range(100_000_000):
        total += i * i
    return total

这段代码虽然写了 async def，但函数体里没有真正让出控制权的 await。它会一直占着事件循环执行。

CPU 密集型任务应该考虑：

ProcessPoolExecutor
multiprocessing
NumPy / Pandas 向量化
C / Rust 扩展
任务队列

例如：

import asyncio
from concurrent.futures import ProcessPoolExecutor

def cpu_heavy(n: int) -> int:
    return sum(i * i for i in range(n))

async def main():
    loop = asyncio.get_running_loop()

    with ProcessPoolExecutor() as pool:
        result = await loop.run_in_executor(
            pool,
            cpu_heavy,
            50_000_000
        )

    print(result)

asyncio.run(main())

十、`await` 与线程是什么关系？

默认情况下，asyncio 事件循环通常运行在一个线程中。多个协程并不是自动跑到多个线程里，而是在同一个事件循环里协作式切换。

可以这样理解：

操作系统进程
└── 主线程
    └── asyncio 事件循环
        ├── Task A
        ├── Task B
        ├── Task C
        └── Task D

当 Task A 遇到 await，它暂停；事件循环切换到 Task B。这个过程不是操作系统线程切换，而是 Python 层面的协程调度。

所以：

await 不等于开线程。
async def 不等于多核并行。
asyncio 擅长 I/O 并发，不擅长直接加速 CPU 计算。

这也是新人必须建立的边界感。

十一、从基础到进阶：理解 Python 异步的学习路线

如果你是初学者，可以按这个顺序学习：

Python 基础语法
    ↓
函数、异常、上下文管理器
    ↓
生成器 yield
    ↓
协程 async / await
    ↓
asyncio 事件循环
    ↓
Task / Future / gather / timeout
    ↓
异步 HTTP、异步数据库、异步 Web 框架

如果你已经是资深开发者，可以进一步关注：

结构化并发；
任务取消传播；
背压设计；
限流与重试；
异步上下文管理器；
FastAPI 异步端点；
aiohttp / httpx 的连接池；
异步数据库驱动；
可观测性与链路追踪。

Python 的生态正在不断扩大。FastAPI、Streamlit、Pandas、PyTorch、Django、Flask 等工具分别服务于 Web、数据、AI、可视化和工程应用。异步编程则在高并发 Web API、爬虫、消息消费、实时推送、微服务聚合层中越来越常见。

十二、最佳实践清单：写给项目里的你

写异步代码时，建议遵守这些原则。

第一，确认库是真的异步。

# 好的方向
await async_client.get(url)

# 危险方向
requests.get(url)

第二，不要在协程里写阻塞代码。

# 错误
time.sleep(1)

# 正确
await asyncio.sleep(1)

第三，并发任务要集中管理。

tasks = [asyncio.create_task(work(i)) for i in range(10)]
results = await asyncio.gather(*tasks)

第四，外部调用必须加超时。

result = await asyncio.wait_for(fetch(), timeout=3)

第五，高并发要加限流。

sem = asyncio.Semaphore(20)

第六，CPU 密集任务不要硬塞进事件循环。

await asyncio.to_thread(blocking_io)
# 或者对 CPU 密集型任务使用 ProcessPoolExecutor

第七，让代码保持可读。

异步代码最怕“看起来很高级，实际上没人敢改”。好的 Python 最终仍然应该符合 Pythonic 精神：清晰、直接、可维护。

十三、最后总结：`await` 的真正含义

回到标题：await 到底在等待什么？

它等待的是一个可等待对象完成。

它暂停的是当前协程。

它释放的是事件循环的执行权。

它换来的是其他任务继续推进的机会。

最重要的是：

等待不是阻塞。阻塞是占着线程不放；await 是把控制权还给事件循环。

你可以把 await 想象成一个有礼貌的开发者：

“我现在需要一个结果，但这个结果还没准备好。与其让大家陪我一起干等，不如你们先忙。等它好了，再叫我回来。”

这就是异步编程最动人的地方。它不是为了炫技，而是为了让系统在面对等待时依然保持流动。一个成熟的 Python 工程师，真正要掌握的不是把所有函数都改成 async def，而是知道什么时候该等待，什么时候该并发，什么时候该限流，什么时候该换成线程池或进程池。

如果你正在学习 Python教程、Python实战、Python最佳实践，那么请记住这句最实用的话：

await 不是让整个程序停下来，而是让当前协程暂时让路。

互动问题

你在日常 Python 编程中遇到过哪些异步问题？是 await 没有并发起来，还是某个同步库偷偷阻塞了事件循环？

面对快速变化的 Python 生态，你认为未来的 Python 异步编程会更偏向框架封装，还是开发者仍然需要深入理解事件循环和协程模型？

欢迎把你的真实踩坑经历写下来。很多时候，一段失败的异步代码，比十段完美示例更能帮助后来者成长。

参考资料

Python 官方文档：asyncio 协程、Task、Future 与 awaitable。(Python documentation)
Python 官方文档：事件循环的职责与高级 API 建议。(Python documentation)
PEP 492：async / await 语法引入背景。(Python Enhancement Proposals (PEPs))
Python 官方历史与许可证说明。(Python documentation)
Stack Overflow Developer Survey 2025：Python 采用趋势。(Stack Overflow)

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

UWB-IMU、UWB定位对比研究（Matlab代码实现）

IMU的误差模型采用一阶马尔科夫噪声模型，将加速度计和陀螺仪噪声建立为高斯白噪声和Guass-Markov噪声。结论：UWB-IMU组合定位导航效果，比之单一的导航，效果很明显，尤其是当UWB布局上无法解决垂直空间分辨率低时，融合算法效果明显。目前使用实际数据，效果亦能控制在0.5m以内，定位精度还可以提升，已证明该滤波方法可靠有效。

AtomGit开源社区

2026 Android I/O ，全新 AI 手机、 Android PC 和自动驾驶

Android 正在全面 AI-first 化，而且不只是手机 OS，而是连接手机、手表、汽车、眼镜、笔记本的统一智能生态，其中 Gemini Intelligence 是灵魂。所以，你任何这次是「Android 有史以来最大更新之一」吗？

AtomGit开源社区

考虑电解槽变载启停特性与阶梯式碳交易机制的综合能源系统优化调度研究（Matlab代码实现）

此外，我们的研究还具有一定的创新性，为推动低碳经济发展提供了新的思路和方法。通过优化电解槽的变载启停特性和其他能源设施的运行，可以实现最小化碳排放的目标，使企业在碳交易中获得更大的经济收益。1. 基于电解槽特性的调度模型：该模型将考虑电解槽的变载启停特性，将其与其他能源设施的运行进行整合，建立一个综合的能源调度模型。研究该领域的目标是通过综合考虑电解槽的变载启停特性和阶梯式碳交易机制，优化能源系统