【由浅入深探究langchain】第十集-Agent的流式输出

Cha0DD

789人浏览 · 2026-03-24 13:45:00

Cha0DD · 2026-03-24 13:45:00 发布

前言

在构建 AI Agent 时，流式输出（Streaming）是提升用户体验的关键。它能让用户在模型思考或调用工具时实时看到进展，而不是盯着空白屏幕等待最终结果。

在 LangChain/LangGraph 的 agent.stream 方法中，最常用的两种模式是 values 和 messages。它们的应用场景和数据结构大不相同，让我们通过实战代码来拆解。

我们代码整理还是使用上一集中的代码，本集只放关键改动代码。

模式一

stream_mode="values" —— 获取状态全量快照

values 模式可以理解为 “状态快照”。每当 Agent 完成一个步骤（比如 LLM 决定调用工具、工具返回结果、LLM 生成最终回答），它都会返回当前状态中所有的消息列表。

for event in agent.stream(
    {"messages": [{"role": "user", "content": "What's the price of gold now?"}]},
    stream_mode="values"
):
    messages = event["messages"]
    print(f"--- 当前历史消息数量: {len(messages)} 条 ---")
    # 打印当前步骤产生的新消息
    for message in messages:
        message.pretty_print()

运行结果：

输出逻辑拆解

当我们询问金价时，控制台会分多次打印：

Step 1: 返回包含 Human Message 的列表（长度 1）。
Step 2: 返回包含 Human Message + AI Message (Tool Call) 的列表（长度 2）。
Step 3: 返回包含前两条 + Tool Message (结果) 的列表（长度 3）。
Step 4: 返回包含所有消息 + AI Message (最终回答) 的列表（长度 4）。

小技巧： 在 values 模式下，由于每次迭代都会返回整个消息历史，如果我们遍历整个列表打印，会导致前面的内容被重复打印。因此，通常我们只打印 messages[-1]，即当前步骤最新产生的消息。如下所示：

  # for message in messages:
  #     message.pretty_print()
  messages[-1].pretty_print()

模式二

stream_mode="messages" —— 获取 Token 级实时流

如果你想实现像 ChatGPT 那样“一个字一个字”蹦出来的效果，messages 模式是你的首选。它返回的是 消息碎片（Chunks），能够实时获取模型生成的每一个 Token。

for chunk in agent.stream(
    {"messages":[{"role":"user","content":"What's the price of gold now?"}]},
    stream_mode="messages" #token by token
):
    print(chunk)

结果展示：

在此模式下，每一个 chunk 包含两个部分：

AIMessageChunk: 包含当前的文本片段（如 content="I'll"）。
Metadata: 包含 LangGraph 的节点信息（如当前处于 model 节点还是 tools 节点）。

根据结构，我们修改打印语句

    # print(chunk)
    print(chunk[0].content,end="")

运行打印结果如下：

可以看到这句话里面，I'll check the current price of gold for you.是Ai Message的，gold's price is $2000是Tool Message，The current price of gold is $2000.是Ai Message的。

说明它不仅流式输出 AI 的话语，连工具返回的结果和最终总结都会以 Token 或碎片的形式实时推送到前端。

总结

特性	stream_mode="values"	stream_mode="messages"
返回内容	完整的状态/消息列表	单个消息碎片 (Chunks/Tokens)
颗粒度	步骤级 (Node level)	字符级 (Token level)
典型用途	监控 Agent 运行步骤、调试逻辑	实现打字机效果、实时 UI 更新
打印策略	打印 `messages[-1]` 防止重复	使用 `end=""` 实时拼接输出