被Token坑惨后我悟了：LangGraph比LangChain省一半成本，原因就这两点

小小程序猿~~~

1196人浏览 · 2026-03-27 19:43:26

小小程序猿~~~ · 2026-03-27 19:43:26 发布

大家好，我是杯子，最近天天和 LLM 打交道的开发者。

最近我被 OpenAI 的账单狠狠“教育”了一次：一个月光 LangChain Agent 的 Token 费用就要到四位数了。我翻着日志一看——全是重复调用。每次用户问个简单问题，Agent 都要先想、再查、再总结……LLM 被反复唤醒，上下文越滚越大，Token 像不要钱一样往外烧。

直到我把 Agent 全部重构成了 LangGraph后，同样的业务，Token 消耗直接腰斩。今天把核心的两个省 Token 逻辑讲透，让大家少走我踩过的坑。

一、LangChain Agent：全自动浪费的“完美”流程

用 LangChain 写带工具的 Agent 时，框架帮你把一切都“自动化”了，听起来很香，但实际上是自动烧钱：

第一次 LLM 调用：把用户问题 + 系统 Prompt + 工具描述塞进上下文，让 LLM 决定「要不要用工具」。
执行工具：调用工具，拿到结果。
第二次 LLM 调用：把工具返回结果再塞回上下文，让 LLM 做最终总结并输出答案。

关键问题来了：
这两次 LLM 调用是强制绑定的。即使工具返回的结果已经足够清晰（比如查到了精确答案），框架还是会再调用一次 LLM 去“润色”。

我测过一个最简单的“查询天气” Agent：

LangChain 平均每次请求 2 次 LLM 调用
Token 消耗 ≈ 1200 tokens（含上下文膨胀）

这还没算上多工具、多轮对话时上下文越滚越大的情况。LangChain 就像一台全自动洗衣机，你只能选“标准模式”，想省水省电？门都没有。

二、LangGraph：你手动省油，想省就省

LangGraph 把 Agent 拆成一张状态图（StateGraph），每一步你自己决定怎么走。核心省钱逻辑就两点：

1. 工具调用后，你可以直接跳过第二次 LLM 调用

# LangGraph 伪代码（超级简洁）
def route_after_tool(state):
    if tool_result_is_enough(state["messages"]):  # 你自己判断
        return "END"          # 直接结束！不走第二次 LLM
    else:
        return "llm"          # 需要 LLM 再总结才走

graph = StateGraph(AgentState)
graph.add_node("tools", tool_node)
graph.add_node("llm", llm_node)
graph.add_conditional_edges("tools", route_after_tool)