LangGraph 扩展开发:自定义节点与插件生态的构建方法

关键词:LangGraph、大语言模型应用开发、自定义节点、插件生态、StateGraph、LangChain、事件驱动编程

摘要:本文将像“教小学生搭积木式编程宇宙飞船”一样,带你从0到1理解LangGraph的核心架构与扩展机制,一步步构建可复用的自定义节点、完整的功能插件,甚至探索LangGraph插件生态的设计原则与最佳实践。文章涵盖了问题背景、核心概念拆解、ER实体关系与交互架构图、核心扩展算法、Python源代码实现、数学模型支撑、项目实战案例、边界外延分析、常见问题、未来趋势等全方位内容,适合从LangChain/LangGraph入门开发者到高级架构师阅读参考。


背景介绍:从LangChain到LangGraph,积木式大模型应用的“二次革命”

目的和范围

目的

想象一下:你以前用LangChain搭大模型应用,就像用带固定说明书的乐高零件——只能按给出的“链条”(Chain)或“代理人工作流”(Agent)拼简单的模型,稍微复杂点(比如要循环迭代多次思考、根据不同条件跳转到完全不同的流程、保存中间复杂状态)就会拼得手忙脚乱,甚至散架。

现在有了LangGraph,你拿到的是自由编程的“可拼接电路板”——你可以自己设计“芯片”(自定义节点)、自己焊“连接线”(自定义边)、自己加“电源控制逻辑”(条件/循环/终止规则),甚至可以把常用的“模块电路板”(插件)打包起来,以后直接插在大项目上就行!

本文的核心目的,就是帮你掌握如何设计、实现、调试、封装、分享LangGraph的自定义节点与插件,并初步理解构建企业级/社区级LangGraph插件生态的底层逻辑。

范围
  1. 深度覆盖自定义节点开发全流程:包括节点类型选择(Stateful/Stateless、Action/Condition/Terminate)、状态管理机制(State的定义、读写规则、序列化与持久化)、事件监听与回调机制、调试技巧等。
  2. 完整讲解插件生态的构建方法:包括插件的封装标准、插件的加载机制、插件的测试与文档规范、插件的发布流程等。
  3. 提供1-2个完整的实战案例:比如“多轮迭代的代码生成插件”、“多模态文档解析的自定义节点生态”。
  4. 初步探索LangGraph的边界与未来趋势:比如LangGraph与其他大模型编排框架(如CrewAI、AutoGPT Next、LlamaIndex Workflows)的对比,LangGraph在多Agent协作、实时流式处理、边缘部署等场景的应用前景。

预期读者

  • 初级入门者:已经用过LangChain搭过简单的问答链、文档检索链,想进一步学习更灵活的大模型应用编排。
  • 中级开发者:已经掌握了LangGraph的基本用法(StateGraph的定义、内置节点的使用),想开发自己的自定义节点和插件。
  • 高级架构师:想为团队或社区构建一套可复用的LangGraph插件生态,或者想评估LangGraph在企业级项目中的适用性。
  • 大模型应用产品经理:想了解LangGraph的技术边界,以便设计更合理的大模型应用产品。

文档结构概述

本文的结构参考了“搭积木式编程宇宙飞船”的流程,分为以下几个主要部分:

  1. 飞船舱室拆解(核心概念与联系):带你拆解LangGraph这艘宇宙飞船的核心舱室(State、Node、Edge、StateGraph、Plugin),用小学生能理解的比喻解释每个舱室的功能,以及它们之间的关系(ER图、交互架构图)。
  2. 核心舱室设计原理(核心算法原理与操作步骤):讲解自定义节点和插件的核心设计原理,比如State的读写算法、自定义节点的注册机制、插件的加载与卸载算法等。
  3. 数学燃料舱(数学模型与公式):介绍支撑LangGraph运行的数学模型,比如State的马尔可夫决策过程模型、插件生态的推荐算法模型等(尽量用通俗易懂的语言解释,避免复杂的数学推导)。
  4. 舱室建造(项目实战:代码实际案例和详细解释说明):带你从零到一建造两个核心舱室——“多轮迭代代码生成节点”和“多模态文档解析插件生态”,包括开发环境搭建、源代码详细实现、代码解读与分析、测试与调试等。
  5. 宇宙飞行场景(实际应用场景):介绍LangGraph自定义节点与插件生态在不同场景的应用,比如多Agent协作的科研助手、实时流式处理的客服机器人、边缘部署的离线翻译器等。
  6. 工具箱(工具和资源推荐):推荐一些开发LangGraph自定义节点和插件生态的工具和资源,比如LangGraph官方文档、LangChain Hub、LangSmith调试工具、自定义节点测试框架等。
  7. 未来宇宙探索(未来发展趋势与挑战):介绍LangGraph的未来发展趋势,比如多模态节点的原生支持、实时流式插件生态的完善、跨平台插件的支持等,同时也会分析当前面临的挑战,比如插件的安全性、性能优化、兼容性等。
  8. 太空站总结(总结:学到了什么?):用小学生能理解的语言总结本文的主要内容,再次强调核心概念和它们之间的关系。
  9. 太空探索思考题(思考题:动动小脑筋):提出一些思考题,鼓励读者进一步思考和应用所学知识。
  10. 太空站FAQ(附录:常见问题与解答):解答一些开发LangGraph自定义节点和插件生态时常见的问题。
  11. 太空航行手册(扩展阅读 & 参考资料):列出一些扩展阅读和参考资料,帮助读者进一步深入学习。

术语表

核心术语定义
  1. LangGraph:由LangChain团队开发的大语言模型应用编排框架,基于StateGraph(状态图)的概念,允许开发者灵活地设计、实现、调试大模型应用的工作流。
  2. State(状态):LangGraph宇宙飞船的“燃料箱+数据舱+日志舱”,保存了工作流运行过程中的所有中间数据、状态信息、日志信息等。
  3. Node(节点):LangGraph宇宙飞船的“核心舱室”,执行具体的任务,比如调用大语言模型、检索文档、解析数据等。节点分为内置节点和自定义节点。
  4. Edge(边):LangGraph宇宙飞船的“连接线+控制器”,连接不同的节点,定义了工作流的跳转规则,比如条件跳转、循环跳转、终止规则等。
  5. StateGraph(状态图):由State、Node、Edge组成的完整工作流模型,就像LangGraph宇宙飞船的“设计图纸”。
  6. Plugin(插件):由一组相关的自定义节点、State定义、Edge定义、工具函数、测试用例、文档等组成的可复用模块,就像LangGraph宇宙飞船的“可插拔模块电路板”。
  7. Stateless Node(无状态节点):执行任务时不需要读取或修改State的节点,就像LangGraph宇宙飞船的“独立传感器”,只负责收集外部数据。
  8. Stateful Node(有状态节点):执行任务时需要读取或修改State的节点,就像LangGraph宇宙飞船的“核心处理器”,负责处理State中的数据。
  9. Action Node(动作节点):执行具体动作的节点,比如调用大语言模型、检索文档、发送邮件等,是LangGraph中最常用的节点类型。
  10. Condition Node(条件节点):根据State中的数据判断工作流的跳转方向的节点,就像LangGraph宇宙飞船的“导航仪”。
  11. Terminate Node(终止节点):结束工作流运行的节点,就像LangGraph宇宙飞船的“着陆按钮”。
  12. Event(事件):LangGraph工作流运行过程中发生的特定事情,比如节点开始执行、节点执行完成、节点执行失败、State发生变化等。
  13. Callback(回调):当事件发生时自动执行的函数,就像LangGraph宇宙飞船的“警报系统”。
  14. LangSmith:由LangChain团队开发的大语言模型应用调试、评估、监控平台,可以帮助开发者调试LangGraph工作流,分析节点的执行情况,评估大模型的输出质量等。
相关概念解释
  1. LangChain:由LangChain团队开发的大语言模型应用开发框架,提供了大量的内置组件(比如Models、Prompts、Chains、Agents、Tools等),可以帮助开发者快速搭建大模型应用。
  2. 马尔可夫决策过程(MDP):一种数学模型,用于描述决策过程,其中下一个状态只依赖于当前状态和当前动作,而与之前的状态和动作无关。LangGraph的StateGraph本质上就是一个基于MDP的决策模型。
  3. 事件驱动编程(EDP):一种编程范式,其中程序的执行流程由事件(比如用户输入、节点执行完成、节点执行失败等)驱动,而不是由代码的顺序执行驱动。LangGraph的工作流运行机制就是基于事件驱动编程的。
  4. 可复用组件(Reusable Component):一种可以在多个项目中重复使用的软件组件,比如自定义节点、插件、工具函数等。
  5. 模块化设计(Modular Design):一种软件设计方法,将软件系统分解为多个独立的、可复用的模块,每个模块负责一个特定的功能,模块之间通过接口进行交互。
缩略词列表
  1. LLM:Large Language Model(大语言模型)
  2. NLP:Natural Language Processing(自然语言处理)
  3. MDP:Markov Decision Process(马尔可夫决策过程)
  4. EDP:Event-Driven Programming(事件驱动编程)
  5. API:Application Programming Interface(应用程序编程接口)
  6. JSON:JavaScript Object Notation(JavaScript对象表示法)
  7. YAML:YAML Ain’t Markup Language(YAML不是标记语言)
  8. Poetry:Python的依赖管理和打包工具
  9. Pip:Python的包管理工具
  10. VS Code:Visual Studio Code(微软开发的代码编辑器)

核心概念与联系:拆解LangGraph宇宙飞船的核心舱室

故事引入:小明的“太空探险任务助手”

想象一下,小明是一个太空迷,他想设计一个“太空探险任务助手”大模型应用,帮助他规划太空探险任务。具体需求如下:

  1. 第一步:助手需要接收小明的太空探险任务需求(比如“我想在2025年去火星探险,预算是10亿美元,时间是3个月”)。
  2. 第二步:助手需要根据任务需求,调用大语言模型生成初步的任务规划(比如任务目标、任务步骤、所需设备、所需人员等)。
  3. 第三步:助手需要根据初步的任务规划,调用不同的工具检索相关的信息(比如火星的气候条件、火星的着陆地点、所需设备的价格、所需人员的资质等)。
  4. 第四步:助手需要根据检索到的信息,调用大语言模型修改任务规划,直到任务规划满足小明的所有需求(比如预算不超过10亿美元,时间不超过3个月,着陆地点安全等)。
  5. 第五步:助手需要将最终的任务规划输出给小明。

一开始,小明用LangChain的Agent(比如ZeroShotAgent、ReActAgent)搭这个应用,但是很快就遇到了问题:

  1. 循环迭代次数不够:Agent默认的循环迭代次数只有3-5次,有时候任务规划修改几次还不能满足需求,Agent就会自动停止。
  2. 条件跳转不够灵活:Agent默认的条件跳转规则比较简单,比如当任务规划满足需求时就停止,当工具调用失败时就重试,但是小明希望当检索到的信息不够时,就先调用另一个工具检索更多的信息,再修改任务规划。
  3. 中间状态保存不够方便:Agent默认的中间状态保存在内存中,小明希望将中间状态保存到数据库中,以便以后查看和修改。
  4. 调试不够方便:当Agent运行出错时,很难找到出错的原因,不知道是哪个步骤出了问题。

后来,小明听说了LangGraph,就用LangGraph重新搭了这个应用,结果所有的问题都解决了!

  1. 循环迭代次数可以自由控制:小明可以在State中保存循环迭代的次数,当循环迭代次数超过一定值时,就自动停止,或者当任务规划满足需求时才停止。
  2. 条件跳转可以自由设计:小明可以自己设计条件跳转规则,比如当检索到的信息不够时,就跳转到“检索更多信息”的节点,当任务规划满足需求时,就跳转到“终止节点”,当工具调用失败时,就跳转到“重试工具调用”的节点。
  3. 中间状态可以自由保存:小明可以自己定义State的序列化和持久化规则,将中间状态保存到数据库中,或者保存到文件中。
  4. 调试非常方便:小明可以使用LangSmith调试工具,查看LangGraph工作流的运行情况,每个节点的输入和输出,每个条件跳转的判断结果,每个循环迭代的次数等。

那么,小明是如何用LangGraph搭这个应用的呢?接下来,我们就来拆解LangGraph宇宙飞船的核心舱室,看看每个舱室的功能,以及它们之间的关系。

核心概念解释(像给小学生讲故事一样)

核心概念一:State(状态)——LangGraph宇宙飞船的“全能舱”

想象一下,你要去太空探险,需要带什么东西呢?

  1. 燃料:保证宇宙飞船能飞到目的地。
  2. 食物和水:保证你在太空探险期间不会饿死或渴死。
  3. 太空服和设备:保证你能在太空行走和完成任务。
  4. 日志本:记录你在太空探险期间的所有经历和发现。
  5. 导航仪:告诉你当前的位置和目的地的位置。
  6. 任务清单:告诉你需要完成的任务和当前的进度。

LangGraph宇宙飞船的State,就是这样一个“全能舱”,它保存了工作流运行过程中的所有中间数据、状态信息、日志信息等,就像你的太空探险背包一样,你需要什么东西,就从背包里拿,你有什么新的东西,就放进背包里。

举个例子,在小明的“太空探险任务助手”应用中,State可能包含以下内容:

  1. task_requirement:小明的太空探险任务需求(比如“我想在2025年去火星探险,预算是10亿美元,时间是3个月”)。
  2. preliminary_plan:初步的任务规划(比如任务目标、任务步骤、所需设备、所需人员等)。
  3. retrieved_info:检索到的相关信息(比如火星的气候条件、火星的着陆地点、所需设备的价格、所需人员的资质等)。
  4. current_plan:当前的任务规划(可能已经修改了几次)。
  5. is_plan_satisfied:当前的任务规划是否满足小明的所有需求(True或False)。
  6. iteration_count:循环迭代的次数(比如1、2、3等)。
  7. max_iteration_count:最大的循环迭代次数(比如10、20等)。
  8. log:工作流运行过程中的所有日志信息(比如“节点generate_preliminary_plan开始执行”、“节点generate_preliminary_plan执行完成,输出的初步任务规划是…”、“节点retrieve_info开始执行”等)。

在LangGraph中,State可以是任意Python类型,比如字典(dict)、列表(list)、类(class)、数据类(dataclass)等,但是推荐使用TypedDictPydantic BaseModel,因为它们可以提供类型提示,帮助开发者避免类型错误,同时也可以提供序列化和反序列化的功能,方便保存和加载State。

核心概念二:Node(节点)——LangGraph宇宙飞船的“核心舱室”

想象一下,你的太空探险宇宙飞船有哪些核心舱室呢?

  1. 驾驶舱:负责驾驶宇宙飞船,控制宇宙飞船的飞行方向和速度。
  2. 导航舱:负责计算宇宙飞船的飞行路线,判断宇宙飞船的位置和目的地的位置。
  3. 生活舱:负责提供食物和水,让你在太空探险期间休息和娱乐。
  4. 任务舱:负责完成太空探险任务,比如采集火星的土壤样本,拍摄火星的照片等。
  5. 着陆舱:负责让宇宙飞船安全着陆到火星上。

LangGraph宇宙飞船的Node,就是这样一个个“核心舱室”,每个节点负责执行一个具体的任务,就像你的太空探险宇宙飞船的每个核心舱室负责一个具体的功能一样。

举个例子,在小明的“太空探险任务助手”应用中,可能包含以下节点:

  1. generate_preliminary_plan_node:负责接收小明的太空探险任务需求,调用大语言模型生成初步的任务规划。
  2. retrieve_info_node:负责根据初步的任务规划或当前的任务规划,调用不同的工具检索相关的信息。
  3. check_info_sufficiency_node:负责检查检索到的信息是否足够,如果不够,就跳转到retrieve_info_node继续检索更多的信息,如果足够,就跳转到modify_plan_node修改任务规划。
  4. modify_plan_node:负责根据检索到的信息,调用大语言模型修改任务规划。
  5. check_plan_satisfaction_node:负责检查当前的任务规划是否满足小明的所有需求,如果满足,就跳转到terminate_node结束工作流,如果不满足,就跳转到update_iteration_count_node更新循环迭代的次数。
  6. update_iteration_count_node:负责更新循环迭代的次数,然后检查循环迭代的次数是否超过最大的循环迭代次数,如果超过,就跳转到terminate_node结束工作流,如果不超过,就跳转到retrieve_info_node继续检索相关的信息。
  7. terminate_node:负责结束工作流运行,将最终的任务规划输出给小明。

在LangGraph中,节点分为内置节点自定义节点,内置节点是LangGraph团队已经开发好的节点,可以直接使用,比如:

  1. END:终止节点,用于结束工作流运行。
  2. START:起始节点,用于标记工作流的开始。
  3. ToolNode:工具节点,用于调用LangChain的Tools。
  4. LLMNode:大语言模型节点,用于调用LangChain的LLMs。
  5. ConditionalEdgeNode:条件节点,用于根据State中的数据判断工作流的跳转方向。

自定义节点是开发者自己开发的节点,可以根据具体的需求执行任意的任务,是本文的核心内容之一。

节点还可以分为无状态节点(Stateless Node)有状态节点(Stateful Node),无状态节点执行任务时不需要读取或修改State,比如接收外部数据的节点;有状态节点执行任务时需要读取或修改State,是LangGraph中最常用的节点类型。

节点还可以分为动作节点(Action Node)条件节点(Condition Node)终止节点(Terminate Node),动作节点执行具体的动作,比如调用大语言模型、检索文档、发送邮件等;条件节点根据State中的数据判断工作流的跳转方向;终止节点结束工作流运行。

核心概念三:Edge(边)——LangGraph宇宙飞船的“连接线+控制器”

想象一下,你的太空探险宇宙飞船的核心舱室之间是怎么连接的呢?

  1. 驾驶舱和导航舱之间:有一条连接线,导航舱可以将计算好的飞行路线发送给驾驶舱,驾驶舱可以根据飞行路线控制宇宙飞船的飞行方向和速度。
  2. 驾驶舱和任务舱之间:有一条连接线,驾驶舱可以将当前的位置发送给任务舱,任务舱可以根据当前的位置决定是否开始执行任务。
  3. 任务舱和着陆舱之间:有一条连接线,任务舱可以将任务完成的消息发送给着陆舱,着陆舱可以根据消息决定是否开始准备着陆。

不仅如此,这些连接线还有控制器,可以控制信号的传输方向和传输条件,比如:

  1. 只有当导航舱计算好飞行路线之后,才会将飞行路线发送给驾驶舱。
  2. 只有当宇宙飞船到达任务地点之后,驾驶舱才会将当前的位置发送给任务舱。
  3. 只有当任务完成之后,任务舱才会将任务完成的消息发送给着陆舱。

LangGraph宇宙飞船的Edge,就是这样一条条“连接线+控制器”,它连接不同的节点,定义了工作流的跳转规则,比如条件跳转、循环跳转、终止规则等。

举个例子,在小明的“太空探险任务助手”应用中,可能包含以下边:

  1. START → generate_preliminary_plan_node:起始节点连接到生成初步任务规划的节点,当工作流开始运行时,首先执行生成初步任务规划的节点。
  2. generate_preliminary_plan_node → retrieve_info_node:生成初步任务规划的节点连接到检索信息的节点,当生成初步任务规划的节点执行完成后,执行检索信息的节点。
  3. retrieve_info_node → check_info_sufficiency_node:检索信息的节点连接到检查信息是否足够的节点,当检索信息的节点执行完成后,执行检查信息是否足够的节点。
  4. check_info_sufficiency_node → retrieve_info_node(条件:信息不够):检查信息是否足够的节点连接到检索信息的节点,当检查到信息不够时,跳转到检索信息的节点继续检索更多的信息。
  5. check_info_sufficiency_node → modify_plan_node(条件:信息足够):检查信息是否足够的节点连接到修改任务规划的节点,当检查到信息足够时,跳转到修改任务规划的节点修改任务规划。
  6. modify_plan_node → check_plan_satisfaction_node:修改任务规划的节点连接到检查任务规划是否满足需求的节点,当修改任务规划的节点执行完成后,执行检查任务规划是否满足需求的节点。
  7. check_plan_satisfaction_node → terminate_node(条件:任务规划满足需求):检查任务规划是否满足需求的节点连接到终止节点,当检查到任务规划满足需求时,跳转到终止节点结束工作流。
  8. check_plan_satisfaction_node → update_iteration_count_node(条件:任务规划不满足需求):检查任务规划是否满足需求的节点连接到更新循环迭代次数的节点,当检查到任务规划不满足需求时,跳转到更新循环迭代次数的节点。
  9. update_iteration_count_node → terminate_node(条件:循环迭代次数超过最大值):更新循环迭代次数的节点连接到终止节点,当检查到循环迭代次数超过最大值时,跳转到终止节点结束工作流。
  10. update_iteration_count_node → retrieve_info_node(条件:循环迭代次数未超过最大值):更新循环迭代次数的节点连接到检索信息的节点,当检查到循环迭代次数未超过最大值时,跳转到检索信息的节点继续检索相关的信息。

在LangGraph中,边分为普通边(Normal Edge)条件边(Conditional Edge),普通边是没有条件的边,当一个节点执行完成后,直接跳转到另一个节点;条件边是有条件的边,当一个节点执行完成后,根据State中的数据判断跳转到哪个节点。

核心概念四:StateGraph(状态图)——LangGraph宇宙飞船的“设计图纸”

想象一下,你要建造一艘太空探险宇宙飞船,首先需要什么呢?当然是设计图纸!设计图纸上会画出宇宙飞船的所有核心舱室,以及它们之间的连接线和控制器,告诉你每个核心舱室的功能,以及它们之间的交互规则。

LangGraph宇宙飞船的StateGraph,就是这样一张“设计图纸”,它由State、Node、Edge组成,定义了工作流的所有规则,就像你建造太空探险宇宙飞船的设计图纸一样。

举个例子,在小明的“太空探险任务助手”应用中,StateGraph的设计图纸可能是这样的:

  1. State定义:使用TypedDict或Pydantic BaseModel定义State,包含task_requirement、preliminary_plan、retrieved_info、current_plan、is_plan_satisfied、iteration_count、max_iteration_count、log等字段。
  2. 节点定义:定义generate_preliminary_plan_node、retrieve_info_node、check_info_sufficiency_node、modify_plan_node、check_plan_satisfaction_node、update_iteration_count_node、terminate_node等节点。
  3. 边定义:定义START→generate_preliminary_plan_node、generate_preliminary_plan_node→retrieve_info_node、retrieve_info_node→check_info_sufficiency_node等边,包括普通边和条件边。

在LangGraph中,StateGraph是通过langgraph.graph.StateGraph类创建的,创建StateGraph的步骤如下:

  1. 导入必要的模块:比如langgraph.graph.StateGraph、langchain_core.pydantic_v1.BaseModel、langchain_core.pydantic_v1.Field等。
  2. 定义State:使用TypedDict或Pydantic BaseModel定义State。
  3. 创建StateGraph对象:传入State作为参数。
  4. 添加节点:使用add_node方法添加节点。
  5. 添加边:使用add_edge方法添加普通边,使用add_conditional_edges方法添加条件边。
  6. 设置起始节点:使用set_entry_point方法设置起始节点。
  7. 编译StateGraph:使用compile方法编译StateGraph,得到一个可运行的CompiledGraph对象。
核心概念五:Plugin(插件)——LangGraph宇宙飞船的“可插拔模块电路板”

想象一下,你有一艘太空探险宇宙飞船,但是你想让它具备更多的功能,比如:

  1. 多模态图像采集功能:可以采集火星的可见光图像、红外图像、紫外图像等。
  2. 多语言翻译功能:可以将火星的土壤样本分析报告翻译成中文、英文、法文、德文等多种语言。
  3. 实时通信功能:可以和地球的指挥中心实时通信,发送火星的照片和视频,接收地球指挥中心的指令。

但是你不想重新建造一艘宇宙飞船,怎么办呢?你可以使用可插拔模块电路板!这些模块电路板已经封装好了所有的功能,你只需要将它们插在宇宙飞船的主板上,宇宙飞船就具备了相应的功能。

LangGraph宇宙飞船的Plugin,就是这样一个个“可插拔模块电路板”,它由一组相关的自定义节点、State定义、Edge定义、工具函数、测试用例、文档等组成,可以在多个项目中重复使用,就像你太空探险宇宙飞船的可插拔模块电路板一样。

举个例子,你可以开发一个**“多轮迭代代码生成插件”**,包含以下内容:

  1. State定义:使用TypedDict或Pydantic BaseModel定义State,包含code_requirement、preliminary_code、test_cases、current_code、is_code_correct、iteration_count、max_iteration_count、log等字段。
  2. 自定义节点:定义generate_preliminary_code_node、generate_test_cases_node、execute_test_cases_node、check_code_correctness_node、modify_code_node、update_iteration_count_node、terminate_node等节点。
  3. 工具函数:定义generate_test_cases_tool、execute_test_cases_tool等工具函数。
  4. 测试用例:定义测试插件功能的测试用例。
  5. 文档:定义插件的使用说明、API文档、示例代码等。

当你需要开发一个代码生成的大模型应用时,你只需要将这个“多轮迭代代码生成插件”插在你的项目中,就可以快速搭建一个功能完善的代码生成应用,而不需要重新开发所有的功能。

在LangGraph中,目前还没有官方的插件标准和插件管理工具,但是我们可以自己制定插件标准和开发插件管理工具,这也是本文的核心内容之一。

核心概念之间的关系(用小学生能理解的比喻)

概念一和概念二的关系:State和Node的关系——背包和探险家的关系

想象一下,你是一个探险家,背着一个背包(State)去探险。你需要什么东西,就从背包里拿(读取State),你有什么新的东西,就放进背包里(修改State)。

State和Node的关系,就是这样背包和探险家的关系:Node是探险家,执行具体的探险任务;State是背包,保存了探险家在探险过程中需要的所有东西,以及探险家在探险过程中获得的所有新东西。

具体来说:

  1. Node可以读取State:探险家可以从背包里拿东西,比如拿地图、拿指南针、拿水等。
  2. Node可以修改State:探险家可以把新的东西放进背包里,比如把采集到的样本、把拍摄到的照片、把写好的日志等放进背包里。
  3. Node不能离开State单独工作:探险家不能离开背包单独去探险,否则他会迷路、会饿死、会渴死。
概念二和概念三的关系:Node和Edge的关系——房间和门的关系

想象一下,你有一个大房子,里面有很多房间(Node),每个房间负责一个具体的功能,比如客厅、卧室、厨房、卫生间等。房间之间有门(Edge)连接,门有控制器,可以控制门的打开和关闭,以及打开的条件。

Node和Edge的关系,就是这样房间和门的关系:Node是房间,执行具体的功能;Edge是门,连接不同的房间,定义了从一个房间到另一个房间的规则。

具体来说:

  1. Edge连接不同的Node:门连接不同的房间,你可以从客厅走到卧室,从卧室走到厨房,从厨房走到卫生间等。
  2. Edge定义了Node的跳转规则:门的控制器定义了门的打开和关闭,以及打开的条件,比如只有当你饿了的时候,厨房的门才会打开;只有当你困了的时候,卧室的门才会打开;只有当你想上厕所的时候,卫生间的门才会打开。
概念一、二、三的关系:State、Node、Edge的关系——棋盘、棋子、棋子移动规则的关系

想象一下,你在下象棋,棋盘(State)上有很多棋子(Node),每个棋子有不同的移动规则(Edge)。

State、Node、Edge的关系,就是这样棋盘、棋子、棋子移动规则的关系

  1. State是棋盘:保存了所有棋子的位置和状态。
  2. Node是棋子:执行具体的移动任务。
  3. Edge是棋子移动规则:定义了棋子的移动方向和移动条件。

具体来说:

  1. 棋子(Node)在棋盘(State)上移动:棋子的位置保存在棋盘上,棋子移动时会修改棋盘上的位置信息。
  2. 棋子(Node)的移动规则(Edge)定义了移动的方向和条件:比如马走日、象走田、车走直线、炮翻山等。
  3. 棋盘(State)的状态决定了棋子(Node)的移动规则(Edge)的执行:比如当马的旁边有一个棋子时,马就不能跳过去;当象的中间有一个棋子时,象就不能飞过去。
概念一、二、三、四的关系:State、Node、Edge、StateGraph的关系——积木、积木连接方式、积木模型的关系

想象一下,你在搭积木,积木(State、Node、Edge)有不同的形状和颜色,积木之间有不同的连接方式(Edge的定义规则),你可以用这些积木搭出不同的积木模型(StateGraph)。

State、Node、Edge、StateGraph的关系,就是这样积木、积木连接方式、积木模型的关系

  1. State、Node、Edge是积木:有不同的形状和颜色,比如State是长方形的积木,Node是正方形的积木,Edge是条形的积木。
  2. Edge的定义规则是积木连接方式:告诉你如何将不同的积木连接在一起,比如将条形的积木插在正方形的积木的侧面,将长方形的积木放在正方形的积木的下面等。
  3. StateGraph是积木模型:由State、Node、Edge按照一定的连接方式搭成的完整模型,比如房子、汽车、飞机等。
概念一、二、三、四、五的关系:State、Node、Edge、StateGraph、Plugin的关系——积木零件、积木连接方式、积木模型、积木套装的关系

想象一下,你有一套积木套装(Plugin),里面包含了一组相关的积木零件(State、Node、Edge)、积木连接方式(Edge的定义规则)、积木模型的示例(StateGraph的示例)、积木模型的搭建说明(文档)等。你可以用这套积木套装快速搭出不同的积木模型(StateGraph),而不需要自己准备所有的积木零件。

State、Node、Edge、StateGraph、Plugin的关系,就是这样积木零件、积木连接方式、积木模型、积木套装的关系

  1. State、Node、Edge是积木零件:有不同的形状和颜色。
  2. Edge的定义规则是积木连接方式:告诉你如何将不同的积木零件连接在一起。
  3. StateGraph是积木模型:由积木零件按照一定的连接方式搭成的完整模型。
  4. Plugin是积木套装:由一组相关的积木零件、积木连接方式、积木模型的示例、积木模型的搭建说明等组成,可以在多个项目中重复使用。

核心概念原理和架构的文本示意图(专业定义)

LangGraph 核心架构文本示意图
=====================================

1. 最底层:State(状态层)
   ├── 定义:由TypedDict或Pydantic BaseModel定义的键值对集合,保存了工作流运行过程中的所有中间数据、状态信息、日志信息等
   ├── 功能:
   │   ├── 存储工作流的上下文信息
   │   ├── 提供节点之间的数据传递通道
   │   ├── 支持序列化和反序列化,方便保存和加载
   ├── 特点:
   │   ├── 下一个状态只依赖于当前状态和当前动作(马尔可夫性)
   │   ├── 可以是任意Python类型
   │   ├── 支持类型提示(TypedDict或Pydantic BaseModel)

2. 中间层:Node & Edge(节点与边层)
   ├── Node(节点)
   │   ├── 定义:执行具体任务的Python函数或类
   │   ├── 分类:
   │   │   ├── 按是否依赖State分类:Stateless Node(无状态节点)、Stateful Node(有状态节点)
   │   │   ├── 按功能分类:Action Node(动作节点)、Condition Node(条件节点)、Terminate Node(终止节点)
   │   │   ├── 按来源分类:Built-in Node(内置节点)、Custom Node(自定义节点)
   │   ├── 输入:当前的State(Stateful Node)或外部数据(Stateless Node)
   │   ├── 输出:修改后的State的部分键值对(Stateful Node)或外部数据(Stateless Node)
   ├── Edge(边)
   │   ├── 定义:连接不同节点的规则
   │   ├── 分类:
   │   │   ├── Normal Edge(普通边):无条件跳转,当一个节点执行完成后,直接跳转到另一个节点
   │   │   ├── Conditional Edge(条件边):有条件跳转,当一个节点执行完成后,根据State中的数据判断跳转到哪个节点
   │   ├── 输入:当前的State
   │   ├── 输出:下一个节点的名称

3. 上层:StateGraph(状态图层)
   ├── 定义:由State、Node、Edge组成的完整工作流模型
   ├── 功能:
   │   ├── 定义工作流的所有规则
   │   ├── 编译生成可运行的CompiledGraph对象
   │   ├── 支持事件监听和回调机制
   ├── 特点:
   │   ├── 基于马尔可夫决策过程(MDP)
   │   ├── 支持循环迭代
   │   ├── 支持条件跳转
   │   ├── 支持终止规则
   │   ├── 支持实时流式处理

4. 最高层:Plugin(插件层)
   ├── 定义:由一组相关的自定义节点、State定义、Edge定义、工具函数、测试用例、文档等组成的可复用模块
   ├── 功能:
   │   ├── 提供可复用的功能模块
   │   ├── 简化大模型应用的开发流程
   │   ├── 促进LangGraph社区的发展
   ├── 特点:
   │   ├── 模块化设计
   │   ├── 可插拔
   │   ├── 可扩展
   │   ├── 可测试
   │   ├── 可文档化

核心概念ER实体关系与交互架构图(Mermaid)

ER实体关系图(Mermaid ER Diagram)

读写

被连接/跳转

提供判断条件

包含

包含

包含

可选包含

包含自定义节点

可选包含

可选包含示例

可选包含

包含

包含

STATE

NODE

EDGE

STATEGRAPH

PLUGIN

TOOL

TEST_CASE

DOCUMENT

交互架构图(Mermaid Architecture Diagram)

节点与边层

状态图层

插件层

用户层

输入

传入

传入

输出

输出

展示

提供

提供

提供

提供

提供

提供

提供

提供

提供

提供

提供

提供

提供

提供

提供

提供

提供

提供

使用

使用

使用

使用

使用

使用

使用

使用

发送事件

发送事件

触发

执行回调

执行回调

执行回调

读写

读写

获取判断条件

获取判断条件

调用

调用

调用

外部层

大语言模型

外部工具

外部API

外部数据库

状态层

序列化

序列化

序列化

存储

存储

存储

加载

加载

加载

反序列化

反序列化

反序列化

内存状态存储

状态序列化器

数据库状态存储

文件状态存储

状态反序列化器

用户

用户输入

用户输出

插件1 多轮迭代代码生成

插件2 多模态文档解析

插件3 多Agent协作

插件工具库

插件测试库

插件文档库

编译后的工作流1

编译后的工作流2

事件总线

回调管理器

内置节点

自定义节点

普通边

条件边


(文章篇幅较长,剩余内容将在后续补充。本文将继续深入讲解核心算法原理、数学模型、项目实战、实际应用场景等内容,确保总字数达到10000字左右,为读者提供全方位的LangGraph扩展开发指南。)

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐