LangChain 简单上手

Small_entreprene

365人浏览 · 2026-04-01 21:48:46

Small_entreprene · 2026-04-01 21:48:46 发布

一、快速上手

1. 内容与目标

对于前几个章节，我们已经说明尽管大模型的在某些方面表现振奋人心，但使用原生 LLM 可能会存在一些问题，例如将其当作搜索引擎去使用，LLM 生成的答案可能要比其他搜索引擎查到的答案更符合你的预期，但是在复杂的场景下使用，如将 LLM 嵌入应用程序时却遭遇了全新难题：

简单提示词（Prompt）可以统一规范？
提示词结构是否可以统一规范？
如何实现开发过程中大模型的轻松、灵活切换？
大模型输出是非结构化的，怎样与要求结构化数据的程序接口交互？
如何克服预训练模型知识陈旧的问题，引入实时更新？
如何连接模型与外部工具或系统，执行具体任务？
...

LangChain 框架的核心目标就是应对这些挑战。它通过将自然语言处理流程拆解为标准化组件，让开发者能够自由组合并高效定制工作流。

本节主要：演示如何使用 LangChain 接入大模型组件，以及与大模型进行简单对话的能力。掌握了基本用法后，将会引出 LangChain 相关前置概念，以便后续深入学习 LangChain 标准化组件。

2. 详细过程

2.1 步骤 1：申请 API key 并配置环境变量

1. 申请 API key

以 OpenAI 为例，官网地址：https://platform.openai.com/（魔法上网）如果没有账号先注册账号，登录成功后，选择 API keys 配置页面：

点击 “Create new secret key” 按钮，新增 API key：

将 API Key 在自己本地保存好，后续接入 ChatGPT 时需要使用。

2. 配置环境变量

将 API Key 配置在环境变量中主要是为了保证其隐私性。由于 apikey 比较隐私，为避免在程序中暴露，可提前将 apikey 配置在环境变量中，这样在程序中就可以通过获取对应环境变量拿到 apikey，保证了 apikey 的隐私。

输入：OPENAI_API_KEY + 对应的上面获取到的密钥【程序会自动获取环境变量"OPENAI_API_KEY"的！】

2.2 步骤 2：定义大模型

1. 安装 OpenAI 包

pip install -U langchain-openai

2. 定义大模型

核心代码：

# 代码块
from langchain_openai import ChatOpenAI
model = ChatOpenAI(model="gpt-5-mini")

2.3 步骤 3：定义消息列表

核心代码：

# 定义消息列表
from langchain_core.messages import HumanMessage, SystemMessage

messages = [
    SystemMessage(content="Translate the following from English into Chinese"),
    HumanMessage(content="hi!")
]

参数说明：

SystemMessage：表示系统角色消息，系统消息通常作为输入消息序列中的第一条传入，是用来启动 AI 行为的消息。
HumanMessage：表示用户角色消息，是来自用户的、从用户传递到模型的消息。

2.4 步骤 4：调用大模型

model 是 LangChain Runnable（可运行）接口的实例，这意味着 model 提供了一个标准接口供我们与之交互。要简单地调用模型，我们可以将消息列表传递给 .invoke 方法。

使用 .invoke 方法进行大模型调用，核心代码：

result = model.invoke(messages)
print(result)

输出结果（调试可以看见 result 类型为 AIMessage）：

{
  'content': '你好！',
  'additional_kwargs': {},
  'response_metadata': {
    'token_usage': {
      'prompt_tokens': 20,
      'completion_tokens': 2,
      'total_tokens': 22,
      'prompt_tokens_details': {
        'audio': 0,
        'cached_tokens': 0,
        'audio_tokens': 0,
        'cached_read': 0
      },
      'completion_tokens_details': {
        'accepted_prediction_tokens': 0,
        'audio_tokens': 0,
        'reasoning_tokens': 0,
        'rejected_prediction_tokens': 0
      }
    },
    'model': 'gpt-5-mini-2024-07-18',
    'system_fingerprint': 'fp_566af659',
    'id': 'chatcmpl-15MkKQ0sjbTJbN9jbru-77ef10e-55c-4f11a-ab-104aa45c22f0-0',
    'usage': {
      'input_tokens': 20,
      'output_tokens': 2,
      'total_tokens': 22,
      'input_token_details': {
        'audio': 0,
        'cache_read': 0
      },
      'output_token_details': {
        'audio': 0,
        'reasoning': 0
      }
    }
  },
  'id': 'chatcmpl-15MkKQ0sjbTJbN9jbru-77ef10e-55c-4f11a-ab-104aa45c22f0-0',
  'usage_metadata': {
    'input_tokens': 20,
    'output_tokens': 2,
    'total_tokens': 22
  }
}

输出说明：

AIMessage：来自 AI 的消息。从聊天模型返回，作为对提示（输入）的响应。

Content：消息的内容。
additional_kwargs：与消息关联的其他有效负载数据。对于来自 AI 的消息，可能包括模型提供程序特定的工具调用。
response_metadata：响应元数据。例如：响应标头、logprobs、令牌计数、模型名称【侧重于 “响应” 本身的信息，比如这次请求的 ID、使用的模型版本、以及服务提供商返回的所有原始元数据。它主要用于调试、日志记录和获取请求的上下文信息】
usage_metadata：消息的使用元数据，例如令牌计数【侧重于 “资源消耗” 的量化信息，即这次请求消耗了多少 Token。它主要用于成本计算、监控和预算控制】

2.5 步骤 5：输出解析

输出结果即为模型返回的字符串。可以使用 StrOutputParser 输出解析器组件，将大模型输出只想解析为最可能返回的结果。

# 定义字符串输出解析器
from langchain_core.output_parsers import StrOutputParser

parser = StrOutputParser()
print(parser.invoke(result))

输出结果：

你好！

2.6 步骤 6：链式执行

通过上述步骤，无论是调用大模型，还是输出解析，我们发现，每次都调用了一个 invoke() 方法，最终才会得到我们想要的结果。对于 LangChain，它给我们提供了链式执行的能力，即我们只需要定义各个 “组件”，将它们 “链起来”，一次性执行即可得到最终结果。

注意： 以上描述只是为了好理解，并不是其真正定义，等到示例看完，我们会引出最终定义。

核心代码如下：

# 定义大模型
model = ChatOpenAI(model="gpt-5-mini")

# 定义消息列表
messages = [
    SystemMessage(content="Translate the following from English into Chinese"),
    HumanMessage(content="hi!")
]

# 定义输出解析器
parser = StrOutputParser()

# 定义链
chain = model | parser

# 执行链
result = chain.invoke(messages)

print(result)

输出结果：

你好！

快速上手完整代码参考：

from langchain_core import import chat
from langchain_core.messages import HumanMessage, SystemMessage
from langchain_core.output_parsers import StrOutputParser

# 定义大模型
model = ChatOpenAI(model="gpt-5-mini")

# 定义消息列表
messages = [
    SystemMessage(content="Translate the following from English into Chinese"),
    HumanMessage(content="hi!")
]

# 定义输出解析器
parser = StrOutputParser()

# 定义链
chain = model | parser

# 执行链
result = chain.invoke(messages)

print(result)

3. 引出 LangChain 相关概念

3.1 Runnable 接口

Runnable 接口是使用 LangChain Components（组件）的基础。

概念说明：

Component（组件）：用来帮助我们在构建 AI 应用程序时，提供了一系列的核心构建块，例如语言模型、输出解析器、检索器、链等。

Runnable 定义了一个标准接口，允许 Runnable 组件：

Invoked（调用）：单个输入转换为输出。
Batched（批处理）：多个输入有效地转换为输出。
Streamed（流式传输）：输出在生成时流式传输。
Inspected（检查）：可以访问有关 Runnable 的输入、输出和配置的原理图信息。
Composed（组合）：可以将多个 Runnable 以使用 | 协同工作以创建复杂的管道。

所有能力参考这里：https://python.langchain.com/v0.2/docs/concepts/#runnable-interface

因此，在快速上手中，我们定义的语言模型（model）、输出解析器（StrOutputParser）都是 Runnable 接口的实例！他们都使用了 invoke（调用）的能力。

# 语言模型（model）
result = model.invoke(messages)  # 语言模型是 Runnable 接口实例，允许invoke调用

# 输出解析器（StrOutputParser）
parser.invoke(result)  # 输出解析器是 Runnable 接口实例，允许invoke调用

3.2 LangChain Expression Language

LangChain Expression Language (LCEL)：采用声明性方法，从现有 Runnable 对象构建新的 Runnable 对象。通过 LCEL 构建出的新的 Runnable 对象，被称为 RunnableSequence，表示可运行序列。

RunnableSequence 就是一种链（参考步骤 6）。通过调试步骤 6 就能发现，chain 的类型就是 RunnableSequence。如下所示：

重要的是，RunnableSequence 也是 Runnable 接口的实例，它实现了完整的 Runnable 接口，因此它可以与 LangChain 其他 Runnable 相同的使用。回顾一下：

chain = model | parser
chain.invoke(messages)  # 链是 Runnable 接口实例，允许invoke调用

可以看到，LCEL 其实是一种编排解决方案，它使 LangChain 能够以优化的方式处理链的运行时执行。任何两个 Runnable 都可以 “链” 在一起。在链中，上一个管道对象的 .invoke() 调用的输出作为输入传递给下一个可运行对象。方法就是使用 |（管道运算符）。

chain = model | parser

它通过两个 Runnable 对象创建一个 RunnableSequence。实际上 LangChain 重载了 | 运算符，使用 | 运算就相当于：

from langchain_core.runnables import RunnableSequence
chain = RunnableSequence(first=model, last=parser)

除此之外，| 也可以替代 pipe() 方法。这相当于 | 管道运算符：RunnableSequence 中，pipe() 方法（管道）和 | 管道运算符都用于实现进程间通信，这里同样也是迁移过来的用法。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

用GLM-5.1全自动生成“文档清洗入库“脚本，一键榨干复杂PDF！

AtomGit开源社区

OpenAI Swarm vs LangGraph：企业应用视角的对比分析

从企业应用的视角来看，多Agent编排框架的核心问题空间任务分解与调度：如何将复杂的企业业务流程自动/半自动地拆分为多个简单、独立、可复用的子任务？如何根据子任务的优先级、依赖关系、Agent的能力和可用性，合理地分配和调度子任务？状态管理与持久化：如何定义和管理多Agent系统的“全局状态”和“局部状态”？如何实现状态的持久化（例如：存储在数据库、Redis、向量数据库中）？如何实现状态的版本控

AtomGit开源社区

深度学习模型实战：不训数据也能搭对、调通！从模块组合→静态调试全流程

本文针对深度学习模型搭建中的常见问题，提出了一套系统化的解决方案。首先指出模块堆砌的误区，强调模块组合应遵循"归纳偏置互补"原则，让CNN、RNN、Attention等模块各司其职。然后介绍了4种实用的模型组合范式（堆叠、残差连接、瓶颈结构、多尺度融合），并重点讲解了静态调试方法：通过构造Dummy数据、加入维度断言、单次前反向传播等步骤，在训练前就能发现80%的错误。文章还提