在这里插入图片描述

🔥草莓熊Lotso:个人主页

❄️个人专栏: 《C++知识分享》 《Linux 入门到实践:零基础也能懂》

✨生活是默默的坚持,毅力是永久的享受!

🎬 博主简介:

在这里插入图片描述



前言

大语言模型(LLM)虽然在文本生成、翻译、问答等任务中表现出色,但它本质上是一个封闭的知识系统: 知识存在截止日期,无法获取实时信息,无法执行外部操作(如计算、数据库查询、API 调用),复杂任务容易出现逻辑错误或幻觉。LangChain 的出现完美解决了这些问题。它通过聊天模型接口标准化了不同 LLM 的调用方式,通过工具调用机制让 LLM 具备了与外部世界交互的能力。本文将从最基础的聊天模型定义开始,一步步带你实现一个能实时搜索天气的 AI 助手。


一. 定义聊天模型

LangChain 提供了统一的聊天模型接口,让你可以无缝切换 OpenAI、DeepSeek、Ollama 等不同模型提供商,无需修改业务逻辑。
在这里插入图片描述
在这里插入图片描述

1.1 ChatOpenAI:最常用的模型实现

ChatOpenAI 是 LangChain 为 OpenAI 聊天模型提供的官方实现,它继承自 BaseChatOpenAI 并实现了标准的 Runnable 接口。

核心初始化参数详解

from langchain_openai import ChatOpenAI

# 完整参数示例
model = ChatOpenAI(
    model="gpt-4o-mini",          # 模型名称
    temperature=0,                # 采样温度,0-2
    max_tokens=None,              # 最大生成令牌数
    timeout=None,                 # 请求超时时间
    max_retries=2,                # 最大重试次数
    # api_key="你的API_KEY",      # 不写则自动从环境变量读取
    # base_url="代理地址",         # 国内访问需要配置
    # organization="组织ID"       # OpenAI 组织 ID
)

关键参数深度解析

  • temperature:控制输出的随机性
    • 0:完全确定,适合代码生成、事实问答
    • 0.1-0.5:轻微变化,适合技术文档、写作
    • 0.5-1:平衡创意,适合日常对话
    • 1-2:高度随机,适合创意创作
    • >2:不推荐,通常输出无意义内容
  • max_tokens:限制模型生成的最大长度
    • Token 是 LLM 处理文本的基本单位
    • 中文:1 个汉字 ≈ 1.5-2 个 Token
    • 英文:1 个 Token ≈ 4 个字符或 0.75 个单词

基础调用示例

from langchain_core.messages import SystemMessage, HumanMessage
from langchain_core.output_parsers import StrOutputParser

# 定义消息列表
messages = [
    SystemMessage(content="请帮我进行翻译,由英文翻译成中文!"),
    HumanMessage(content="my name is xiaoming")
]

# 定义输出解析器,提取 AIMessage 中的 content
parser = StrOutputParser()

# 构建链
chain = model | parser

# 调用并打印结果
print(chain.invoke(messages))  # 输出:我的名字是小明

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.2 init_chat_model:通用模型工厂函数

init_chat_model() 是一个更上层的工厂函数,支持一键初始化多种聊天模型,无需导入不同的模型类。

from langchain.chat_models.base import init_chat_model

# 初始化 OpenAI 模型
gpt_model = init_chat_model(
    model="gpt-4o-mini",
    model_provider="openai",
    temperature=0.3
)

# 初始化 DeepSeek 模型(兼容 OpenAI API)
deepseek_model = init_chat_model(
    model="deepseek-chat",
    model_provider="deepseek",
    api_key="你的DeepSeek_API_KEY",
    base_url="https://api.deepseek.com/v1"
)

# 测试调用
print(f"GPT-4o-mini: {gpt_model.invoke('你是谁?').content}")
print(f"DeepSeek: {deepseek_model.invoke('你是谁?').content}")

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.3 ChatOllama:本地部署模型支持

如果你想使用本地部署的开源模型(如 Llama 3、DeepSeek-R1),LangChain 提供了 ChatOllama 支持。

前置准备

  1. 安装 Ollama:https://ollama.com/
  2. 拉取模型:ollama pull deepseek-r1:1.5b
from langchain_ollama import ChatOllama

# 初始化本地模型
ollama_model = ChatOllama(
    model="deepseek-r1:1.5b",
    base_url="http://127.0.0.1:11434",
    temperature=0.3
)

# 测试调用
print(ollama_model.invoke("你是谁?").content)

在这里插入图片描述


二、工具调用:让 LLM 连接外部世界

工具调用是 LangChain 最强大的功能之一,它让 LLM 从一个 “只会说话的模型” 变成了一个 “能做事的助手”。

2.1 工具调用的核心作用

  1. 扩展能力边界:让 LLM 执行数学计算、搜索网络、操作数据库等自身无法完成的任务
  2. 保证信息实时性:获取训练数据中不存在的最新信息
  3. 处理复杂任务:将复杂请求分解为多个步骤,依次调用不同工具协同完成
  4. 连接现有系统:将企业内部 API、数据库封装成工具,让 LLM 成为自然语言驱动的统一接口
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

2.2 定义工具的三种方式

LangChain 提供了多种定义工具的方式,核心是让 LLM 知道工具名称、工具描述、工具参数这三个关键信息。

2.2.1 方式一:@tool 装饰器(推荐)

这是最简单、最常用的工具定义方式,支持两种参数描述模式。

模式 1:Google 风格文档字符串

from langchain_core.tools import tool
from typing_extensions import Annotated

@tool
def add(
    a: Annotated[int, ..., "第一个整数"],
    b: Annotated[int, ..., "第二个整数"],
) -> int:
    """两数相加
    
    Args:
        a: 第一个整数
        b: 第二个整数
    """
    return a + b

# 查看工具信息
print(add.name)        # add
print(add.description) # 两数相加
print(add.args)        # {'a': {'type': 'integer', 'description': '第一个整数'}, ...}

在这里插入图片描述

模式 2:依赖 Pydantic 类 如果工具参数比较复杂,推荐使用 Pydantic 类定义参数 schema,提供更强的类型检查和描述能力。

from pydantic import BaseModel, Field

class AddInput(BaseModel):
    """两数相加"""
    a: int = Field(..., description="第一个整数")
    b: int = Field(..., description="第二个整数")

@tool(args_schema=AddInput)
def add(a: int, b: int) -> int:
    return a + b

在这里插入图片描述

2.2.2 方式二:StructuredTool 类

如果你需要更灵活的工具定义(如异步工具、自定义响应格式),可以使用 StructuredTool.from_function()

from langchain_core.tools import StructuredTool
from typing import Tuple, List

def add(a: int, b: int) -> Tuple[str, List[int]]:
    """两数相加"""
    nums = [a, b]
    content = f"{nums}相加的结果是{a+b}"
    return content, nums

# 创建工具,区分 content 和 artifact
add_tool = StructuredTool.from_function(
    func=add,
    name="ADD",
    description="两数相加",
    args_schema=AddInput,
    response_format="content_and_artifact"
)

# 模拟大模型调用方式
result = add_tool.invoke({
    "name": "ADD",
    "args": {"a": 3, "b": 4},
    "type": "tool_call",
    "id": "111"
})

print(result)
# 输出:ToolMessage(content='[3, 4]相加的结果是7', name='ADD', tool_call_id='111', artifact=[3, 4])

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

2.3 工具的绑定与调用

定义好工具后,需要将工具绑定到聊天模型,然后按照 “工具选择 → 工具执行 → 结果总结” 的流程调用。

完整工具调用流程

from langchain_core.messages import HumanMessage, AIMessage, ToolMessage

# 定义两个工具
@tool
def add(a: int, b: int) -> int:
    """两数相加"""
    return a + b

@tool
def multiply(a: int, b: int) -> int:
    """两数相乘"""
    return a * b

# 1. 绑定工具到模型
tools = [add, multiply]
model_with_tools = model.bind_tools(tools=tools)

# 2. 第一步:让模型选择工具
messages = [HumanMessage(content="2乘3等于多少?")]
ai_msg = model_with_tools.invoke(messages)
messages.append(ai_msg)

# 查看模型返回的工具调用信息
print(ai_msg.tool_calls)
# 输出:[{'name': 'multiply', 'args': {'a': 2, 'b': 3}, 'id': 'call_xxx', 'type': 'tool_call'}]

# 3. 第二步:执行工具调用
for tool_call in ai_msg.tool_calls:
    # 根据工具名称选择对应的工具
    selected_tool = {"add": add, "multiply": multiply}[tool_call["name"].lower()]
    tool_msg = selected_tool.invoke(tool_call)
    messages.append(tool_msg)

# 4. 第三步:让模型根据工具结果生成最终回答
final_result = model_with_tools.invoke(messages)
print(final_result.content)
# 输出:2乘3等于6。

在这里插入图片描述
在这里插入图片描述

强制调用工具

默认情况下,模型会根据输入内容自动决定是否调用工具。如果你想强制模型调用某个工具,可以使用 tool_choice 参数。

# 强制调用任意一个工具
model_with_tools = model.bind_tools(tools=tools, tool_choice="any")

# 强制调用指定工具
model_with_tools = model.bind_tools(tools=tools, tool_choice={"type": "function", "function": {"name": "add"}})

在这里插入图片描述
在这里插入图片描述


三、实战:集成 Tavily 搜索引擎实现实时天气查询

Tavily 是一个专门为 AI 设计的搜索引擎,专为智能体检索与推理需求量身打造,能够以结构化形式返回搜索结果。

3.1 环境准备

  1. 注册 Tavily 账号并获取 API Key:https://www.tavily.com/
  2. 配置系统环境变量 TAVILY_API_KEY 为你的 API Key
  3. 安装依赖包:
pip install langchain-tavily langchain-openai

3.2 完整代码实现

from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage
from langchain_tavily import TavilySearch

# 1. 定义大模型
model = ChatOpenAI(model="gpt-4o-mini")

# 2. 定义搜索工具,最多返回4条结果
tool = TavilySearch(max_results=4)

# 3. 绑定工具到模型
model_with_tools = model.bind_tools([tool])

# 4. 第一步:用户提问,模型选择调用搜索工具
messages = [
    HumanMessage("中国西安今天的天气怎么样?")
]
ai_msg = model_with_tools.invoke(messages)
messages.append(ai_msg)

# 5. 第二步:执行搜索工具
for tool_call in ai_msg.tool_calls:
    tool_msg = tool.invoke(tool_call)
    messages.append(tool_msg)

# 6. 第三步:模型根据搜索结果生成最终回答
result = model_with_tools.invoke(messages)
print(result.content)

在这里插入图片描述
在这里插入图片描述

3.3 输出结果示例

今天西安的天气情况如下:
- **天气**:晴天转多云
- **最高气温**:约31℃
- **最低气温**:约21℃
- 预计在晚上会有降雨。

有关更详细的信息,你可以查看[中国气象局的天气预报](https://weather.cma.cn/web/weather/V8870.html)或其他相关天气网站。

在这里插入图片描述


四、核心知识点总结

  1. 聊天模型
    1. 使用 ChatOpenAI 初始化 OpenAI 模型,重点掌握 temperaturemax_tokens 参数
    2. 使用 init_chat_model() 实现多模型统一初始化
    3. 使用 ChatOllama 调用本地部署的开源模型
  2. 工具调用
    1. 工具的核心三要素:名称、描述、参数 schema
    2. 推荐使用 @tool 装饰器定义工具,简单高效
    3. 工具调用流程:工具选择 → 工具执行 → 结果总结
    4. 可以通过 tool_choice 参数强制模型调用指定工具
  3. Tavily 搜索
    1. Tavily 是专为 AI 设计的搜索引擎,返回结构化结果
    2. 只需配置 API Key 即可快速集成,实现实时信息获取

结尾

🍓 我是草莓熊 Lotso!若这篇技术干货帮你打通了学习中的卡点:
👀 【关注】跟我一起深耕技术领域,从基础到进阶,见证每一次成长
❤️ 【点赞】让优质内容被更多人看见,让知识传递更有力量
⭐ 【收藏】把核心知识点、实战技巧存好,需要时直接查、随时用
💬 【评论】分享你的经验或疑问(比如曾踩过的技术坑?),一起交流避坑
🗳️ 【投票】用你的选择助力社区内容方向,告诉大家哪个技术点最该重点拆解
技术之路难免有困惑,但同行的人会让前进更有方向~愿我们都能在自己专注的领域里,一步步靠近心中的技术目标!

结语:本文我们从最基础的聊天模型定义开始,逐步深入到工具调用的底层逻辑,并最终实现了一个能实时搜索天气的 AI 助手。这只是 LangChain 强大功能的冰山一角,后续我们还将学习结构化输出、流式传输、RAG 检索增强生成等高级功能,带你一步步构建生产级的 LLM 应用。如果本文对你有帮助,欢迎点赞、收藏、关注!有任何问题都可以在评论区留言交流。

✨把这些内容吃透超牛的!放松下吧✨
ʕ˘ᴥ˘ʔ
づきらど

在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐