Python调用大模型：从云端API到本地部署

X226542946

585人浏览 · 2026-03-29 14:39:21

X226542946 · 2026-03-29 14:39:21 发布

在2026年的今天，大语言模型（LLM）已经像水电煤一样成为了开发者的基础设施。无论你是想构建智能客服、自动化办公脚本，还是开发复杂的AI Agent，掌握Python调用大模型的方法都是必修课。

对于刚接触AI领域的人来说，OpenAI、Claude、Ollama和LangChain等专业术语确实容易让人困惑。但本质上，使用大模型的核心方法只有三种：调用云端API、运行本地模型或借助框架封装。

方式一：调用云端API（最主流、最强大）

如今，90%的开发者都在使用这项服务。无需昂贵的显卡设备，仅需通过网络发送请求，即可获得GPT-4o、Claude等顶尖AI模型的智能支持。

1. 核心原理

具体来说，整个API调用过程可以分为以下几个步骤：

请求准备阶段：

你需要将问题或指令（Prompt）按照API要求的格式进行结构化处理

典型的JSON请求体包含以下字段：

{
  "prompt": "你的问题或指令内容",
  "max_tokens": 1000,
  "temperature": 0.7,
  "model": "gpt-3.5-turbo"
}

请求发送阶段：

使用POST方法发送HTTP请求到API端点（如https://api.openai.com/v1/chat/completions）

需要在请求头中添加认证信息，例如：

Authorization: Bearer your_api_key
Content-Type: application/json

服务器处理阶段：

服务器接收到请求后会进行验证和解析
计算资源会根据请求复杂度进行分配
大模型会对prompt进行处理并生成响应

响应接收阶段：

服务器返回的也是JSON格式的数据，例如：

{
  "id": "chatcmpl-123",
  "object": "chat.completion",
  "created": 1677652288,
  "choices": [{
    "index": 0,
    "message": {
      "role": "assistant",
      "content": "这是AI生成的回答..."
    },
    "finish_reason": "stop"
  }],
  "usage": {
    "prompt_tokens": 56,
    "completion_tokens": 31,
    "total_tokens": 87
  }
}

这种交互方式被广泛应用于各种AI服务集成场景，比如：

智能客服系统
内容自动生成工具
编程辅助工具
数据分析报告生成

在实际应用中，通常还会加入错误处理机制、重试逻辑和结果缓存等优化措施来提高系统的可靠性。

2. 2026年的新趋势：标准兼容
以前，调OpenAI、Claude或百度的接口需要写不同的代码。但现在，绝大多数主流模型（包括国产的DeepSeek、通义千问）的API都已兼容OpenAI的标准格式。这意味着你只需要改一行代码，就能在模型之间无缝切换。

3. 代码实战

你需要先安装OpenAI官方提供的Python SDK库才能调用其API服务。安装方法如下：

确保你的Python环境已配置好（建议使用Python 3.7及以上版本）
打开命令行终端（Windows的CMD/PowerShell或Mac/Linux的Terminal）
执行以下pip安装命令：
```
pip install openai
```
如需指定版本可以加上版本号：
```
pip install openai==0.27.0
```
安装完成后可通过以下命令验证：
```
pip show openai
```

常见问题：

如果提示权限不足，可尝试加上--user参数

国内用户建议使用清华镜像源加速下载：

pip install openai -i https://pypi.tuna.tsinghua.edu.cn/simple

该库提供了完整的API封装，支持GPT-3、Codex等模型调用，最新版本还增加了ChatCompletion等功能。

1from openai import OpenAI
2import os
3
4# 初始化客户端
5# base_url 可以指向官方，也可以指向聚合平台（如中转站）
6client = OpenAI(
7    api_key="你的API_KEY", 
8    base_url="https://api.openai.com/v1" 
9)
10
11# 发送对话请求
12response = client.chat.completions.create(
13    model="gpt-3.5-turbo", # 指定模型，如 claude-3-5, deepseek-chat
14    messages=[
15        {"role": "system", "content": "你是一个Python专家。"},
16        {"role": "user", "content": "用Python写一个快速排序"}
17    ],
18    temperature=0.7
19)
20
21print(response.choices[0].message.content)

进阶技巧：使用API聚合平台
如果你不想管理多个平台的API Key，或者想解决网络访问问题，可以使用API聚合平台（如OpenRouter、TheRouter等）。你只需要把base_url换成他们的地址，就能用一个Key调遍全球模型。

方式二：本地部署Ollama（隐私安全、免费）

如果你的数据非常敏感，或者想白嫖算力，本地部署是最佳选择。

1. 核心工具：Ollama
Ollama就像是大模型的“Docker”，它能让你在本地一键运行Llama 3、Qwen3、DeepSeek等开源模型。

2. 部署步骤

去Ollama官网下载安装包。
在命令行输入ollama run qwen3:7b下载并运行模型。

3. Python调用
Ollama会在本地启动一个服务（默认端口11434），我们可以直接用requests库调用。

python

1import requests
2import json
3
4url = "http://localhost:11434/api/chat"
5
6payload = {
7    "model": "qwen3:7b",  # 必须是你本地已经下载的模型
8    "messages": [
9        {"role": "user", "content": "你好，请介绍一下你自己"}
10    ],
11    "stream": False
12}
13
14response = requests.post(url, json=payload)
15
16if response.status_code == 200:
17    print(response.json()['message']['content'])
18else:
19    print(f"请求失败: {response.status_code}")

方式三：使用LangChain框架（构建复杂应用）

如果你不仅要聊天，还要让AI读取PDF、联网搜索、或者拥有长期记忆，那么LangChain是绕不开的工具。

LangChain的本质是“搭积木”。它把模型、提示词、记忆组件、工具组件标准化，让你像搭积木一样构建应用。

代码实战（调用本地Ollama）：

python

1# 需要先安装: pip install langchain langchain-community
2from langchain_community.llms import Ollama
3
4# 初始化模型
5llm = Ollama(model="qwen3:7b")
6
7# 调用
8result = llm.invoke("分析这段文本的情感倾向：Python真是太好用了！")
9print(result)

最佳实践：如何安全地管理API Key

很多新手开发者为了图方便，常常会把API Key直接硬编码在源代码文件中，这种做法存在极大的安全隐患！主要原因包括：

当代码被上传到GitHub等公开代码托管平台时，这些敏感信息会完全暴露
如果项目需要多人协作，所有协作者都能看到这些密钥
一旦API Key泄露，可能导致：
- 账号余额被盗用（如云服务API）
- 服务被滥用产生高额费用
- 数据泄露等严重后果

推荐的安全做法是使用环境变量来存储敏感信息：

具体实现步骤：

创建.env文件（需加入.gitignore）
在.env中定义变量：API_KEY=your_actual_key

使用dotenv等库在代码中读取：

require('dotenv').config();
const apiKey = process.env.API_KEY;

其他替代方案：

典型使用场景：

在CI/CD管道中配置环境变量

在持续集成/持续部署流程中安全处理敏感信息的推荐方法：

使用配置文件但确保不提交到版本控制

处理配置文件的正确方式：

使用密钥管理服务（如AWS Secrets Manager）

密钥管理服务（KMS）是保护敏感信息的最佳实践之一。AWS Secrets Manager提供了一种集中管理、存储和检索机密信息的解决方案：
安全存储：可以安全地存储数据库凭证、API密钥和其他敏感数据
自动轮换：支持自动轮换数据库密码等凭证
细粒度访问控制：通过IAM策略精确控制谁可以访问哪些机密
审计日志：记录所有机密访问操作，便于安全审计
开发人员无需知道生产数据库密码
运维团队可以集中管理所有环境密钥
安全团队可以监控密钥使用情况
管道变量配置：
- 在CI/CD平台（如GitHub Actions、GitLab CI、Jenkins等）中设置环境变量
- 区分不同环境（开发、测试、生产）的变量
安全注入方式：
- 通过密钥管理服务动态注入
- 使用加密的环境变量文件
- 避免在构建日志中打印敏感信息
最佳实践：
- 为每个环境使用独立的凭证
- 定期轮换CI/CD管道中使用的密钥
- 限制构建代理的权限范围
配置文件管理策略：
- 创建.gitignore文件排除敏感配置文件
- 提供配置文件模板（如config.example）
- 在文档中说明如何创建本地配置文件
安全存储方案：
- 将真实配置文件存储在安全位置（如密钥库）
- 部署时通过自动化流程注入配置
- 对于团队共享，使用加密的配置仓库
实施建议：
- 使用环境变量覆盖敏感配置项
- 实现配置验证机制
- 定期审计配置文件权限和内容

记住：永远不要把敏感信息直接写在代码中！

在项目根目录创建一个 .env 文件：bash
```
1OPENAI_API_KEY=sk-xxxxxxxxxxxx
```

在代码中读取：python

1import os
2from dotenv import load_dotenv
3
4load_dotenv() # 加载 .env 文件
5api_key = os.getenv("OPENAI_API_KEY")

📌 总结：我该选哪种？

表格

方式	优点	缺点	适用场景
云端API	智商最高，无需硬件，开发快	需付费，数据需上传云端	商业项目、复杂任务、个人助手
本地部署	免费，数据绝对安全，离线可用	吃显卡配置，智商略低	隐私数据、学习研究、低成本测试
LangChain	功能强大，可扩展性强	学习曲线稍陡	知识库问答、AI Agent、自动化流程

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

AI首次从头设计出蛋白酶

AtomGit开源社区

从84370百万美元到431300百万美元！曝光人工智能软件平台行业增长密码！

AtomGit开源社区

计算机毕业设计之基于大数据的环境质量监测与评估系统

本文设计实现了基于大数据和LSTM模型的环境质量监测评估系统。系统整合多源环境数据，通过LSTM模型有效捕捉空气质量时序规律，预测精度优于传统方法。系统包含数据抓取、处理、分析、可视化和管理五大模块，实现了从数据采集到预测展示的全流程。实验表明，该系统能准确预测空气质量，提供直观的可视化界面（包括饼图、漏斗图、雷达图等多种形式），为环境管理决策提供支持。未来可结合物联网技术进一步提升系统性能，加强