在2026年的今天,大语言模型(LLM)已经像水电煤一样成为了开发者的基础设施。无论你是想构建智能客服、自动化办公脚本,还是开发复杂的AI Agent,掌握Python调用大模型的方法都是必修课。

对于刚接触AI领域的人来说,OpenAI、Claude、Ollama和LangChain等专业术语确实容易让人困惑。但本质上,使用大模型的核心方法只有三种:调用云端API、运行本地模型或借助框架封装。


 方式一:调用云端API(最主流、最强大)

如今,90%的开发者都在使用这项服务。无需昂贵的显卡设备,仅需通过网络发送请求,即可获得GPT-4o、Claude等顶尖AI模型的智能支持。

1. 核心原理

具体来说,整个API调用过程可以分为以下几个步骤:

  1. 请求准备阶段:
  • 你需要将问题或指令(Prompt)按照API要求的格式进行结构化处理
  • 典型的JSON请求体包含以下字段:
    {
      "prompt": "你的问题或指令内容",
      "max_tokens": 1000,
      "temperature": 0.7,
      "model": "gpt-3.5-turbo"
    }
    
  1. 请求发送阶段:
  • 使用POST方法发送HTTP请求到API端点(如https://api.openai.com/v1/chat/completions
  • 需要在请求头中添加认证信息,例如:
    Authorization: Bearer your_api_key
    Content-Type: application/json
    
  1. 服务器处理阶段:
  • 服务器接收到请求后会进行验证和解析
  • 计算资源会根据请求复杂度进行分配
  • 大模型会对prompt进行处理并生成响应
  1. 响应接收阶段:
  • 服务器返回的也是JSON格式的数据,例如:
    {
      "id": "chatcmpl-123",
      "object": "chat.completion",
      "created": 1677652288,
      "choices": [{
        "index": 0,
        "message": {
          "role": "assistant",
          "content": "这是AI生成的回答..."
        },
        "finish_reason": "stop"
      }],
      "usage": {
        "prompt_tokens": 56,
        "completion_tokens": 31,
        "total_tokens": 87
      }
    }
    

这种交互方式被广泛应用于各种AI服务集成场景,比如:

  • 智能客服系统
  • 内容自动生成工具
  • 编程辅助工具
  • 数据分析报告生成

在实际应用中,通常还会加入错误处理机制、重试逻辑和结果缓存等优化措施来提高系统的可靠性。

2. 2026年的新趋势:标准兼容
以前,调OpenAI、Claude或百度的接口需要写不同的代码。但现在,绝大多数主流模型(包括国产的DeepSeek、通义千问)的API都已兼容OpenAI的标准格式。这意味着你只需要改一行代码,就能在模型之间无缝切换。

3. 代码实战

你需要先安装OpenAI官方提供的Python SDK库才能调用其API服务。安装方法如下:

  1. 确保你的Python环境已配置好(建议使用Python 3.7及以上版本)
  2. 打开命令行终端(Windows的CMD/PowerShell或Mac/Linux的Terminal)
  3. 执行以下pip安装命令:
    pip install openai
    
  4. 如需指定版本可以加上版本号:
    pip install openai==0.27.0
    
  5. 安装完成后可通过以下命令验证:
    pip show openai
    

常见问题:

  • 如果提示权限不足,可尝试加上--user参数
  • 国内用户建议使用清华镜像源加速下载:
    pip install openai -i https://pypi.tuna.tsinghua.edu.cn/simple
    

该库提供了完整的API封装,支持GPT-3、Codex等模型调用,最新版本还增加了ChatCompletion等功能。

1from openai import OpenAI
2import os
3
4# 初始化客户端
5# base_url 可以指向官方,也可以指向聚合平台(如中转站)
6client = OpenAI(
7    api_key="你的API_KEY", 
8    base_url="https://api.openai.com/v1" 
9)
10
11# 发送对话请求
12response = client.chat.completions.create(
13    model="gpt-3.5-turbo", # 指定模型,如 claude-3-5, deepseek-chat
14    messages=[
15        {"role": "system", "content": "你是一个Python专家。"},
16        {"role": "user", "content": "用Python写一个快速排序"}
17    ],
18    temperature=0.7
19)
20
21print(response.choices[0].message.content)

进阶技巧:使用API聚合平台
如果你不想管理多个平台的API Key,或者想解决网络访问问题,可以使用API聚合平台(如OpenRouter、TheRouter等)。你只需要把base_url换成他们的地址,就能用一个Key调遍全球模型。


方式二:本地部署Ollama(隐私安全、免费)

如果你的数据非常敏感,或者想白嫖算力,本地部署是最佳选择。

1. 核心工具:Ollama
Ollama就像是大模型的“Docker”,它能让你在本地一键运行Llama 3、Qwen3、DeepSeek等开源模型。

2. 部署步骤

  1. 去Ollama官网下载安装包。
  2. 在命令行输入ollama run qwen3:7b下载并运行模型。

3. Python调用
Ollama会在本地启动一个服务(默认端口11434),我们可以直接用requests库调用。

python

1import requests
2import json
3
4url = "http://localhost:11434/api/chat"
5
6payload = {
7    "model": "qwen3:7b",  # 必须是你本地已经下载的模型
8    "messages": [
9        {"role": "user", "content": "你好,请介绍一下你自己"}
10    ],
11    "stream": False
12}
13
14response = requests.post(url, json=payload)
15
16if response.status_code == 200:
17    print(response.json()['message']['content'])
18else:
19    print(f"请求失败: {response.status_code}")

方式三:使用LangChain框架(构建复杂应用)

如果你不仅要聊天,还要让AI读取PDF、联网搜索、或者拥有长期记忆,那么LangChain是绕不开的工具。

LangChain的本质是“搭积木”。它把模型、提示词、记忆组件、工具组件标准化,让你像搭积木一样构建应用。

代码实战(调用本地Ollama):

python

1# 需要先安装: pip install langchain langchain-community
2from langchain_community.llms import Ollama
3
4# 初始化模型
5llm = Ollama(model="qwen3:7b")
6
7# 调用
8result = llm.invoke("分析这段文本的情感倾向:Python真是太好用了!")
9print(result)

最佳实践:如何安全地管理API Key

很多新手开发者为了图方便,常常会把API Key直接硬编码在源代码文件中,这种做法存在极大的安全隐患!主要原因包括:

  1. 当代码被上传到GitHub等公开代码托管平台时,这些敏感信息会完全暴露
  2. 如果项目需要多人协作,所有协作者都能看到这些密钥
  3. 一旦API Key泄露,可能导致:
    • 账号余额被盗用(如云服务API)
    • 服务被滥用产生高额费用
    • 数据泄露等严重后果

推荐的安全做法是使用环境变量来存储敏感信息:

具体实现步骤:

  1. 创建.env文件(需加入.gitignore)
  2. 在.env中定义变量:API_KEY=your_actual_key
  3. 使用dotenv等库在代码中读取:
    require('dotenv').config();
    const apiKey = process.env.API_KEY;
    

    其他替代方案:

典型使用场景:

在CI/CD管道中配置环境变量

在持续集成/持续部署流程中安全处理敏感信息的推荐方法:

使用配置文件但确保不提交到版本控制

处理配置文件的正确方式:

  • 使用密钥管理服务(如AWS Secrets Manager)

    密钥管理服务(KMS)是保护敏感信息的最佳实践之一。AWS Secrets Manager提供了一种集中管理、存储和检索机密信息的解决方案:

  • 安全存储:可以安全地存储数据库凭证、API密钥和其他敏感数据
  • 自动轮换:支持自动轮换数据库密码等凭证
  • 细粒度访问控制:通过IAM策略精确控制谁可以访问哪些机密
  • 审计日志:记录所有机密访问操作,便于安全审计
  • 开发人员无需知道生产数据库密码
  • 运维团队可以集中管理所有环境密钥
  • 安全团队可以监控密钥使用情况
  • 管道变量配置

    • 在CI/CD平台(如GitHub Actions、GitLab CI、Jenkins等)中设置环境变量
    • 区分不同环境(开发、测试、生产)的变量
  • 安全注入方式

    • 通过密钥管理服务动态注入
    • 使用加密的环境变量文件
    • 避免在构建日志中打印敏感信息
  • 最佳实践

    • 为每个环境使用独立的凭证
    • 定期轮换CI/CD管道中使用的密钥
    • 限制构建代理的权限范围
  • 配置文件管理策略

    • 创建.gitignore文件排除敏感配置文件
    • 提供配置文件模板(如config.example
    • 在文档中说明如何创建本地配置文件
  • 安全存储方案

    • 将真实配置文件存储在安全位置(如密钥库)
    • 部署时通过自动化流程注入配置
    • 对于团队共享,使用加密的配置仓库
  • 实施建议

    • 使用环境变量覆盖敏感配置项
    • 实现配置验证机制
    • 定期审计配置文件权限和内容

记住:永远不要把敏感信息直接写在代码中!

  1. 在项目根目录创建一个 .env 文件:bash
    1OPENAI_API_KEY=sk-xxxxxxxxxxxx
  2. 在代码中读取:python
    1import os
    2from dotenv import load_dotenv
    3
    4load_dotenv() # 加载 .env 文件
    5api_key = os.getenv("OPENAI_API_KEY")

📌 总结:我该选哪种?

表格

方式 优点 缺点 适用场景
云端API 智商最高,无需硬件,开发快 需付费,数据需上传云端 商业项目、复杂任务、个人助手
本地部署 免费,数据绝对安全,离线可用 吃显卡配置,智商略低 隐私数据、学习研究、低成本测试
LangChain 功能强大,可扩展性强 学习曲线稍陡 知识库问答、AI Agent、自动化流程
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐