Python接入大模型的方法

penguin_can_fly

355人浏览 · 2026-05-05 23:32:15

penguin_can_fly · 2026-05-05 23:32:15 发布

Python 调用大模型（LLM）全教程

Python 调用大模型主要分两种场景，我直接给你最常用、最简单、能马上跑通的方案，包含完整可复制代码。

一、最常用：调用在线大模型 API（推荐新手）

不用本地部署，直接调用大厂 / 开源模型的云端接口，比如：

OpenAI GPT
通义千问（阿里）
文心一言（百度）
讯飞星火
DeepSeek、Zhipu GLM 等
也可以调用模型库等中转站如：https://tokenbox.cloud/register?aff=10CJ

1. 通用标准方式（OpenAI 格式，90% 模型都支持）

现在几乎所有大模型 API 都兼容 OpenAI SDK，一套代码通用所有模型。

第一步：安装依赖

bash

运行

pip install openai

第二步：调用代码（直接复制改 key 和地址）

python

运行

from openai import OpenAI

# 1. 创建客户端（不同模型只需要改 base_url 和 api_key）

client = OpenAI(
    api_key="YOUR_TOKENBOX_API_KEY",
    #插入你的Key
    base_url="https://tokenbox.cloud/v1"
)

resp = client.chat.completions.create(
    model="YOUR_MODEL_NAME",
    #插入你所选用的模型
    messages=[{"role": "user", "content": "你好，北京有什么好玩的地方？"}]
    #询问：你好，北京有什么好玩的地方？
)


# 3. 打印结果
print(response.choices[0].message.content)

2. 国内模型快速替换（以DeepSeek / 通义千问为例）

只需要改 api_key、base_url、model 三个地方：

✅ 阿里通义千问

python

运行

client = OpenAI(
    api_key="sk-xxx",
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1"
)
response = client.chat.completions.create(model="qwen-turbo", ...)

✅ DeepSeek

python

运行

client = OpenAI(
    api_key="sk-xxx",
    base_url="https://api.deepseek.com/v1"
)
response = client.chat.completions.create(model="deepseek-chat", ...)

✅ 智谱 GLM

python

运行

client = OpenAI(
    api_key="sk-xxx",
    base_url="https://open.bigmodel.cn/api/paas/v4/"
)
response = client.chat.completions.create(model="glm-4", ...)

二、本地调用：开源大模型（Llama 3 / Qwen / Mistral）

适合想本地运行、不上传数据的场景，需要一定显卡（CPU 也能跑但慢）。

最简单方案：使用 `ollama`（1 分钟部署）

1. 安装 Ollama

官网：https://ollama.com/安装后打开终端运行：

bash

运行

ollama run qwen2  # 下载并启动阿里通义千问2

2. Python 调用本地 Ollama

python

运行

import requests

# Ollama 默认本地地址
url = "http://localhost:11434/api/chat"

data = {
    "model": "qwen2",
    "messages": [
        {"role": "user", "content": "介绍下Python"}
    ],
    "stream": False
}

response = requests.post(url, json=data)
print(response.json()["message"]["content"])

三、进阶：流式输出（像 ChatGPT 一样逐字输出）

python

运行

from openai import OpenAI

client = OpenAI(api_key="sk-xxx", base_url="https://xxx/v1")

stream = client.chat.completions.create(
    model="qwen-turbo",
    messages=[{"role": "user", "content": "写一个Python爬虫教程"}],
    stream=True  # 开启流式
)

# 逐字打印
for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="", flush=True)

四、你只需要记住的 3 个核心参数

六、常见错误排查

api_key：模型平台给你的密钥
base_url：API 地址（国内模型必须改）
model：模型名称（如 gpt-3.5-turbo、qwen-turbo、glm-4
五、常用模型名（参考）
gpt-3.5-turbo
gpt-4
claude-3-sonnet
qwen-turbo（通义千问）
glm-4（智谱）
401 Unauthorized：检查 api_key 是否正确、是否有空格
404 Not Found：确认 base_url 是 https://api.tokenbox.cloud/v1
429 Too Many Requests：调用超限，稍后重试或升级额度

总结

新手首选：用 OpenAI 兼容 SDK 调用在线 API，代码通用、零配置
隐私需求：用 Ollama 本地运行开源大模型
体验更好：开启 流式输出
国内模型：只需要替换 base_url + api_key + model

你如果告诉我具体想用哪个大模型（比如 GPT、通义千问、文心、Llama 3），我可以直接给你一键运行的专属代码。

python如何调用tokenbox.cloud的大模型

tokenbox.cloud 是兼容 OpenAI 接口格式的聚合平台，直接用 openai 库就能调，不用改核心代码。下面给你可直接复制运行的完整示例。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

一个GitHub Issue就能投毒Claude Code？我拆解了整条供应链攻击链

上周Claude Code刚被AMD AI负责人用23万次调用记录实锤"越更新越差"[1]，这周它的GitHub Actions又被安全研究者扒出了一个供应链级别的漏洞——一个恶意GitHub Issue，就能让Claude Code帮你把仓库Secret全偷走，甚至往你的代码里投毒[2]。这个漏洞有多严重？CVSS v4.0评分7.8，Anthropic为此支付了4800美元赏金。更可怕的是，A