4.大模型 API 核心参数与可复用对话代码零基础逐点精讲

HappyAcmen

291人浏览 · 2026-05-26 15:20:38

HappyAcmen · 2026-05-26 15:20:38 发布

大白话核心知识点（先懂原理，再动手写代码，零基础 100% 能听懂）

先搞懂：大模型 API 的「必选参数」（少一个都调用不了）
这些参数是大模型 API 的硬性要求，就像你点外卖必须填「收货地址、手机号、点的菜品」一样，少一个都无法成功调用。

1. model：大模型的版本（你要找哪个 AI 老师回答问题）

大白话含义：就像你去学校上课，选不同的老师 —— 基础老师、进阶老师、特级老师，不同的老师能力、收费、响应速度都不一样。
新手必用的 3 个版本（通义千问官方）：

模型名称	大白话定位	费用	新手适用场景
qwen-turbo	免费基础版老师，响应最快，能力完全够学习用	永久免费，有超大额度	日常对话、代码练习、基础文本处理（今日全程用这个）
qwen-plus	进阶版老师，能力更强，逻辑更严谨少量付费，	有免费额度	复杂逻辑推理、长文本处理、专业内容生成
qwen-max	特级老师，通义千问最强版本，能力对标 GPT-4	付费为主	专业级任务、复杂代码开发、深度内容创作

2.input.messages：对话的核心内容（你和大模型的完整聊天记录）

大白话含义：就像你和大模型的微信聊天框，里面的每一条消息，都要告诉大模型「是谁发的、发了什么内容」，大模型会根据完整的聊天记录来回复你。
核心结构：每一条消息都必须包含 2 个字段，少一个都报错：
表格

字段	可选值	大白话含义
role	user/assistant/system	这条消息是谁发的
content	任意文本内容	这条消息的具体内容

3 个role的作用（必须记牢，这是让大模型精准回复的核心）：

· user：用户，也就是你发的问题、指令，所有你要问大模型的内容，都用这个角色。

· assistant：大模型，也就是大模型之前给你的回复，用来实现多轮对话，让大模型记住之前的聊天内容。

· system：系统指令，这是给大模型定的「最高规则」，相当于你给大模型写的「岗位说明书」，告诉大模型它要扮演什么角色、要遵守什么规则、要用什么风格回复。
举个例子：“role”: “system”, “content”: “你是一个Python零基础老师，所有内容必须用大白话讲，绝对不能用专业术语，比如不能说「变量」，要说「一个装东西的盒子」”

新手必懂：system指令是让大模型「听话」的关键，你把规则写的越明确，大模型的回复就越符合你的要求，不会瞎编、不会用专业术语。

再搞懂：大模型 API 的「核心可选参数」（精准控制大模型的回复行为）

这些参数不是必须填的，但是学会了之后，你就能像「遥控器」一样，精准控制大模型的回复，让它完全按你的要求来，这是从「会调用」到「会用好」的关键。

1. temperature：温度系数（大模型的脑洞大小、创意程度）

大白话含义：就像你给大模型调的「脑洞开关」，数值越小，大模型越严谨、越守规矩，完全按你给的规则来，不会瞎编；数值越大，大模型越有创意、脑洞越大，会给你意想不到的回复。
取值范围：0~2，新手常用的 3 个档位：
表格

数值	大白话定位	适用场景
0.1~0.3	极度严谨的「理科老师」，完全按规则来，不瞎编	写代码、做数学题、专业知识问答、需要 100% 准确的场景
0.5~0.7	平衡型的「通用助手」，既严谨，又有一定的灵活性	日常对话、通用问答、文案修改、基础内容生成（新手默认用 0.7）
1.0~2.0	脑洞大开的「创意作家」，想象力拉满，回复非常多样	写小说、写文案、做创意内容、头脑风暴、不需要 100% 准确的场景

新手避坑：如果大模型回复的内容不对、瞎编，第一时间把temperature调低，比如调到 0.3，大模型立刻就会变得严谨很多。

2. max_tokens：最大 token 数（大模型回复的最大字数限制）

· 大白话含义：就像你给大模型定的「回复字数上限」，超过这个字数，大模型就会立刻停止回复，避免大模型说一堆废话、回复太长。
· 新手必懂：1 个 token ≈ 1.5 个汉字，比如你设置max_tokens=100，大模型的回复就不会超过 100 个 token，大概 150 个汉字，完全够用。
· 常用设置：
一句话回答：max_tokens=50
短文本回答：max_tokens=200
长文本内容：max_tokens=1000

新手避坑：如果大模型回复的内容被截断了、没说完，就把max_tokens调大一点；如果大模型回复的废话太多，就把max_tokens调小。

3. stop：停止词（大模型看到这个词就立刻停止回复）

· 大白话含义：就像你给大模型定的「停止信号」，只要大模型的回复里出现了你设置的这个词，就会立刻闭嘴，不再继续说下去，精准控制回复的长度。
· 举个例子：
你设置stop=[“。”, “！”]：大模型说完一句话，看到句号 / 感叹号，就立刻停止，不会继续说第二句。
你设置stop=[“答案：”, “总结：”]：大模型说完「答案：」后面的内容，就立刻停止，不会说多余的废话。
· 新手用法：和max_tokens配合用，双重控制大模型的回复长度，避免废话。

4. top_p：核采样（大模型选字的范围大小）

· 大白话含义：和temperature配合用，相当于你给大模型定的「选字范围」，数值越小，大模型只选最可能、最准确的字，回复更严谨；数值越大，大模型会选更多可能的字，回复更多样、更有创意。
· 取值范围：0~1，新手常用设置：
严谨场景：top_p=0.3（只选最可能的 30% 的字）
通用场景：top_p=0.9（新手默认，平衡严谨和创意）
创意场景：top_p=1.0（全量选字，脑洞最大）
· 新手避坑：这个参数不用单独调，和temperature配合就行，比如temperature=0.3+top_p=0.3，就是极致严谨的模式，完全不会瞎编。

实操

# 第一步：导入requests库和我们的配置文件
import requests
from config import TONGYI_API_KEY, TONGYI_API_URL

# 第二步：构造请求头（固定格式，不用改，告诉大模型我们的身份）
headers = {
    "Authorization": f"Bearer {TONGYI_API_KEY}",
    "Content-Type": "application/json"
}

# 第三步：构造核心的对话内容（messages），给大模型定规则+提问题
data = {
    # 用免费的qwen-turbo模型，新手首选
    "model": "qwen-turbo",
    # 核心对话内容，包含系统指令+用户提问
    "input": {
        "messages": [
            # 系统指令：给大模型定最高规则，扮演Python零基础老师，只用大白话
            {
                "role": "system",
                "content": "你是一个Python零基础老师，所有的内容必须用大白话讲，绝对不能用任何专业术语，比如不能说「变量」，要说「一个装东西的盒子」，不能说「函数」，要说「一个能重复用的工具」"
            },
            # 用户提问：我们要问大模型的问题
            {
                "role": "user",
                "content": "什么是Python里的print语句？怎么用？"
            }
        ]
    },
    # 核心可选参数：控制大模型的回复行为
    "temperature": 0.3,  # 严谨模式，避免瞎编
    "max_tokens": 200,   # 回复不超过200个token，大概300个汉字
    "top_p": 0.3          # 只选最准确的内容，极致严谨
}

# 第四步：用post方法发送请求，拿到大模型的回复
response = requests.post(url=TONGYI_API_URL, headers=headers, json=data)

# 第五步：解析大模型的回复，拿到干净的纯文本内容
# 先把返回的JSON文本解析成Python的字典
result = response.json()
# 按官方固定路径，拿到大模型的纯文本回复
ai_reply = result["output"]["text"]

# 第六步：打印结果，先看状态码，再看大模型的回复
print("请求状态码：", response.status_code)
print(" 大模型的回复：")
print(ai_reply)