大白话核心知识点(先懂原理,再动手写代码,零基础 100% 能听懂)

先搞懂:大模型 API 的「必选参数」(少一个都调用不了)
这些参数是大模型 API 的硬性要求,就像你点外卖必须填「收货地址、手机号、点的菜品」一样,少一个都无法成功调用。

1. model:大模型的版本(你要找哪个 AI 老师回答问题)

大白话含义:就像你去学校上课,选不同的老师 —— 基础老师、进阶老师、特级老师,不同的老师能力、收费、响应速度都不一样。
新手必用的 3 个版本(通义千问官方):

模型名称 大白话定位 费用 新手适用场景
qwen-turbo 免费基础版老师,响应最快,能力完全够学习用 永久免费,有超大额度 日常对话、代码练习、基础文本处理(今日全程用这个)
qwen-plus 进阶版老师,能力更强,逻辑更严谨 少量付费, 有免费额度 复杂逻辑推理、长文本处理、专业内容生成
qwen-max 特级老师,通义千问最强版本,能力对标 GPT-4 付费为主 专业级任务、复杂代码开发、深度内容创作
2.input.messages:对话的核心内容(你和大模型的完整聊天记录)

大白话含义:就像你和大模型的微信聊天框,里面的每一条消息,都要告诉大模型「是谁发的、发了什么内容」,大模型会根据完整的聊天记录来回复你。
核心结构:每一条消息都必须包含 2 个字段,少一个都报错:
表格

字段 可选值 大白话含义
role user/assistant/system 这条消息是谁发的
content 任意文本内容 这条消息的具体内容
3 个role的作用(必须记牢,这是让大模型精准回复的核心):

· user:用户,也就是你发的问题、指令,所有你要问大模型的内容,都用这个角色。

· assistant:大模型,也就是大模型之前给你的回复,用来实现多轮对话,让大模型记住之前的聊天内容。

· system:系统指令,这是给大模型定的「最高规则」,相当于你给大模型写的「岗位说明书」,告诉大模型它要扮演什么角色、要遵守什么规则、要用什么风格回复。
举个例子:“role”: “system”, “content”: “你是一个Python零基础老师,所有内容必须用大白话讲,绝对不能用专业术语,比如不能说「变量」,要说「一个装东西的盒子」”

新手必懂:system指令是让大模型「听话」的关键,你把规则写的越明确,大模型的回复就越符合你的要求,不会瞎编、不会用专业术语。

再搞懂:大模型 API 的「核心可选参数」(精准控制大模型的回复行为)

这些参数不是必须填的,但是学会了之后,你就能像「遥控器」一样,精准控制大模型的回复,让它完全按你的要求来,这是从「会调用」到「会用好」的关键。

1. temperature:温度系数(大模型的脑洞大小、创意程度)

大白话含义:就像你给大模型调的「脑洞开关」,数值越小,大模型越严谨、越守规矩,完全按你给的规则来,不会瞎编;数值越大,大模型越有创意、脑洞越大,会给你意想不到的回复。
取值范围:0~2,新手常用的 3 个档位:
表格

数值 大白话定位 适用场景
0.1~0.3 极度严谨的「理科老师」,完全按规则来,不瞎编 写代码、做数学题、专业知识问答、需要 100% 准确的场景
0.5~0.7 平衡型的「通用助手」,既严谨,又有一定的灵活性 日常对话、通用问答、文案修改、基础内容生成(新手默认用 0.7)
1.0~2.0 脑洞大开的「创意作家」,想象力拉满,回复非常多样 写小说、写文案、做创意内容、头脑风暴、不需要 100% 准确的场景

新手避坑:如果大模型回复的内容不对、瞎编,第一时间把temperature调低,比如调到 0.3,大模型立刻就会变得严谨很多。

2. max_tokens:最大 token 数(大模型回复的最大字数限制)

· 大白话含义:就像你给大模型定的「回复字数上限」,超过这个字数,大模型就会立刻停止回复,避免大模型说一堆废话、回复太长。
· 新手必懂:1 个 token ≈ 1.5 个汉字,比如你设置max_tokens=100,大模型的回复就不会超过 100 个 token,大概 150 个汉字,完全够用。
· 常用设置:
一句话回答:max_tokens=50
短文本回答:max_tokens=200
长文本内容:max_tokens=1000

新手避坑:如果大模型回复的内容被截断了、没说完,就把max_tokens调大一点;如果大模型回复的废话太多,就把max_tokens调小。

3. stop:停止词(大模型看到这个词就立刻停止回复)

· 大白话含义:就像你给大模型定的「停止信号」,只要大模型的回复里出现了你设置的这个词,就会立刻闭嘴,不再继续说下去,精准控制回复的长度。
· 举个例子:
你设置stop=[“。”, “!”]:大模型说完一句话,看到句号 / 感叹号,就立刻停止,不会继续说第二句。
你设置stop=[“答案:”, “总结:”]:大模型说完「答案:」后面的内容,就立刻停止,不会说多余的废话。
· 新手用法:和max_tokens配合用,双重控制大模型的回复长度,避免废话。

4. top_p:核采样(大模型选字的范围大小)

· 大白话含义:和temperature配合用,相当于你给大模型定的「选字范围」,数值越小,大模型只选最可能、最准确的字,回复更严谨;数值越大,大模型会选更多可能的字,回复更多样、更有创意。
· 取值范围:0~1,新手常用设置:
严谨场景:top_p=0.3(只选最可能的 30% 的字)
通用场景:top_p=0.9(新手默认,平衡严谨和创意)
创意场景:top_p=1.0(全量选字,脑洞最大)
· 新手避坑:这个参数不用单独调,和temperature配合就行,比如temperature=0.3+top_p=0.3,就是极致严谨的模式,完全不会瞎编。

实操

# 第一步:导入requests库和我们的配置文件
import requests
from config import TONGYI_API_KEY, TONGYI_API_URL

# 第二步:构造请求头(固定格式,不用改,告诉大模型我们的身份)
headers = {
    "Authorization": f"Bearer {TONGYI_API_KEY}",
    "Content-Type": "application/json"
}

# 第三步:构造核心的对话内容(messages),给大模型定规则+提问题
data = {
    # 用免费的qwen-turbo模型,新手首选
    "model": "qwen-turbo",
    # 核心对话内容,包含系统指令+用户提问
    "input": {
        "messages": [
            # 系统指令:给大模型定最高规则,扮演Python零基础老师,只用大白话
            {
                "role": "system",
                "content": "你是一个Python零基础老师,所有的内容必须用大白话讲,绝对不能用任何专业术语,比如不能说「变量」,要说「一个装东西的盒子」,不能说「函数」,要说「一个能重复用的工具」"
            },
            # 用户提问:我们要问大模型的问题
            {
                "role": "user",
                "content": "什么是Python里的print语句?怎么用?"
            }
        ]
    },
    # 核心可选参数:控制大模型的回复行为
    "temperature": 0.3,  # 严谨模式,避免瞎编
    "max_tokens": 200,   # 回复不超过200个token,大概300个汉字
    "top_p": 0.3          # 只选最准确的内容,极致严谨
}

# 第四步:用post方法发送请求,拿到大模型的回复
response = requests.post(url=TONGYI_API_URL, headers=headers, json=data)

# 第五步:解析大模型的回复,拿到干净的纯文本内容
# 先把返回的JSON文本解析成Python的字典
result = response.json()
# 按官方固定路径,拿到大模型的纯文本回复
ai_reply = result["output"]["text"]

# 第六步:打印结果,先看状态码,再看大模型的回复
print("请求状态码:", response.status_code)
print(" 大模型的回复:")
print(ai_reply)
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐