一、MarketClaw 的大模型需求与技术选型

MarketClaw 的核心目标是:用户通过飞书/QQ 聊天即可完成商品营销全流程。其中 Skill1(商品分析与文案生成) 和 Skill3(情感分析+自动回复) 直接依赖大模型能力。具体需求包括:

  1. 商品信息结构化提取:从用户输入的自然语言或图片中,自动提取商品名称、品类、核心卖点,输出 JSON 格式,要求准确率 ≥95%。

  2. 目标人群分析:基于商品属性推测用户画像(年龄段、兴趣偏好、购买动机)。

  3. 小红书文案生成:生成符合平台风格的标题、情绪正文、话题标签。

  4. 评论情感分析:对用户评论进行正向/负向/中性分类,并生成回复话术。

在对比了 GPT-4、文心一言、通义千问等模型后,选择 DeepSeek 作为底座,理由如下:

维度 DeepSeek 优势
成本 输入 2元/百万 tokens,输出 3元/百万 tokens,成本相比其他模型较低
中文能力 原生中文预训练,对小红书“种草”风格文案生成效果自然
JSON 模式 支持 response_format 强制输出合法 JSON,便于解析
流式响应 支持 stream: true,适合飞书机器人打字机效果
兼容性 API 完全兼容 OpenAI 格式,生态工具可直接复用

本文记录了我从零搭建测试环境、解决 Windows 执行策略问题、验证 DeepSeek API 在营销场景下的实际表现,并为 Skill1 沉淀了可复用的提示词模板。

二、环境搭建与踩坑记录

2.1 创建项目与虚拟环境

bash

mkdir marketclaw_api_test
cd marketclaw_api_test
python -m venv venv
.\venv\Scripts\Activate.ps1   # Windows PowerShell

遇到问题:首次运行 Activate.ps1 时提示“无法加载脚本,因为在此系统上禁止运行脚本”。

原因:Windows 默认执行策略为 Restricted,不允许运行本地 PowerShell 脚本。

解决方案:参考 AI 建议,在管理员 PowerShell 中执行:

powershell

Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser -Force

输入 Y 确认后,重新激活虚拟环境成功(命令行前出现 (venv) 标志)。

2.2 安装依赖包

bash

pip install requests python-dotenv

  • requests:发送 HTTP 请求调用 API

  • python-dotenv:从 .env 文件读取 API Key,避免硬编码

2.3 配置 API Key

在 DeepSeek 平台注册账号,进入 API Keys 页面,点击“创建 API Key”,复制生成的密钥。

在项目根目录创建 .env 文件中,写入(为防止密钥泄露,因此使用x代替具体字符)

DEEPSEEK_API_KEY=sk-xxxxxxxxxxxxxxx

三、测试脚本设计与运行

编写 test_deepseek.py,包含 5 个关键测试用例。以下为核心代码片段(完整代码已上传至 Gitee)。

3.1 基础对话(非流式)

验证 API 连通性。输入“用一句话介绍 Python”,输出:

text

Python是一种简洁易读、功能强大的高级编程语言,广泛应用于数据分析、人工智能和Web开发等领域。
3.2 流式响应

设置 stream=True,实现“打字机效果”。输入“从1数到5,用逗号分隔”,输出:

text

1, 2, 3, 4, 5

这对 MarketClaw 的飞书机器人交互体验至关重要。

3.3 JSON 模式与商品信息提取(核心测试)

System Prompt

text

你是一个商品信息提取专家。请从用户输入中提取商品名称、品类、核心卖点,并以JSON格式输出。
示例输出:{"商品名称": "xxx", "品类": "xxx", "核心卖点": ["卖点1", "卖点2"]}

用户输入:“这款运动手表支持心率监测和GPS定位,续航7天,防水50米”

DeepSeek 返回temperature=0.1):

json

{
  "商品名称": "运动手表",
  "品类": "智能穿戴设备",
  "核心卖点": ["心率监测", "GPS定位", "续航7天", "防水50米"]
}

分析:输出完全符合要求,字段完整,准确率 100%(初步测试1个商品)。任务书中要求的“商品信息提取准确率 ≥95%”具备可行性。

3.4 小红书文案生成(temperature 对比)

System Prompt

text

你是一个小红书营销文案专家。请根据商品信息生成一篇种草文案,输出JSON格式,包含:标题(15字内)、正文(100字左右)、话题标签(3-5个)。

同一商品输入,分别测试 temperature=0.3 和 temperature=0.8

参数 标题 正文风格 话题标签
0.3 智能运动手表,健康生活好帮手 偏实用描述 [智能运动手表, 健康生活, 运动装备, 科技好物, 防水手表]
0.8 智能运动手表,健康生活好帮手 与0.3相似,略调整措辞 [智能运动手表, 心率监测, GPS定位, 7天续航, 防水设计]

观察:低温度输出更保守,高温度创意提升有限。后续将尝试调整提示词(如增加“活泼、口语化”要求)或使用更高 temperature(如1.0)以增强差异。


四、对 MarketClaw Skill1 的启示

  1. 提示词模板沉淀
    将测试通过的 system prompt 整理为 Markdown 文件,上传至 Gitee 仓库的 prompts/ 目录,供团队复用。

  2. 参数建议

    • 商品信息提取:temperature=0.1max_tokens=300,强制 JSON 模式

    • 文案生成:temperature=0.6-0.8max_tokens=500,可关闭 JSON 模式以获得更自然表达

  3. 下一步工作
    本次验证了 DeepSeek 能够满足项目需求,后续将直接基于这些模板开发 Skill1 的业务逻辑,无需重复调参。


五、总结

通过本次实战,我完成了:

  • 从零搭建 Python 环境并解决 Windows 执行策略问题

  • 成功调用 DeepSeek API 并测试流式响应、JSON 模式

  • 验证营销场景提示词(商品提取、小红书文案)

  • 沉淀可复用的提示词模板至 Gitee 仓库

结论:DeepSeek API 完全可作为 MarketClaw 的大模型底座,商品信息提取准确率可达100%(初步验证),文案生成效果符合预期。下一步将启动 Skill1 的工程化开发。


相关链接


AI使用声明:本文在撰写过程中使用了DeepSeek大模型进行代码调试、提示词优化和博客文案结构梳理和措辞优化。例如,在解决PowerShell执行策略问题时,使用了提示词“Windows PowerShell激活虚拟环境报错无法加载脚本如何解决”。所有技术内容(包括代码、测试数据、结论)均经过本人实际运行和验证。所有代码、提示词模板已上传至上述 Gitee 仓库。如有问题,欢迎交流。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐