山东大学软件学院创新实训——MarketClaw团队博客(二):多元技术攻坚,筑牢营销智能体基石
项目名称:MarketClaw——你的私人产品营销助理
团队博客总览:https://blog.csdn.net/2401_83356673?type=blog
本阶段时间:2026年4月22日 — 2026年4月27日
一、引言
自第一期团队博客完成项目启动与初步环境搭建后,MarketClaw团队进入了技术深度探索与核心模块预研的关键阶段。本次团队博客将汇总四位成员在各自方向上的第二期个人博客成果,内容涵盖:
-
张桐:AI Agent框架OpenClaw的本地部署实践,记录9个典型问题及解决思路,为项目底座的可靠运行扫清障碍;
-
商玉雷:小红书自动化MCP方案受挫后,果断转向Chrome扩展 + WebSocket方案,成功实现搜索与推荐内容获取;
-
张垿赫:深入分析Nanobot框架的桥接层、测试层以及经典skills(weather/memory),并完成项目六大模块划分;
-
许泽榕:系统学习大模型训练全流程(预训练、SFT、LoRA、DPO、知识蒸馏),为后续可能的模型微调与对齐储备核心技能。
四位成员的博客虽然侧重点不同,但共同指向一个目标:为MarketClaw构建稳定、智能、可扩展的营销Agent系统。下面按照个人工作依次展开。
二、队长张桐:OpenClaw本地部署与9类典型问题解决
2.1 工作背景
在MarketClaw主体开发正式启动前,我希望通过完整部署一个成熟的AI Agent框架(OpenClaw,原名Clawdbot),深入理解其Skill管理、模块加载、分层记忆等机制,为团队后续设计提供直接参考。
2.2 测试环境
-
操作系统:Windows 11
-
Node.js v22.14.0,pnpm v10.32.1
-
OpenClaw版本:2026.4.15-beta.1(源码编译)
2.3 9个典型问题与解决方案
整个部署耗时约3天,记录20余个报错,最终成功跑通。最具代表性的问题有:
| 问题 | 现象 | 解决方案 |
|---|---|---|
| PowerShell执行策略限制 | 无法加载脚本 | Set-ExecutionPolicy RemoteSigned |
| 缺少Bash环境 | bash 命令找不到 |
安装Git for Windows并加入PATH |
| Git克隆需登录 | 镜像仓库报错 | 改用GitHub公开仓库 |
| pnpm全局链接失败 | ERR_PNPM_NO_GLOBAL_BIN_DIR |
pnpm setup后重启终端 |
openclaw命令找不到 |
无该命令 | 手动创建openclaw.cmd包装器 |
| 配置向导中技能强制选择 | clawhub依赖Go,无法跳过 | 选择其他技能绕过或Ctrl+C退出 |
| Web UI无法访问(404) | 根路径被拒绝 | 用openclaw dashboard获取带token的URL |
| 日志未显示Control UI信息 | 未出现启动日志 | 信任dashboard命令输出 |
| 进程无法优雅终止 | 端口被占用 | netstat+taskkill强制结束 |
2.4 对MarketClaw的参考价值
-
环境检测:建议提供
doctor命令,自动检查权限、依赖、端口占用。 -
跨平台构建:核心脚本应使用Node.js跨平台API,避免依赖Unix Shell。
-
技能配置:允许用户跳过所有技能安装,且区分“推荐技能”与“高级技能”。
-
Web UI认证:采用一次性token + 会话超时,并提供
dashboard命令。
三、商玉雷:小红书自动化——从MCP超时到Chrome扩展方案的完整演进
3.1 前序问题与方案调整
上一阶段我基于MCP协议搭建了xiaohongshu-mcp服务端,完成协议握手,但实际调用search_feeds接口时持续超时。分析原因可能为:上游服务响应延迟、HTTP客户端未配置超时控制。考虑到风控规避与登录态维护的难度,我决定放弃MCP方案,转向Chrome扩展 + 本地WebSocket桥接。
3.2 技术方案对比
| 维度 | HTTP模拟 | Playwright | Chrome扩展+WebSocket |
|---|---|---|---|
| 登录态维护 | 定期更新Cookie | 独立Cookie存储 | 自动继承浏览器状态 |
| 风控触发概率 | 较高 | 中等 | 较低 |
| 开发难度 | 高(逆向) | 中等 | 较高 |
| 环境依赖 | 仅HTTP客户端 | 需浏览器驱动 | 需安装扩展 |
最终选用Chrome扩展方案,因其在风控规避和登录态维护上优势明显。
3.3 系统架构
采用三层进程协作模型:
text
OpenClaw (AI框架) ←→ Python CLI (技能执行器) ←→ Chrome扩展 (真实浏览器)
-
OpenClaw:接收自然语言指令,调度技能。
-
Python CLI:解析参数,管理WebSocket连接,实现超时与重试。
-
Chrome扩展:Background脚本创建WS服务,Content脚本执行DOM操作(搜索、滚动、抓取)。
3.4 关键实现与难点
-
通信协议:自研基于JSON的简易RPC,包含
id、method、params、timeout字段。 -
SPA页面适配:小红书为单页应用,通过
chrome.tabs.onUpdated监听URL变化并重新注入Content Script。 -
异步加载等待:使用
MutationObserver等待搜索结果渲染完成后再提取数据。
3.5 实验结果
当前已稳定完成:
-
✅ 登录状态检测
-
✅ 推荐内容获取
-
✅ 关键词搜索(返回标题、作者、点赞数)
-
⚠️ 点赞操作(偶发元素定位偏移)
-
🔄 评论操作(测试中)
示例输出(脱敏):
{
"success": true,
"keyword": "济南 旅游",
"count": 22,
"items": [
{"title": "济南三天两夜旅游攻略", "author": "用户****", "likes": "1.2万"}
]
}
3.6 总结与展望
投入约11天,完成从MCP到Chrome扩展的完整技术转型,产出可复用的小红书自动化技能。后续将完善点赞、评论稳定性,并封装行为仿真模块为通用库。
四、张垿赫:Nanobot框架深入与项目模块规划
4.1 框架核心层再理解
继上一篇博客介绍Nanobot主体后,本周重点学习了桥接适配层(bridge/)和测试保障层(tests/)。
-
桥接层:负责将核心框架的抽象接口转化为具体外部服务(LLM、电商API、社交媒体)的请求,同时将外部事件转化为框架事件。实现更换模型供应商或业务平台时核心代码零修改。
-
测试层:包含单元测试(核心模块)、集成测试(框架与桥接层交互)、端到端测试(完整营销场景),保障全链路质量。
4.2 经典Skills研读
(1) Weather Skill
-
无需API密钥,仅依赖系统
curl。 -
通过
metadata.nanobot.requires.bins声明依赖,框架自动检测。 -
利用
wttr.in服务输出纯文本、自定义格式、天气图片等。
(2) Memory Skill
-
双层记忆架构:
MEMORY.md(长期记忆,自动加载到上下文)和HISTORY.md(历史日志,不自动加载,主动检索)。 -
检索策略:小文件用
read_file,大文件用grep命令提高性能。 -
自动整合:对话过长时自动总结并追加到
HISTORY.md,关键事实提取到MEMORY.md。
这对MarketClaw的创新点1(三层记忆HOT/WARM/COLD) 提供了直接实现参考。
4.3 OpenClaw部署问题补充
我在部署OpenClaw时也遇到三个典型问题:
-
sharp依赖安装失败:
npm install --build-from-source=sharp解决。 -
模型API调用失败:逐一检查API Key、baseUrl、账户余额、网络连通性。
-
杀毒软件误删文件:添加白名单,重新解压。
4.4 项目模块划分
基于前期学习和项目目标,我完成了MarketClaw的六大模块划分:
| 模块 | 核心功能 |
|---|---|
| 商品分析与文案生成Skill | 结构化解析、人群分析、小红书图文生成 |
| 热点信息采集Skill | 微博热搜、小红书话题热度、竞品检索 |
| 小红书自动化执行Skill | 自动发布、评论获取、情感分析、智能回复 |
| 账号预热与人群锚定Skill | 账号人设生成、预热行为规划 |
| 爆款分析与策略迭代Skill | 数据采集、爆款特征提取、模板库动态更新 |
| 支撑创新Skill | 长期记忆自学习、轻量级聊天交互、多场景营销物料生成 |
4.5 下周计划
开始具体Skills的开发,并与小组成员讨论接口对接细节。
五、许泽榕:大模型训练微调全流程学习
5.1 学习动机
MarketClaw的核心依赖大模型的生成能力。为了更好地理解模型行为,并为可能的专属营销模型微调做技术储备,我系统学习了从预训练到对齐的完整流程。
5.2 数据格式与处理
-
预训练:JSONL格式纯文本,
{"text": "..."},任务为Next Token Prediction。 -
SFT:多轮对话格式,含
system/user/assistant角色,只对assistant回答部分计算loss(通过Loss Mask实现)。 -
DPO:包含
chosen和rejected偏好对,用于直接偏好优化。
5.3 关键机制
-
Loss Mask:SFT中必须将prompt部分的loss置0,否则模型会“学歪”。
-
梯度累积:用多个小batch累加梯度模拟大batch,突破显存限制。
-
学习率调度:Warmup + 余弦退火,兼顾训练初期稳定和后期收敛。
-
混合精度(AMP):使用BF16(优于FP16)减少显存并加速。
5.4 高效微调与对齐
-
LoRA:低秩适应,只训练旁路矩阵,参数量仅为全参微调的2%左右。秩r通常取4~16,加在Attention的Q/K/V/O投影层效果最佳。
-
知识蒸馏:区分黑盒(用大模型生成数据训练小模型)和白盒(学习logits分布)。温度T > 1时可放大“暗知识”,提高学生模型效果。
-
DPO:相比于传统RLHF(需要训练奖励模型+PPO),DPO直接从偏好数据优化策略,实现简单且稳定。
5.5 对MarketClaw的启发
-
文案生成质量提升:未来可收集团队内部的高质量“商品→文案”数据,进行LoRA微调,让模型更贴合小红书风格。
-
评论情感分析:可用蒸馏技术将大模型情感判别能力迁移到轻量级模型,降低推理成本。
-
长期记忆:记忆库中的优质营销模板可作为DPO中的
chosen样本,引导模型生成更优内容。
六、团队共识与总结
通过本阶段(2026年4月22日 — 2026年4月27日)的个人探索,团队在四个关键方向上都取得了实质性突破:
-
底层框架(张桐):OpenClaw成功部署,为后续Skill集成提供稳定底座。
-
业务自动化(商玉雷):小红书核心操作(搜索、推荐抓取)已打通,可投入实际使用。
-
架构与规范(张垿赫):明确六大模块划分,并借鉴Nanobot记忆系统设计。
-
模型技术储备(许泽榕):掌握微调与对齐方法,为模型定制打下基础。
团队将继续通过个人博客记录每日进展,保持高频同步,确保项目按任务书要求稳步推进。
项目代码:https://gitee.com/cusir666/MarketClaw
团队博客:https://blog.csdn.net/2401_83356673?type=blog
成员个人博客:
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)