山东大学软件学院创新实训——MarketClaw团队博客（二）：多元技术攻坚，筑牢营销智能体基石

2401_83356673

443人浏览 · 2026-05-05 23:50:23

2401_83356673 · 2026-05-05 23:50:23 发布

项目名称：MarketClaw——你的私人产品营销助理
团队博客总览：https://blog.csdn.net/2401_83356673?type=blog
本阶段时间：2026年4月22日 — 2026年4月27日

一、引言

自第一期团队博客完成项目启动与初步环境搭建后，MarketClaw团队进入了技术深度探索与核心模块预研的关键阶段。本次团队博客将汇总四位成员在各自方向上的第二期个人博客成果，内容涵盖：

张桐：AI Agent框架OpenClaw的本地部署实践，记录9个典型问题及解决思路，为项目底座的可靠运行扫清障碍；
商玉雷：小红书自动化MCP方案受挫后，果断转向Chrome扩展 + WebSocket方案，成功实现搜索与推荐内容获取；
张垿赫：深入分析Nanobot框架的桥接层、测试层以及经典skills（weather/memory），并完成项目六大模块划分；
许泽榕：系统学习大模型训练全流程（预训练、SFT、LoRA、DPO、知识蒸馏），为后续可能的模型微调与对齐储备核心技能。

四位成员的博客虽然侧重点不同，但共同指向一个目标：为MarketClaw构建稳定、智能、可扩展的营销Agent系统。下面按照个人工作依次展开。

二、队长张桐：OpenClaw本地部署与9类典型问题解决

2.1 工作背景

在MarketClaw主体开发正式启动前，我希望通过完整部署一个成熟的AI Agent框架（OpenClaw，原名Clawdbot），深入理解其Skill管理、模块加载、分层记忆等机制，为团队后续设计提供直接参考。

2.2 测试环境

操作系统：Windows 11
Node.js v22.14.0，pnpm v10.32.1
OpenClaw版本：2026.4.15-beta.1（源码编译）

2.3 9个典型问题与解决方案

整个部署耗时约3天，记录20余个报错，最终成功跑通。最具代表性的问题有：

问题	现象	解决方案
PowerShell执行策略限制	无法加载脚本	`Set-ExecutionPolicy RemoteSigned`
缺少Bash环境	`bash` 命令找不到	安装Git for Windows并加入PATH
Git克隆需登录	镜像仓库报错	改用GitHub公开仓库
pnpm全局链接失败	`ERR_PNPM_NO_GLOBAL_BIN_DIR`	`pnpm setup`后重启终端
`openclaw`命令找不到	无该命令	手动创建`openclaw.cmd`包装器
配置向导中技能强制选择	clawhub依赖Go，无法跳过	选择其他技能绕过或Ctrl+C退出
Web UI无法访问（404）	根路径被拒绝	用`openclaw dashboard`获取带token的URL
日志未显示Control UI信息	未出现启动日志	信任dashboard命令输出
进程无法优雅终止	端口被占用	`netstat`+`taskkill`强制结束

2.4 对MarketClaw的参考价值

环境检测：建议提供doctor命令，自动检查权限、依赖、端口占用。
跨平台构建：核心脚本应使用Node.js跨平台API，避免依赖Unix Shell。
技能配置：允许用户跳过所有技能安装，且区分“推荐技能”与“高级技能”。
Web UI认证：采用一次性token + 会话超时，并提供dashboard命令。

三、商玉雷：小红书自动化——从MCP超时到Chrome扩展方案的完整演进

3.1 前序问题与方案调整

上一阶段我基于MCP协议搭建了xiaohongshu-mcp服务端，完成协议握手，但实际调用search_feeds接口时持续超时。分析原因可能为：上游服务响应延迟、HTTP客户端未配置超时控制。考虑到风控规避与登录态维护的难度，我决定放弃MCP方案，转向Chrome扩展 + 本地WebSocket桥接。

3.2 技术方案对比

维度	HTTP模拟	Playwright	Chrome扩展+WebSocket
登录态维护	定期更新Cookie	独立Cookie存储	自动继承浏览器状态
风控触发概率	较高	中等	较低
开发难度	高（逆向）	中等	较高
环境依赖	仅HTTP客户端	需浏览器驱动	需安装扩展

最终选用Chrome扩展方案，因其在风控规避和登录态维护上优势明显。

3.3 系统架构

采用三层进程协作模型：

text

OpenClaw (AI框架) ←→ Python CLI (技能执行器) ←→ Chrome扩展 (真实浏览器)

OpenClaw：接收自然语言指令，调度技能。
Python CLI：解析参数，管理WebSocket连接，实现超时与重试。
Chrome扩展：Background脚本创建WS服务，Content脚本执行DOM操作（搜索、滚动、抓取）。

3.4 关键实现与难点

通信协议：自研基于JSON的简易RPC，包含id、method、params、timeout字段。
SPA页面适配：小红书为单页应用，通过chrome.tabs.onUpdated监听URL变化并重新注入Content Script。
异步加载等待：使用MutationObserver等待搜索结果渲染完成后再提取数据。

3.5 实验结果

当前已稳定完成：

✅ 登录状态检测
✅ 推荐内容获取
✅ 关键词搜索（返回标题、作者、点赞数）
⚠️ 点赞操作（偶发元素定位偏移）
🔄 评论操作（测试中）

示例输出（脱敏）：

{
  "success": true,
  "keyword": "济南 旅游",
  "count": 22,
  "items": [
    {"title": "济南三天两夜旅游攻略", "author": "用户****", "likes": "1.2万"}
  ]
}

3.6 总结与展望

投入约11天，完成从MCP到Chrome扩展的完整技术转型，产出可复用的小红书自动化技能。后续将完善点赞、评论稳定性，并封装行为仿真模块为通用库。

四、张垿赫：Nanobot框架深入与项目模块规划

4.1 框架核心层再理解

继上一篇博客介绍Nanobot主体后，本周重点学习了桥接适配层（bridge/）和测试保障层（tests/）。

桥接层：负责将核心框架的抽象接口转化为具体外部服务（LLM、电商API、社交媒体）的请求，同时将外部事件转化为框架事件。实现更换模型供应商或业务平台时核心代码零修改。
测试层：包含单元测试（核心模块）、集成测试（框架与桥接层交互）、端到端测试（完整营销场景），保障全链路质量。

4.2 经典Skills研读

(1) Weather Skill

无需API密钥，仅依赖系统curl。
通过metadata.nanobot.requires.bins声明依赖，框架自动检测。
利用wttr.in服务输出纯文本、自定义格式、天气图片等。

(2) Memory Skill

双层记忆架构：MEMORY.md（长期记忆，自动加载到上下文）和HISTORY.md（历史日志，不自动加载，主动检索）。
检索策略：小文件用read_file，大文件用grep命令提高性能。
自动整合：对话过长时自动总结并追加到HISTORY.md，关键事实提取到MEMORY.md。

这对MarketClaw的创新点1（三层记忆HOT/WARM/COLD） 提供了直接实现参考。

4.3 OpenClaw部署问题补充

我在部署OpenClaw时也遇到三个典型问题：

sharp依赖安装失败：npm install --build-from-source=sharp解决。
模型API调用失败：逐一检查API Key、baseUrl、账户余额、网络连通性。
杀毒软件误删文件：添加白名单，重新解压。

4.4 项目模块划分

基于前期学习和项目目标，我完成了MarketClaw的六大模块划分：

模块	核心功能
商品分析与文案生成Skill	结构化解析、人群分析、小红书图文生成
热点信息采集Skill	微博热搜、小红书话题热度、竞品检索
小红书自动化执行Skill	自动发布、评论获取、情感分析、智能回复
账号预热与人群锚定Skill	账号人设生成、预热行为规划
爆款分析与策略迭代Skill	数据采集、爆款特征提取、模板库动态更新
支撑创新Skill	长期记忆自学习、轻量级聊天交互、多场景营销物料生成