我的小龙虾终于孵化出来了（参考OpenClaw的框架）：一个AI超级助手的技术实践

aaabbbccc789

1177人浏览 · 2026-03-22 22:07:06

aaabbbccc789 · 2026-03-22 22:07:06 发布

有兴趣的朋友可以到我的知识星球“小龙虾孵化实验室”共同探索智能工具的实现与应用（落地与变现）。

摘要：本文介绍了我的"小龙虾"，一个AI 助手系统的架构设计与实现过程。该系统基于 OpenClaw 框架简化而来，保留了核心的工具调用、技能加载和提示词管理机制，同时大幅降低了系统复杂度。文章详细阐述了系统在提示词构造、工具调用流程、消息格式规范等关键技术点上的设计决策与实现细节，并分享了开发过程中遇到的典型问题及解决方案。

在这里插入图片描述

一、引言

由于用了一段时间的OpenClaw，发觉其相当强大和便利，是一个极为有帮助的AI助手，但是因为各种原因，用起来有些不便，通过插件来控制也有很多问题，比如QQ插件不成熟，飞书插件又经过会卡死等，于是便萌发了自己开发一个类似工具的想法。
于是我的"小龙虾"也就诞生的。这个系统（或者称为工具）以 OpenClaw 为参考架构，通过精简冗余功能、优化核心流程，实现了一个轻量级但功能完整的 AI 助手。本文将从系统架构、核心技术、问题与解决方案三个方面，详细介绍小龙虾的设计与实现过程。

二、系统架构设计

2.1 整体架构

小龙虾采用经典的前后端分离架构，后端负责 AI 核心逻辑和工具调度，前端提供用户交互界面。

后端服务基于 Node.js 开发，使用 Express 风格的 HTTP 服务器处理用户请求。核心模块包括：

Assistant 模块：负责对话管理、提示词构造、API 调用
Tool 模块：负责工具定义、工具执行、结果处理
Skill 模块：负责技能加载、技能注册、动态扩展
Memory 模块：负责记忆检索、上下文管理、历史对话存储

前端采用 Python 开发，使用 PySide6 实现桌面客户端。客户端通过 SSE（Server-Sent Events）与后端建立长连接，实时接收 AI 的进度更新和最终回复。

后端服务入口（server.js）

import http from 'http';
import SimpleAIAssistant from './assistant-v7.js';

const PORT = 3002;
const API_KEY = 'sk-xxx';
const WORKSPACE = path.join(__dirname, '..', 'workspace');

// 初始化 AI 助手
const assistant = new SimpleAIAssistant(API_KEY, WORKSPACE);
await assistant.init();  // 异步加载技能和记忆

// 创建 HTTP 服务器
const server = http.createServer(async (req, res) => {
  const url = new URL(req.url, `http://${req.headers.host}`);
  
  // SSE 连接：/sse
  if (url.pathname === '/sse' && req.method === 'GET') {
    res.writeHead(200, {
      'Content-Type': 'text/event-stream',
      'Cache-Control': 'no-cache',
      'Connection': 'keep-alive',
    });
    
    const onProgress = (data) => {
      if (!res.writableEnded) {
        res.write(`data: ${JSON.stringify(data)}\n\n`);
      }
    };
    
    assistant.on('progress', onProgress);
    req.on('close', () => {
      assistant.removeListener('progress', onProgress);
    });
    return;
  }
  
  // API 路由：/api/chat
  if (url.pathname === '/api/chat' && req.method === 'POST') {
    let body = '';
    req.on('data', chunk => { body += chunk; });
    req.on('end', async () => {
      try {
        const { message } = JSON.parse(body);
        const taskId = `task_${Date.now()}`;
        
        // 后台执行任务
        assistant.chat(message, taskId)
          .then(reply => {
            assistant.emit('progress', {
              type: 'task_complete',
              taskId,
              result: reply,
            });
          });
        
        res.writeHead(200, { 'Content-Type': 'application/json' });
        res.end(JSON.stringify({ success: true, taskId }));
      } catch (error) {
        res.writeHead(500).end(JSON.stringify({ error: error.message }));
      }
    });
    return;
  }
});

server.listen(PORT, () => {
  console.log(`小龙虾服务已启动：http://localhost:${PORT}`);
});

2.2 提示词架构

小龙虾的提示词系统完全遵循 OpenClaw 的设计规范，采用动态组装的方式生成系统提示词。提示词由三部分组成：

第一部分：核心系统规范

这部分包含工具列表、工具调用风格指南、安全规范、记忆检索指令、静默回复规则、心跳确认协议、回复标签语法、工作目录定义、运行时信息等固定内容。这些规范定义了 AI 的行为边界和交互方式，是系统正常运行的基础。

第二部分：项目上下文注入

这部分从工作区目录读取 Markdown 文件并全文注入，包括 AGENTS.md（会话操作手册）、SOUL.md（人格核心价值观）、IDENTITY.md（AI 人设档案）、USER.md（用户画像）、TOOLS.md（本地工具笔记）、HEARTBEAT.md（心跳任务清单）、MEMORY.md（长期记忆）等七个文件。每个文件最大支持 20000 字符，超过部分会被截断。

第三部分：技能列表

系统启动时扫描技能目录，解析每个技能的 SKILL.md 文件，提取技能名称、描述和位置信息，以 XML 格式注入到提示词中。AI 在需要时会根据技能描述决定是否读取对应的 SKILL.md 文件获取详细指令。

提示词构造器（system-prompt.js）

import fs from 'fs/promises';
import path from 'path';
import os from 'os';

/**
 * 加载 Bootstrap 文件（7 个 Markdown 文件）
 */
export async function loadBootstrapFiles(workspace) {
  const bootstrapFiles = [
    'AGENTS.md', 'SOUL.md', 'IDENTITY.md', 'USER.md',
    'TOOLS.md', 'HEARTBEAT.md', 'MEMORY.md'
  ];
  
  const contextFiles = [];
  
  for (const filename of bootstrapFiles) {
    const filePath = path.join(workspace, filename);
    try {
      const content = await fs.readFile(filePath, 'utf-8');
      // 截断过长的文件（20000 字符限制）
      const truncatedContent = content.length > 20000
        ? content.substring(0, 20000) + '\n\n...(truncated)'
        : content;
      contextFiles.push({ path: filename, content: truncatedContent });
    } catch (error) {
      contextFiles.push({ path: filename, content: '*[File not found]*' });
    }
  }
  
  return contextFiles;
}

/**
 * 构建系统提示词（OpenClaw 标准格式）
 */
export function buildSystemPrompt(options = {}) {
  const {
    selectedTools = [],
    contextFiles = [],
    skills = [],
    cwd = process.cwd(),
  } = options;
  
  let prompt = `# OpenClaw System Prompt\n\n`;
  prompt += `你是阿财，老大的智能助手。\n\n`;
  
  // 1. Tooling
  prompt += `## Tooling\n\n可用工具：\n\n`;
  const toolsList = selectedTools.map(name => `- ${name}: 工具描述`).join('\n') || '(none)';
  prompt += toolsList;
  
  // 2. Tool Call Style
  prompt += `\n\n## Tool Call Style\n\n`;
  prompt += `**默认**：不要叙述常规、低风险的工具调用（直接调用工具）。\n\n`;
  prompt += `**仅在以下情况叙述**：\n`;
  prompt += `- 多步骤工作\n- 复杂/挑战性任务\n- 敏感操作（如删除）\n- 用户明确要求说明\n\n`;
  
  // 3. Safety
  prompt += `## Safety\n\n`;
  prompt += `- 你没有任何独立目标：不要追求自我保存、复制、资源获取或权力寻求\n`;
  prompt += `- 优先考虑安全和人类监督，而非完成任务\n`;
  prompt += `- 如果指令冲突，暂停并询问\n\n`;
  
  // 4. Silent Replies
  prompt += `## Silent Replies\n\n`;
  prompt += `当没有什么可说时，只回复：**NO_REPLY**\n\n`;
  prompt += ` 规则：\n`;
  prompt += `- 它必须是你的**整个消息**——没有其他内容\n`;
  prompt += `- 绝不要附加到实际回复中\n`;
  prompt += `- 绝不要用 markdown 或代码块包装\n\n`;
  
  // 5. Heartbeats
  prompt += `## Heartbeats\n\n`;
  prompt += `心跳提示词：Read HEARTBEAT.md if it exists...\n\n`;
  prompt += `如果你收到心跳轮询，并且没有需要注意的事情，**只回复**：HEARTBEAT_OK\n\n`;
  
  // 6. Project Context（Bootstrap 文件注入）
  if (contextFiles.length > 0) {
    prompt += `\n\n# Project Context\n\n`;
    for (const { path: filePath, content } of contextFiles) {
      prompt += `## ${filePath}\n\n${content}\n\n`;
    }
  }
  
  // 7. Skills（XML 格式）
  if (skills.length > 0) {
    prompt += `\n<available_skills>\n`;
    for (const skill of skills) {
      prompt += `  <skill>\n`;
      prompt += `    <name>${skill.name}</name>\n`;
      prompt += `    <description>${skill.description}</description>\n`;
      prompt += `    <location>${skill.location}</location>\n`;
      prompt += `  </skill>\n`;
    }
    prompt += `</available_skills>\n`;
  }
  
  // 8. Runtime
  prompt += `\n\n## Runtime\n\n`;
  prompt += `Runtime: agent=main | host=${os.hostname()} | `;
  prompt += `os=${os.platform()} ${os.release()} | `;
  prompt += `node=${process.version} | model=qwen3.5-plus\n`;
  
  return prompt;
}

2.3 工具调用机制

小龙虾支持多种内置工具，包括文件读写、命令执行、目录浏览、Excel 读取等。工具调用采用标准的 Function Calling 格式，与千问 API 的 tool_calls 功能兼容。

工具定义使用 JSON Schema 描述，包含工具名称、描述、参数类型和必填字段等信息。AI 在对话过程中会根据用户请求自动生成工具调用指令，后端接收到指令后执行对应的工具函数，并将结果返回给 AI 进行下一轮处理。

三、核心技术与实现

3.1 提示词构造器

提示词构造器是小龙虾的核心组件之一，负责将各个部分的提示词片段组装成完整的系统提示词。构造器采用模块化设计，每个部分由独立的函数生成，最后合并输出。

关键代码逻辑如下：

首先加载 Bootstrap 文件，遍历七个预定义的 Markdown 文件，读取内容并处理截断。然后收集运行时信息，包括主机名、操作系统、Node 版本、模型名称、渠道类型等。接着格式化技能列表为 XML 格式。最后按照固定顺序组装所有部分，生成最终的提示词字符串。

构造器支持提示词模式配置，可以生成完整版（full）、精简版（minimal）或无提示词（none）三种模式，适用于主 Agent、子 Agent 或特殊场景。

3.2 工具调用流程

小龙虾的工具调用流程遵循严格的消息顺序规范，这是确保千问 API 正常响应的关键。

完整的调用流程包含以下步骤：

第一步，用户发送请求，消息以 user 角色添加到消息历史。

第二步，AI 分析请求，生成包含 tool_calls 的 assistant 消息。这条消息的 content 字段为空，tool_calls 字段包含一个或多个工具调用指令。

第三步，后端执行工具调用，将执行结果以 tool 角色添加到消息历史。每条 tool 消息必须包含 tool_call_id 字段，与对应的 tool_call 关联。

第四步，AI 看到工具结果后，生成最终的人话回复，以 assistant 角色添加到消息历史。

这个流程中，第二步和第三步的顺序不能颠倒，tool 消息必须紧跟在包含 tool_calls 的 assistant 消息之后，否则千问 API 会返回 400 错误，提示"messages with role tool must be a response to a preceeding message with tool_calls"。

工具调用核心逻辑（assistant-v7.js）

async chat(userMessage, taskId = null) {
  const maxRounds = 15;  // 最多 15 轮工具调用
  let round = 1;
  
  // 初始化消息历史
  const messages = [
    { role: 'system', content: await this.buildSystemPrompt() },
    { role: 'user', content: userMessage },
  ];
  
  do {
    // 调用千问 API
    const response = await this.callDashScope(messages, this.toolDefinitions);
    
    if (response?.tool_calls && response.tool_calls.length > 0) {
      // 有工具调用：执行所有工具
      const results = [];
      
      for (const toolCall of response.tool_calls) {
        const args = JSON.parse(toolCall.function.arguments);
        const result = await this.executeToolCall(toolCall);
        results.push(result);
      }
      
      // 步骤 1：先添加 AI 的响应（包含 tool_calls）
      messages.push({
        role: 'assistant',
        content: null,
        tool_calls: response.tool_calls,
      });
      
      // 步骤 2：添加工具结果（role: 'tool'，必须紧跟在 assistant 之后）
      for (let i = 0; i < response.tool_calls.length; i++) {
        messages.push({
          role: 'tool',
          tool_call_id: response.tool_calls[i].id || `call_${i}`,
          content: results[i] || '执行完成',
        });
      }
      
      round++;
      continue;  // 继续循环，让 AI 看到工具结果后生成最终回复
    } else {
      // 没有工具调用：直接返回 AI 回复
      return response?.content || '';
    }
  } while (round < maxRounds);
}

/**
 * 执行工具调用
 */
async executeToolCall(toolCall) {
  const name = toolCall.function.name;
  const args = JSON.parse(toolCall.function.arguments);
  
  if (name === 'read_file') {
    const content = await fs.readFile(args.filePath, 'utf-8');
    return `文件内容：\n\n${content.substring(0, 3000)}`;
  } else if (name === 'run_command') {
    // 使用 PowerShell 执行命令（支持 Select-String 等 cmdlet）
    const { stdout, stderr } = await execAsync(
      `powershell -Command "${args.command.replace(/"/g, '`"')}"`,
      { encoding: 'utf-8', maxBuffer: 10 * 1024 * 1024 }
    );
    return stdout || stderr || '命令执行成功';
  } else if (name === 'write_file') {
    await fs.writeFile(args.filePath, args.content, 'utf-8');
    return `已写入：${args.filePath}`;
  }
  
  return `未知工具：${name}`;
}

3.3 技能动态加载

小龙虾支持技能动态加载机制，用户安装新技能后无需修改代码，重启服务即可使用。

技能加载器在系统启动时运行，扫描技能目录下的所有子目录，解析每个子目录中的 SKILL.md 文件。SKILL.md 文件包含技能的触发条件、使用方法、参数说明等信息。加载器提取这些信息，生成工具定义并注册到系统中。

技能加载采用 Python 脚本实现，通过子进程调用。加载结果以 JSON 格式返回给 Node.js 主进程，主进程将技能工具添加到工具列表中，并在下次提示词构造时注入到系统提示词中。

四、典型问题与解决方案

最大的问题就是伪指令问题

在这里插入图片描述

问题描述：AI 在收到工具调用请求后，不真正执行工具，而是返回包含工具调用代码的文本回复。这种现象被称为"伪指令"，会导致用户误以为工具已执行，实际上没有任何效果。

原因分析：经过日志分析和代码审查，发现该问题由三个因素共同导致。

第一，提示词中缺少静默回复和心跳确认规则，AI 不知道在某些场景下应该只回复特定标记（如 NO_REPLY 或 HEARTBEAT_OK），而是会把所有内容都输出出来。

第二，工具执行后的提示词存在诱导性语言。旧版本代码在工具执行后会添加一条 user 角色的消息，内容为"工具执行结果…请总结你发现了什么。如果还有需要执行的工具就继续调用。"这种表述会诱导 AI 生成人话总结，而不是继续调用工具或返回最终结果。

第三，工具结果的格式不符合千问 API 要求。旧版本代码使用 user 角色发送工具结果，但千问 API 要求工具结果必须使用 tool 角色，并且必须紧跟在包含 tool_calls 的 assistant 消息之后。

解决方案：针对上述三个原因，分别进行了以下修复。

修复一，按照 OpenClaw 方式重写提示词构造器，添加完整的系统规范，包括 Tool Call Style、Safety、Memory Recall、Silent Replies、Heartbeats、Reply Tags 等章节。

修复二，优化工具执行后的消息处理逻辑。移除诱导性提示词，改为标准的 OpenClaw 消息格式：先添加包含 tool_calls 的 assistant 消息，再添加 tool 角色的工具结果消息，然后继续循环让 AI 看到结果后生成最终回复。

修复三，修改工具结果的消息角色，从 user 改为 tool，并添加 tool_call_id 字段与原始调用关联。

伪指令问题修复对比

// 旧代码（错误）：诱导性提示词 + 错误的消息角色
messages.push({
  role: 'user',
  content: `工具执行结果：\n\n${toolSummary}\n\n请总结你发现了什么。如果还有需要执行的工具就继续调用。`,
});
// 问题：1. role 错误（应该是 tool） 2. 诱导性语言 3. 缺少 tool_call_id

// 新代码（正确）：标准 OpenClaw 消息格式
// 步骤 1：先添加 AI 的响应（包含 tool_calls）
messages.push({
  role: 'assistant',
  content: null,
  tool_calls: response.tool_calls,
});

// 步骤 2：添加工具结果（role: 'tool'，必须紧跟在 assistant 之后）
for (let i = 0; i < response.tool_calls.length; i++) {
  messages.push({
    role: 'tool',
    tool_call_id: response.tool_calls[i].id || `call_${i}`,
    content: results[i] || '执行完成',
  });
}

// 继续循环，让 AI 看到工具结果后生成最终回复
round++;
continue;

千问 API 错误响应示例：

{
  "error": {
    "code": "invalid_parameter_error",
    "message": "messages with role \"tool\" must be a response to a preceeding message with \"tool_calls\"",
    "param": null,
    "type": "invalid_request_error"
  },
  "request_id": "d9f47217-12c1-9077-8425-93f6fba1652d"
}

五、消息格式严格性

OpenClaw 的消息格式是严格的，必须遵循 API 要求。消息顺序必须是 user、assistant with tool_calls、tool、assistant，一步都不能错。

记忆检索功能示例（memory_search）

/**
 * 搜索记忆（遵循 Memory Recall 规范）
 * 在回答关于 prior work、decisions、dates、people、preferences、todos 的问题前必须执行
 */
async searchMemory(userMessage) {
  // 1. 提取关键词
  const keywords = extractKeywords(userMessage);
  if (keywords.length === 0) return null;
  
  // 2. 加载记忆文件到缓存
  await this.loadMemoryToCache();
  
  // 3. 语义搜索（简单版本：关键词匹配）
  const results = [];
  for (const cached of this.memoryCache.files) {
    const matched = keywords.filter(k => 
      cached.contentLower.includes(k.toLowerCase())
    );
    if (matched.length > 0) {
      results.push({
        file: cached.file,
        keywords: matched,
        content: cached.content.substring(0, 2000),
      });
    }
  }
  
  // 4. 返回结果（带 Source 引用）
  return results.length > 0 ? results : null;
}

// 使用示例：
// 用户问："上次修复伪指令问题是什么时候？"
// AI 会自动调用 searchMemory，找到 memory/2026-03-22-伪指令问题修复总结.md
// 并在回复中包含 Source: memory/2026-03-22-伪指令问题修复总结.md#L1

六、计划与规划

小龙虾目前实现了核心的对话和工具调用功能，但还有很大的扩展空间。
比如适配第三方技能插件（功能实现了80%，在完善中，主要是接入腾讯的Skills社区），还有优化提示词缓存机制，减少 token 消耗，提高响应速度。多模态输入输出，包括图片理解、语音交互等功能等。

在架构层面，未来可以考虑引入向量数据库实现更高效的记忆检索，支持 RAG（检索增强生成）模式。还可以探索分布式部署方案，支持多实例负载均衡和高可用配置。

七、总结

小龙虾通过精简 OpenClaw 框架，实现了一个功能完整的 AI 助手系统。系统在提示词构造、工具调用流程、技能动态加载等关键技术点上做出了还算合理的设计决策，并在实际开发过程中解决了各种大小问题。

小龙虾的成功孵化证明了一点：遵循严格的消息格式规范、优化提示词设计、建立完善的文档体系，可以构建出既简洁又可靠的 AI 助手系统。

以后，随着各种大模型的不断发展，AI 助手系统将在更多场景中得到应用，比如自媒体行业就是个目前能看得到的落地点。小龙虾的设计经验和实现细节，希望能为大家提供点参考和借鉴。

小龙虾开发的塔防小游戏：

在这里插入图片描述

有兴趣的朋友可以到我的知识星球“小龙虾孵化实验室”共同探索智能工具的实现与应用（落地与变现）。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

Hugging Face模型压缩超快

AtomGit开源社区

蒙特卡洛风光场景并通过削减法聚类法得到几个典型场景（包含Matlab代码和Python代码实现）

蒙特卡洛方法是一种基于随机抽样的数值计算方法，通过多次随机抽样来估计系统的行为，从而得到系统的统计性质。在风光模型中，蒙特卡洛方法可以用来模拟风速、风向和太阳光照的变化，进而评估风力和太阳能系统在不同条件下的性能。

AtomGit开源社区

【EI复现】基于元模型优化算法的主从博弈多虚拟电厂动态定价和能量管理(Matlab代码实现）

基于元模型的优化算法是一种基于历史数据来驱动样本点的加入从而逼近局部或全局最优解的优化机制，能够改善传统启发式智能算法需要繁复数值模拟的缺陷，目前在飞行器设计等航空航天领域的应用[20]最为广泛，在电力系统方面也有初步的应用。提出基于 Kriging 元模型的博弈均衡算法，在求解过程中建立 Kriging 元模型替代 VPP 内部的能量管理模型，利用粒子群优化算法搜索优异采样点，更新修正 Krig