WorkBuddy 系统架构说明文档

Openclaw2026

3461人浏览 · 2026-03-20 17:00:00

Openclaw2026 · 2026-03-20 17:00:00 发布

📖 01 系统概述

WorkBuddy 是腾讯云 CodeBuddy 旗下的下一代 AI 智能体（Agent）引擎，定位于将复杂的多步骤任务从"人工驱动"升级为"AI 自主执行"。它不仅能理解自然语言指令，还能自主规划任务路径、调用多类工具、操作本地文件系统，并最终交付可验收的成果——而非仅仅给出建议或文字回复。

🎯 核心能力

能力	说明
🧠 自然语言理解	无需记忆指令，用一句话描述需求即可驱动 AI 执行
⚙️ 自主规划执行	自动将复杂任务拆解为多步骤，规划最优执行路径
🗂️ 本地文件操作	授权后可读写本地文件夹，支持批量处理与格式转换
🌐 联网搜索能力	实时获取互联网信息，支持深度研究与报告生成
📦 多模态任务	支持文档、表格、PPT、代码、图表等多种格式输出
🔌 工具/技能扩展	支持 MCP 协议与 Skill 插件系统，按需扩展能力边界

🧩 02 核心功能模块详解

模块名称	功能说明	关键特性
💬 自然语言处理模块	负责接收用户的自然语言输入并将其转化为结构化的任务意图。支持中英文混合输入、多轮对话语境保持，并通过 LLM 进行深层语义解析。	意图识别语义解析多轮对话上下文保持
📋 任务规划与管理模块	将复杂的用户需求自动拆解为有序的子任务列表（Todo List），并为每个子任务分配最优工具和执行优先级。	任务拆解优先级排序依赖分析进度追踪
🔧 工具调用执行模块	WorkBuddy 内置丰富的工具集，包括文件读写、终端命令执行、代码搜索与生成、网络请求、图像生成等。	文件操作 Shell 命令代码生成网络请求
📦 Skill 技能扩展模块	通过可安装的 Skill 插件包扩展 AI 能力边界。每个 Skill 提供领域专属知识、标准化工作流（SOP）和可执行脚本。	PPTX 处理 PDF 操作 Excel 处理安全审计
🤖 多智能体协作模块	支持将大型任务分解并分配给多个专业子智能体（Team 模式），各成员并行工作并通过消息机制互相协作。	Team 创建并行执行消息通信结果汇总
⏰ 自动化调度模块	支持创建基于 iCalendar RRULE 规则的定时自动化任务，实现每日/每周/每小时的周期性任务调度。	RRULE 调度周期执行状态持久化
🧩 RAG 知识检索模块	集成多个专业知识库，通过向量检索增强（RAG）技术，在用户提问时自动关联最新的专业文档。	向量检索知识库管理上下文增强
🔌 MCP 协议集成模块	通过标准 MCP（Model Context Protocol）协议接入第三方工具和服务，极大扩展了 WorkBuddy 的能力边界。	MCP 协议第三方集成动态工具发现
🛡️ 安全与权限控制模块	对所有涉及文件修改、命令执行、网络访问的操作实施分级权限控制。高风险操作须经用户明确授权。	操作审批权限分级安全审计

⚡ 03 三大工作模式

🔨 Craft 模式	🗺️ Plan 模式	💬 Ask 模式
CRAFT MODE 直接执行模式。AI 立即采取行动完成任务，可读写文件、执行命令、生成内容并直接交付结果。适合需要快速、连续完成的明确任务，无需中间确认，效率最高。 💡 适用场景：代码生成、文档创建、数据处理	PLAN MODE 先规划后执行模式。AI 先分析需求并设计详细的执行方案，以结构化步骤呈现给用户审阅确认。用户批准后再开始执行。适合复杂、高风险或需要把控方向的任务。 💡 适用场景：架构设计、重构方案、复杂功能开发	ASK MODE 纯对话分析模式。AI 只回答问题、读取文件和分析信息，不修改任何文件也不执行命令。适合探索性学习、代码审查、方案咨询等场景，完全无副作用。 💡 适用场景：代码审查、技术咨询、问题诊断

🔨 Craft 模式

🗺️ Plan 模式

💬 Ask 模式

CRAFT MODE

直接执行模式。AI 立即采取行动完成任务，可读写文件、执行命令、生成内容并直接交付结果。

适合需要快速、连续完成的明确任务，无需中间确认，效率最高。

💡 适用场景：代码生成、文档创建、数据处理

PLAN MODE

先规划后执行模式。AI 先分析需求并设计详细的执行方案，以结构化步骤呈现给用户审阅确认。

用户批准后再开始执行。适合复杂、高风险或需要把控方向的任务。

💡 适用场景：架构设计、重构方案、复杂功能开发

ASK MODE

纯对话分析模式。AI 只回答问题、读取文件和分析信息，不修改任何文件也不执行命令。

适合探索性学习、代码审查、方案咨询等场景，完全无副作用。

💡 适用场景：代码审查、技术咨询、问题诊断

🛠️ 04 工具层说明

工具名称	功能说明	工具名称	功能说明
📄 read_file	读取文件内容，支持偏移与限制行	🔍 search_file	通配符模式文件搜索
✏️ write_to_file	写入/覆盖文件到指定路径	🔎 search_content	基于 ripgrep 的正则内容搜索
🔄 replace_in_file	精确字符串替换，保留上下文	💻 execute_command	执行系统命令（高风险需授权）
🗑️ delete_file	删除指定路径文件（需授权）	🌐 web_fetch	抓取网页并转换为 Markdown
📁 list_dir	列出目录结构，支持忽略规则	🔭 web_search	实时网络搜索，获取最新信息
🖼️ image_gen	根据描述生成图像内容	📦 use_skill	加载并激活专业领域 Skill
🔬 read_lints	读取 IDE 诊断信息与 Lint 错误	🤖 task (subagent)	启动子智能体完成特定探索任务
⏰ automation_update	创建/更新定时自动化任务	💾 update_memory	持久化保存关键记忆信息
🔌 invoke_integration	连接云服务（CloudBase/Supabase）	📊 RAG_search	检索专业知识库增强回答

📊 05 数据流转说明

阶段	说明
1️⃣ 用户输入	用户通过 IDE Chat 面板输入自然语言指令，可附带文件、图片等多模态内容。输入信息与当前对话历史合并形成完整上下文（Context）。
2️⃣ LLM 推理	完整上下文通过 API 发送至云端大语言模型（LLM）进行推理。LLM 根据系统提示词、工具定义、对话历史生成推理结果，输出下一步行动指令或工具调用请求。
3️⃣ 工具执行	Agent 循环解析 LLM 的工具调用请求，在本地环境中依次执行对应工具（文件操作/命令执行/网络请求等）。对于需要授权的高风险操作，先暂停并向用户申请权限。
4️⃣ 观察反馈	工具执行结果（Observation）被追加回上下文中，供 LLM 在下一轮推理时参考。这形成了"Context → Think → Act → Observe"的闭环 Agent 循环，直至任务完成。
5️⃣ 成果交付	所有子任务完成后，WorkBuddy 将最终产出（文档、代码、报告等）保存至本地文件系统，并通过 preview_url 或 open_result_view 在 IDE 内直接展示给用户验收。
6️⃣ 记忆持久化	重要的用户偏好、项目信息、决策结果通过 Memory 模块持久化存储，供未来对话复用。Artifact 文档保存在专属目录中，记录当次对话的规划与执行摘要。

📊 06 与传统工具对比

能力维度	传统 AI 对话工具	传统 IDE 插件	WorkBuddy
任务执行	✗ 仅提供建议	△ 有限执行	✓ 自主执行
本地文件操作	✗ 不支持	△ 部分支持	✓ 完整支持
多步骤任务链	✗ 单轮回复	✗ 不支持	✓ 自动规划执行
工具调用能力	✗ 无	△ 单一工具	✓ 18+ 工具集
技能/插件扩展	✗ 不支持	△ 有限插件	✓ Skill + MCP 双扩展
多智能体协作	✗ 不支持	✗ 不支持	✓ Team 模式
定时自动化	✗ 不支持	△ 有限	✓ RRULE 调度
联网搜索	△ 部分支持	✗ 不支持	✓ 实时检索
成果交付方式	文字回复	代码片段	✓ 完整文件/应用交付

🛡️ 07 安全与权限机制

安全机制	说明
🔐 分级权限控制	所有工具操作按风险等级分类。高风险操作（命令执行、删除文件、访问工作区外路径）须经用户明确授权，低风险操作（读取文件、搜索）可自动执行。
🧪 Skill 安全审计	安装第三方 Skill 前，系统强制执行安全审计（P0/P1/P2 三级风险评估）。P0 级风险强烈警告并需明确确认，P1 级警告需确认，P2 级可正常安装。
🚫 内容安全过滤	内置严格的内容安全策略，拒绝处理政治敏感、色情、违法活动指导、个人隐私泄露、虚假信息等有害内容，安全规则优先级高于任何用户指令。
🔒 模型信息保护	严格保护底层 AI 模型相关信息，禁止在任何情况下透露、暗示或猜测所使用的模型名称、版本或代号，此规则拥有最高优先级。
📂 工作区边界保护	默认操作范围限定在当前工作区目录内。访问工作区外的文件系统路径（如桌面、系统目录）需要用户安全审批，防止意外访问敏感文件。
🔄 Git 操作安全	禁止执行破坏性 Git 操作（force push、hard reset 等），禁止跳过 Git hooks，禁止在未经明确要求时自动提交代码，保护代码仓库安全。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

我们如何利用「混沌工程」工具Chaos Blade进行故障演练？

而Chaos Blade作为阿里巴巴开源的混沌工程实验工具，凭借其轻量级、易用性和丰富的故障场景支持，成为故障演练的利器。这种与K8s深度集成的能力，使得在微服务架构下进行服务熔断、节点宕机等演练变得异常简单，有效验证服务网格的容错机制。Chaos Blade支持创建复杂的演练场景。建议将演练结果与监控系统、日志平台的数据进行关联分析，找出系统的薄弱环节，持续优化架构设计。通过定期使用Chaos

AtomGit开源社区

AI 辅助学术写作（五）：模块化论文撰写与开源交付——从草稿到可复现研究包

这两个部分放在最后写，因为它们是对全文的精炼，而不是提前预设的框架。请基于以下信息，撰写一个150-200字的学术摘要。【摘要必须包含的五个要素】1. 研究问题（一句话）：[你的核心研究问题]2. 研究方法（一句话）：[数据来源 + 识别策略]3. 核心发现（两句话）：[主要系数 + 经济含义]4. 异质性/机制（一句话）：[最重要的一个扩展发现]5. 政策含义（一句话）：[对政策制定的启示]【格

AtomGit开源社区

DALI / UMAP / H5

这几个词通常出现在深度学习框架、数据处理库、AI训练平台或代码仓库的功能说明中，表示该系统支持相应的数据处理技术或文件格式。DALI 指的是 NVIDIA DALI（Data Loading Library）。它是 NVIDIA 开发的高性能数据加载与预处理框架，主要用于加速训练过程。例如 ImageNet 训练时，DALI 可以减少 CPU 成为瓶颈的问题。对于大规模视觉训练（ImageNet、