WorkBuddy 系统架构说明文档
·
📖 01 系统概述
WorkBuddy 是腾讯云 CodeBuddy 旗下的下一代 AI 智能体(Agent)引擎,定位于将复杂的多步骤任务从"人工驱动"升级为"AI 自主执行"。它不仅能理解自然语言指令,还能自主规划任务路径、调用多类工具、操作本地文件系统,并最终交付可验收的成果——而非仅仅给出建议或文字回复。
🎯 核心能力
| 能力 | 说明 |
|---|---|
| 🧠 自然语言理解 | 无需记忆指令,用一句话描述需求即可驱动 AI 执行 |
| ⚙️ 自主规划执行 | 自动将复杂任务拆解为多步骤,规划最优执行路径 |
| 🗂️ 本地文件操作 | 授权后可读写本地文件夹,支持批量处理与格式转换 |
| 🌐 联网搜索能力 | 实时获取互联网信息,支持深度研究与报告生成 |
| 📦 多模态任务 | 支持文档、表格、PPT、代码、图表等多种格式输出 |
| 🔌 工具/技能扩展 | 支持 MCP 协议与 Skill 插件系统,按需扩展能力边界 |
🧩 02 核心功能模块详解
| 模块名称 | 功能说明 | 关键特性 |
|---|---|---|
| 💬 自然语言处理模块 | 负责接收用户的自然语言输入并将其转化为结构化的任务意图。支持中英文混合输入、多轮对话语境保持,并通过 LLM 进行深层语义解析。 | 意图识别 语义解析 多轮对话 上下文保持 |
| 📋 任务规划与管理模块 | 将复杂的用户需求自动拆解为有序的子任务列表(Todo List),并为每个子任务分配最优工具和执行优先级。 | 任务拆解 优先级排序 依赖分析 进度追踪 |
| 🔧 工具调用执行模块 | WorkBuddy 内置丰富的工具集,包括文件读写、终端命令执行、代码搜索与生成、网络请求、图像生成等。 | 文件操作 Shell 命令 代码生成 网络请求 |
| 📦 Skill 技能扩展模块 | 通过可安装的 Skill 插件包扩展 AI 能力边界。每个 Skill 提供领域专属知识、标准化工作流(SOP)和可执行脚本。 | PPTX 处理 PDF 操作 Excel 处理 安全审计 |
| 🤖 多智能体协作模块 | 支持将大型任务分解并分配给多个专业子智能体(Team 模式),各成员并行工作并通过消息机制互相协作。 | Team 创建 并行执行 消息通信 结果汇总 |
| ⏰ 自动化调度模块 | 支持创建基于 iCalendar RRULE 规则的定时自动化任务,实现每日/每周/每小时的周期性任务调度。 | RRULE 调度 周期执行 状态持久化 |
| 🧩 RAG 知识检索模块 | 集成多个专业知识库,通过向量检索增强(RAG)技术,在用户提问时自动关联最新的专业文档。 | 向量检索 知识库管理 上下文增强 |
| 🔌 MCP 协议集成模块 | 通过标准 MCP(Model Context Protocol)协议接入第三方工具和服务,极大扩展了 WorkBuddy 的能力边界。 | MCP 协议 第三方集成 动态工具发现 |
| 🛡️ 安全与权限控制模块 | 对所有涉及文件修改、命令执行、网络访问的操作实施分级权限控制。高风险操作须经用户明确授权。 | 操作审批 权限分级 安全审计 |
⚡ 03 三大工作模式
| 🔨 Craft 模式 | 🗺️ Plan 模式 | 💬 Ask 模式 |
|---|---|---|
| CRAFT MODE
直接执行模式。AI 立即采取行动完成任务,可读写文件、执行命令、生成内容并直接交付结果。 适合需要快速、连续完成的明确任务,无需中间确认,效率最高。 💡 适用场景:代码生成、文档创建、数据处理 |
PLAN MODE
先规划后执行模式。AI 先分析需求并设计详细的执行方案,以结构化步骤呈现给用户审阅确认。 用户批准后再开始执行。适合复杂、高风险或需要把控方向的任务。 💡 适用场景:架构设计、重构方案、复杂功能开发 |
ASK MODE
纯对话分析模式。AI 只回答问题、读取文件和分析信息,不修改任何文件也不执行命令。 适合探索性学习、代码审查、方案咨询等场景,完全无副作用。 💡 适用场景:代码审查、技术咨询、问题诊断 |
🛠️ 04 工具层说明
| 工具名称 | 功能说明 | 工具名称 | 功能说明 |
|---|---|---|---|
| 📄 read_file | 读取文件内容,支持偏移与限制行 | 🔍 search_file | 通配符模式文件搜索 |
| ✏️ write_to_file | 写入/覆盖文件到指定路径 | 🔎 search_content | 基于 ripgrep 的正则内容搜索 |
| 🔄 replace_in_file | 精确字符串替换,保留上下文 | 💻 execute_command | 执行系统命令(高风险需授权) |
| 🗑️ delete_file | 删除指定路径文件(需授权) | 🌐 web_fetch | 抓取网页并转换为 Markdown |
| 📁 list_dir | 列出目录结构,支持忽略规则 | 🔭 web_search | 实时网络搜索,获取最新信息 |
| 🖼️ image_gen | 根据描述生成图像内容 | 📦 use_skill | 加载并激活专业领域 Skill |
| 🔬 read_lints | 读取 IDE 诊断信息与 Lint 错误 | 🤖 task (subagent) | 启动子智能体完成特定探索任务 |
| ⏰ automation_update | 创建/更新定时自动化任务 | 💾 update_memory | 持久化保存关键记忆信息 |
| 🔌 invoke_integration | 连接云服务(CloudBase/Supabase) | 📊 RAG_search | 检索专业知识库增强回答 |
📊 05 数据流转说明
| 阶段 | 说明 |
|---|---|
| 1️⃣ 用户输入 | 用户通过 IDE Chat 面板输入自然语言指令,可附带文件、图片等多模态内容。输入信息与当前对话历史合并形成完整上下文(Context)。 |
| 2️⃣ LLM 推理 | 完整上下文通过 API 发送至云端大语言模型(LLM)进行推理。LLM 根据系统提示词、工具定义、对话历史生成推理结果,输出下一步行动指令或工具调用请求。 |
| 3️⃣ 工具执行 | Agent 循环解析 LLM 的工具调用请求,在本地环境中依次执行对应工具(文件操作/命令执行/网络请求等)。对于需要授权的高风险操作,先暂停并向用户申请权限。 |
| 4️⃣ 观察反馈 | 工具执行结果(Observation)被追加回上下文中,供 LLM 在下一轮推理时参考。这形成了"Context → Think → Act → Observe"的闭环 Agent 循环,直至任务完成。 |
| 5️⃣ 成果交付 | 所有子任务完成后,WorkBuddy 将最终产出(文档、代码、报告等)保存至本地文件系统,并通过 preview_url 或 open_result_view 在 IDE 内直接展示给用户验收。 |
| 6️⃣ 记忆持久化 | 重要的用户偏好、项目信息、决策结果通过 Memory 模块持久化存储,供未来对话复用。Artifact 文档保存在专属目录中,记录当次对话的规划与执行摘要。 |
📊 06 与传统工具对比
| 能力维度 | 传统 AI 对话工具 | 传统 IDE 插件 | WorkBuddy |
|---|---|---|---|
| 任务执行 | ✗ 仅提供建议 | △ 有限执行 | ✓ 自主执行 |
| 本地文件操作 | ✗ 不支持 | △ 部分支持 | ✓ 完整支持 |
| 多步骤任务链 | ✗ 单轮回复 | ✗ 不支持 | ✓ 自动规划执行 |
| 工具调用能力 | ✗ 无 | △ 单一工具 | ✓ 18+ 工具集 |
| 技能/插件扩展 | ✗ 不支持 | △ 有限插件 | ✓ Skill + MCP 双扩展 |
| 多智能体协作 | ✗ 不支持 | ✗ 不支持 | ✓ Team 模式 |
| 定时自动化 | ✗ 不支持 | △ 有限 | ✓ RRULE 调度 |
| 联网搜索 | △ 部分支持 | ✗ 不支持 | ✓ 实时检索 |
| 成果交付方式 | 文字回复 | 代码片段 | ✓ 完整文件/应用交付 |
🛡️ 07 安全与权限机制
| 安全机制 | 说明 |
|---|---|
| 🔐 分级权限控制 | 所有工具操作按风险等级分类。高风险操作(命令执行、删除文件、访问工作区外路径)须经用户明确授权,低风险操作(读取文件、搜索)可自动执行。 |
| 🧪 Skill 安全审计 | 安装第三方 Skill 前,系统强制执行安全审计(P0/P1/P2 三级风险评估)。P0 级风险强烈警告并需明确确认,P1 级警告需确认,P2 级可正常安装。 |
| 🚫 内容安全过滤 | 内置严格的内容安全策略,拒绝处理政治敏感、色情、违法活动指导、个人隐私泄露、虚假信息等有害内容,安全规则优先级高于任何用户指令。 |
| 🔒 模型信息保护 | 严格保护底层 AI 模型相关信息,禁止在任何情况下透露、暗示或猜测所使用的模型名称、版本或代号,此规则拥有最高优先级。 |
| 📂 工作区边界保护 | 默认操作范围限定在当前工作区目录内。访问工作区外的文件系统路径(如桌面、系统目录)需要用户安全审批,防止意外访问敏感文件。 |
| 🔄 Git 操作安全 | 禁止执行破坏性 Git 操作(force push、hard reset 等),禁止跳过 Git hooks,禁止在未经明确要求时自动提交代码,保护代码仓库安全。 |
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)