📖 01 系统概述

WorkBuddy 是腾讯云 CodeBuddy 旗下的下一代 AI 智能体(Agent)引擎,定位于将复杂的多步骤任务从"人工驱动"升级为"AI 自主执行"。它不仅能理解自然语言指令,还能自主规划任务路径、调用多类工具、操作本地文件系统,并最终交付可验收的成果——而非仅仅给出建议或文字回复。

🎯 核心能力

能力 说明
🧠 自然语言理解 无需记忆指令,用一句话描述需求即可驱动 AI 执行
⚙️ 自主规划执行 自动将复杂任务拆解为多步骤,规划最优执行路径
🗂️ 本地文件操作 授权后可读写本地文件夹,支持批量处理与格式转换
🌐 联网搜索能力 实时获取互联网信息,支持深度研究与报告生成
📦 多模态任务 支持文档、表格、PPT、代码、图表等多种格式输出
🔌 工具/技能扩展 支持 MCP 协议与 Skill 插件系统,按需扩展能力边界

🧩 02 核心功能模块详解

模块名称 功能说明 关键特性
💬 自然语言处理模块 负责接收用户的自然语言输入并将其转化为结构化的任务意图。支持中英文混合输入、多轮对话语境保持,并通过 LLM 进行深层语义解析。 意图识别 语义解析 多轮对话 上下文保持
📋 任务规划与管理模块 将复杂的用户需求自动拆解为有序的子任务列表(Todo List),并为每个子任务分配最优工具和执行优先级。 任务拆解 优先级排序 依赖分析 进度追踪
🔧 工具调用执行模块 WorkBuddy 内置丰富的工具集,包括文件读写、终端命令执行、代码搜索与生成、网络请求、图像生成等。 文件操作 Shell 命令 代码生成 网络请求
📦 Skill 技能扩展模块 通过可安装的 Skill 插件包扩展 AI 能力边界。每个 Skill 提供领域专属知识、标准化工作流(SOP)和可执行脚本。 PPTX 处理 PDF 操作 Excel 处理 安全审计
🤖 多智能体协作模块 支持将大型任务分解并分配给多个专业子智能体(Team 模式),各成员并行工作并通过消息机制互相协作。 Team 创建 并行执行 消息通信 结果汇总
⏰ 自动化调度模块 支持创建基于 iCalendar RRULE 规则的定时自动化任务,实现每日/每周/每小时的周期性任务调度。 RRULE 调度 周期执行 状态持久化
🧩 RAG 知识检索模块 集成多个专业知识库,通过向量检索增强(RAG)技术,在用户提问时自动关联最新的专业文档。 向量检索 知识库管理 上下文增强
🔌 MCP 协议集成模块 通过标准 MCP(Model Context Protocol)协议接入第三方工具和服务,极大扩展了 WorkBuddy 的能力边界。 MCP 协议 第三方集成 动态工具发现
🛡️ 安全与权限控制模块 对所有涉及文件修改、命令执行、网络访问的操作实施分级权限控制。高风险操作须经用户明确授权。 操作审批 权限分级 安全审计

⚡ 03 三大工作模式

🔨 Craft 模式 🗺️ Plan 模式 💬 Ask 模式
CRAFT MODE

直接执行模式。AI 立即采取行动完成任务,可读写文件、执行命令、生成内容并直接交付结果。

适合需要快速、连续完成的明确任务,无需中间确认,效率最高。

💡 适用场景:代码生成、文档创建、数据处理

PLAN MODE

先规划后执行模式。AI 先分析需求并设计详细的执行方案,以结构化步骤呈现给用户审阅确认。

用户批准后再开始执行。适合复杂、高风险或需要把控方向的任务。

💡 适用场景:架构设计、重构方案、复杂功能开发

ASK MODE

纯对话分析模式。AI 只回答问题、读取文件和分析信息,不修改任何文件也不执行命令。

适合探索性学习、代码审查、方案咨询等场景,完全无副作用。

💡 适用场景:代码审查、技术咨询、问题诊断

🛠️ 04 工具层说明

工具名称 功能说明 工具名称 功能说明
📄 read_file 读取文件内容,支持偏移与限制行 🔍 search_file 通配符模式文件搜索
✏️ write_to_file 写入/覆盖文件到指定路径 🔎 search_content 基于 ripgrep 的正则内容搜索
🔄 replace_in_file 精确字符串替换,保留上下文 💻 execute_command 执行系统命令(高风险需授权)
🗑️ delete_file 删除指定路径文件(需授权) 🌐 web_fetch 抓取网页并转换为 Markdown
📁 list_dir 列出目录结构,支持忽略规则 🔭 web_search 实时网络搜索,获取最新信息
🖼️ image_gen 根据描述生成图像内容 📦 use_skill 加载并激活专业领域 Skill
🔬 read_lints 读取 IDE 诊断信息与 Lint 错误 🤖 task (subagent) 启动子智能体完成特定探索任务
⏰ automation_update 创建/更新定时自动化任务 💾 update_memory 持久化保存关键记忆信息
🔌 invoke_integration 连接云服务(CloudBase/Supabase) 📊 RAG_search 检索专业知识库增强回答

📊 05 数据流转说明

阶段 说明
1️⃣ 用户输入 用户通过 IDE Chat 面板输入自然语言指令,可附带文件、图片等多模态内容。输入信息与当前对话历史合并形成完整上下文(Context)。
2️⃣ LLM 推理 完整上下文通过 API 发送至云端大语言模型(LLM)进行推理。LLM 根据系统提示词、工具定义、对话历史生成推理结果,输出下一步行动指令或工具调用请求。
3️⃣ 工具执行 Agent 循环解析 LLM 的工具调用请求,在本地环境中依次执行对应工具(文件操作/命令执行/网络请求等)。对于需要授权的高风险操作,先暂停并向用户申请权限。
4️⃣ 观察反馈 工具执行结果(Observation)被追加回上下文中,供 LLM 在下一轮推理时参考。这形成了"Context → Think → Act → Observe"的闭环 Agent 循环,直至任务完成。
5️⃣ 成果交付 所有子任务完成后,WorkBuddy 将最终产出(文档、代码、报告等)保存至本地文件系统,并通过 preview_url 或 open_result_view 在 IDE 内直接展示给用户验收。
6️⃣ 记忆持久化 重要的用户偏好、项目信息、决策结果通过 Memory 模块持久化存储,供未来对话复用。Artifact 文档保存在专属目录中,记录当次对话的规划与执行摘要。

📊 06 与传统工具对比

能力维度 传统 AI 对话工具 传统 IDE 插件 WorkBuddy
任务执行 ✗ 仅提供建议 △ 有限执行 ✓ 自主执行
本地文件操作 ✗ 不支持 △ 部分支持 ✓ 完整支持
多步骤任务链 ✗ 单轮回复 ✗ 不支持 ✓ 自动规划执行
工具调用能力 ✗ 无 △ 单一工具 ✓ 18+ 工具集
技能/插件扩展 ✗ 不支持 △ 有限插件 ✓ Skill + MCP 双扩展
多智能体协作 ✗ 不支持 ✗ 不支持 ✓ Team 模式
定时自动化 ✗ 不支持 △ 有限 ✓ RRULE 调度
联网搜索 △ 部分支持 ✗ 不支持 ✓ 实时检索
成果交付方式 文字回复 代码片段 ✓ 完整文件/应用交付

🛡️ 07 安全与权限机制

安全机制 说明
🔐 分级权限控制 所有工具操作按风险等级分类。高风险操作(命令执行、删除文件、访问工作区外路径)须经用户明确授权,低风险操作(读取文件、搜索)可自动执行。
🧪 Skill 安全审计 安装第三方 Skill 前,系统强制执行安全审计(P0/P1/P2 三级风险评估)。P0 级风险强烈警告并需明确确认,P1 级警告需确认,P2 级可正常安装。
🚫 内容安全过滤 内置严格的内容安全策略,拒绝处理政治敏感、色情、违法活动指导、个人隐私泄露、虚假信息等有害内容,安全规则优先级高于任何用户指令。
🔒 模型信息保护 严格保护底层 AI 模型相关信息,禁止在任何情况下透露、暗示或猜测所使用的模型名称、版本或代号,此规则拥有最高优先级。
📂 工作区边界保护 默认操作范围限定在当前工作区目录内。访问工作区外的文件系统路径(如桌面、系统目录)需要用户安全审批,防止意外访问敏感文件。
🔄 Git 操作安全 禁止执行破坏性 Git 操作(force push、hard reset 等),禁止跳过 Git hooks,禁止在未经明确要求时自动提交代码,保护代码仓库安全。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐