ai-dev-workflow(SkillHub)
ai-dev-workflow(ClawHub)

WorkBuddy复杂功能描述

需求点0:AI对话与智能执行

功能点0.1:自然语言对话与工具调用

执行点0.1.1:发送消息与智能响应
用户操作
  1. 在对话界面底部输入框,输入自然语言消息。
  2. 支持多种输入方式:
    • 纯文本:直接输入问题、指令或描述
    • @引用语法
      • @file://路径 引用特定文件
      • @folder://路径 引用整个目录
      • @skill://技能名 直接加载技能
    • 附件上传
      • 拖拽文件到输入框
      • 粘贴截图(Ctrl+V)
      • 支持图片格式:jpeg、png、gif、webp
      • 支持文档格式:pdf、docx、xlsx、pptx、md、txt等
  3. 点击发送按钮或按回车键提交。
  4. 实时查看AI执行过程:
    • 工具调用状态
    • 文件操作进度
    • 命令执行输出
    • 搜索结果展示
  5. 获取最终响应结果,可继续追问或切换话题。
系统逻辑
  1. 上下文组装
    • 读取身份文件:SOUL.md(角色定位)、IDENTITY.md(身份信息)、USER.md(用户画像)
    • 读取工作记忆:.workbuddy/memory/MEMORY.md(长期记忆)+ 今日/昨日日志
    • 加载项目上下文:文件树快照、项目配置
    • 拼接历史对话:当前会话的完整消息历史
    • 总Token数控制:不超过128K
  2. 意图识别与分类
    • 闲聊问答类:直接生成回复
    • 代码生成类:准备调用write_to_file/replace_in_file
    • 文件操作类:准备调用read_file/search_file/list_dir
    • 搜索探索类:准备调用search_content/code-explorer
    • 命令执行类:准备调用execute_command
    • 技能触发类:匹配已安装技能的triggers,准备调用use_skill
    • 团队协作类:准备调用task/send_message
    • 自动化任务类:准备调用automation_update
  3. 工具选择与执行
    • 基于意图自动选择合适的工具组合
    • 支持单次调用多个工具并行执行
    • 敏感操作触发确认流程:
      • 删除文件(delete_file)
      • 执行命令(execute_command)
      • 修改系统配置
      • 操作工作区外文件
    • 失败时提供详细错误信息和修复建议
  4. 响应生成
    • 流式返回响应内容(逐字显示)
    • 展示工具调用结果摘要
    • 提供后续操作建议
    • 自动判断是否需要调用open_result_view/preview_url展示结果
关键配置参数
  • 最大上下文Token数:128K
  • 流式响应:默认开启
  • 工具调用并发限制:5个并行
  • 敏感操作确认开关:默认开启
  • 响应语言:中文

执行点0.1.2:多模态输入处理
用户操作
  1. 图片输入
    • 截图后直接粘贴(Ctrl+V)
    • 拖拽图片文件到输入框
    • 点击附件按钮选择图片
    • 支持格式:jpeg/jpg、png、gif、webp
  2. 文件引用
    • 输入 @file: 触发文件选择器
    • 从项目文件树中选择文件
    • 文件内容自动加载到上下文
    • 支持代码文件、Markdown、JSON、XML等
  3. 目录引用
    • 输入 @folder: 引用整个目录
    • AI获取目录结构快照
    • 可浏览、搜索、分析目录内容
  4. 技能加载
    • 输入 @skill://技能名 直接加载技能
    • 示例:@skill://AI Dev Workflow 加载编程工作流技能
    • 技能SKILL.md自动注入上下文
  5. 添加说明文字(可选):
    • “解释这张截图中的架构”
    • “分析这个文件的代码逻辑”
    • “使用这个技能生成项目”
系统逻辑
  1. 图片处理
    • 调用视觉模型分析图片内容
    • 支持能力:
      • OCR文字提取
      • 代码截图解析
      • UI设计稿分析
      • 图表数据识别
    • 图片转Base64或上传临时存储
    • 最大尺寸:2048x2048像素
  2. 文件处理
    • 读取文件内容注入上下文
    • 大文件支持分段读取(offset/limit)
    • 自动检测文件编码(UTF-8、GBK、GB2312)
    • 显示行号便于讨论特定代码行
  3. 目录处理
    • 获取目录结构快照(list_dir)
    • 支持glob模式筛选(如 **/*.kt
    • 自动忽略:node_modules、.git、dist、build、pycache
  4. 技能处理
    • 加载技能的SKILL.md到上下文
    • 加载references/目录下的参考文档
    • 注册scripts/目录下的可用脚本
    • 执行技能定义的工作流
关键配置参数
  • 图片最大尺寸:2048x2048
  • 图片最大文件大小:10MB
  • 大文件分段大小:每段1000行
  • 目录忽略模式:node_modules、.git、dist、build、pycache、.next

功能点0.2:会话管理

执行点0.2.1:创建与管理会话
用户操作
  1. 创建新会话
    • 点击侧边栏"新建对话"按钮
    • 或使用快捷键(Ctrl+N)
    • 新会话自动关联当前工作区
  2. 切换会话
    • 在会话列表中选择历史会话
    • 点击后恢复完整对话历史
    • 工作区上下文自动切换
  3. 会话操作
    • 重命名:右键点击选择"重命名"
    • 删除:右键点击选择"删除"
    • 置顶:右键点击选择"置顶"
    • 导出:导出为Markdown文件
  4. 会话搜索
    • 在搜索框输入关键词
    • 搜索范围:会话标题、消息内容
    • 结果高亮显示匹配项
系统逻辑
  1. 会话创建
    • 生成唯一会话ID(UUID)
    • 创建今日工作记忆文件:.workbuddy/memory/YYYY-MM-DD.md(如不存在)
    • 初始化空的消息历史列表
    • 设置会话关联的工作区路径
  2. 会话恢复
    • 从SQLite数据库加载历史消息
    • 按时间顺序渲染到对话区域
    • 重新读取工作区上下文
    • 重新加载记忆文件
  3. 会话持久化
    • 实时保存每条消息到数据库
    • 工作记忆自动追加到日志文件
    • 支持跨设备同步(如启用云同步)
  4. 会话删除
    • 软删除会话记录(保留日志用于审计)
    • 保留关联的工作记忆文件
    • 30天后永久清除
关键配置参数
  • 会话存储位置%APPDATA%/WorkBuddy/data/conversations.db
  • 历史消息保留策略:永久
  • 软删除保留期:30天
  • 会话标题自动生成:基于首条消息内容

需求点1:文件系统操作

功能点1.1:文件读写与编辑

执行点1.1.1:读取文件
用户操作
  1. 直接请求
    • “读取 config.json”
    • “查看 src/main.kt 的内容”
    • “打开 README.md”
  2. 引用语法
    • “@file://src/utils/Helper.kt”
  3. 搜索后读取
    • 先搜索文件列表
    • 选择要读取的文件
  4. 分段读取大文件
    • “读取 main.kt 的前100行”
    • “查看 log.txt 的最后50行”
    • “读取第200到300行”
系统逻辑
  1. 路径解析
    • 相对路径:基于当前工作区根目录
    • 绝对路径:直接使用(需在工作区内或获批准)
    • 路径规范化:处理 ...、分隔符差异
    • 编码安全:防止路径遍历攻击
  2. 文件读取
    • 调用 read_file 工具
    • 自动检测文件编码(UTF-8、GBK、GB2312、ISO-8859-1)
    • 添加行号标记(格式: 1:代码内容
    • 大文件支持offset/limit分页读取
    • 图片文件直接渲染展示
  3. 内容展示
    • Markdown渲染代码块
    • 语法高亮(根据文件扩展名)
    • 显示文件元信息:大小、行数、编码
    • IDE诊断信息:错误、警告、提示(如可用)
  4. 错误处理
    • 文件不存在:提示并建议相似文件
    • 权限不足:提示并引导授权
    • 编码错误:尝试多种编码解码
安全规则
  • 仅允许读取工作区内文件
  • 敏感文件读取警告:.env、credentials、private_key、secrets
  • 工作区外文件需用户确认
关键配置参数
  • 默认读取行数限制:无限制(但Token受限)
  • 分段读取默认大小:1000行
  • 支持的图片格式:jpeg、png、gif、webp

执行点1.1.2:编辑文件
用户操作
  1. 描述修改意图
    • “把 main.kt 中的 fun 改成 suspend fun”
    • “在 config.json 添加一个新字段”
    • “删除 utils.kt 中的第10到15行”
  2. AI展示修改计划
    • 显示待替换的原始内容
    • 显示替换后的新内容
    • 高亮差异部分
  3. 确认执行
    • 查看修改内容后确认
    • 或提出调整意见
  4. 查看修改结果
    • 文件修改后自动重新读取
    • 显示修改后的内容
    • 调用linter检查语法错误
系统逻辑
  1. 内容定位
    • 先读取当前文件完整内容
    • 根据用户描述定位待修改位置
    • 提取精确的字符串片段(old_str)
    • 验证匹配唯一性(old_str在文件中只出现一次)
  2. 替换执行
    • 调用 replace_in_file 工具
    • 精确字符串替换:
      • 保留原始缩进(空格/Tab)
      • 保留原始换行符(CRLF/LF)
      • 保留原始引号(中文/英文、单/双引号)
    • 失败时提供详细错误:
      • old_str未找到
      • old_str出现多次
      • 文件被外部修改
  3. 变更验证
    • 重新读取文件确认修改成功
    • 调用 read_lints 检查语法错误
    • 显示修改前后对比
    • 提供撤销建议(如使用Git)
状态规则
  • 文件被锁定(其他进程写入中):等待或提示
  • 文件不存在:提示创建新文件
  • 文件为空:直接使用write_to_file
关键配置参数
  • 自动linter检查:默认开启
  • 显示修改对比:默认开启

执行点1.1.3:创建与删除文件
用户操作
  1. 创建文件
    • “创建 src/api/UserApi.kt”
    • “新建 README.md 并写入以下内容…”
    • “创建目录 src/utils/”
  2. 删除文件
    • “删除 temp.txt”
    • “删除 dist 目录”
    • 确认删除操作(敏感操作)
  3. 批量操作
    • “创建以下文件:a.kt, b.kt, c.kt”
    • “清空 build 目录”
系统逻辑
  1. 文件创建
    • 调用 write_to_file 工具
    • 自动创建父目录(如不存在)
    • 文件存在时覆盖(提供警告)
    • 设置创建时间戳
  2. 目录创建
    • 使用execute_command执行 mkdir -pNew-Item -ItemType Directory
    • 递归创建父目录
  3. 文件删除
    • 调用 delete_file 工具
    • Windows:移动到回收站
    • macOS:移动到废纸篓
    • Linux:使用 gio trashtrash-put
    • 记录删除日志(时间、路径、原因)
  4. 批量操作
    • 单次最多处理10个文件
    • 每个文件操作后验证成功
    • 任一失败立即停止并回滚
安全规则
  • 禁止删除 .workbuddy 目录
  • 禁止删除系统目录:/、C:\、/System、AppData、Library、~/.config
  • 禁止递归删除Desktop、Downloads、Documents、Home目录
  • 工作区外文件操作需用户确认
  • 批量删除需额外确认
关键配置参数
  • 批量操作最大文件数:10个
  • 删除方式:回收站/废纸篓(不直接rm)

功能点1.2:文件搜索与探索

执行点1.2.1:搜索文件
用户操作
  1. 按文件名搜索
    • “搜索所有 .kt 文件”
    • “找 test_*.py”
    • “搜索包含 ‘service’ 的文件”
  2. 按内容搜索
    • “搜索包含 ‘TODO’ 的文件”
    • “查找 ‘fun main’ 函数定义”
    • “搜索所有 ‘import kotlinx’ 的行”
    • 支持正则表达式
  3. 组合搜索
    • “在 .kt 文件中搜索 ‘class User’”
    • “搜索 test 目录下的所有 TODO”
系统逻辑
  1. 文件名搜索
    • 调用 search_file 工具
    • 支持glob模式:*(任意字符)、?(单字符)、**(递归)
    • 递归搜索子目录
    • 自动排除:node_modules、.git、dist、build、pycache
    • 返回相对路径列表
  2. 内容搜索
    • 调用 search_content 工具(基于ripgrep)
    • 支持正则表达式
    • 支持文件类型过滤:--type js--type py
    • 支持glob过滤:--glob "*.kt"
    • 显示匹配行及上下文
    • 支持显示匹配文件列表、匹配计数
  3. 结果展示
    • 文件路径(可点击跳转)
    • 匹配行号
    • 匹配内容(高亮显示)
    • 上下文行(前后各3行)
  4. 性能优化
    • 大项目使用code-explorer子代理
    • 结果分页显示(每页100条)
    • 支持搜索结果导出
关键配置参数
  • 默认忽略目录:node_modules、.git、dist、build、pycache、.next、target
  • 搜索结果限制:100条(可分页)
  • 上下文行数:前后各3行
  • 正则模式超时:5秒

执行点1.2.2:浏览目录结构
用户操作
  1. 列出目录内容
    • “列出 src 目录内容”
    • “查看项目根目录”
    • “显示 api 文件夹下的所有文件”
  2. 查看项目结构
    • “展示项目文件树”
    • “查看目录层级结构”
  3. 过滤目录内容
    • “列出所有 .kt 文件”
    • “只显示目录,不显示文件”
系统逻辑
  1. 目录浏览
    • 调用 list_dir 工具
    • 显示文件和子目录
    • 显示文件大小、修改时间
    • 不显示隐藏文件(以.开头)
  2. 结构展示
    • 树形结构显示
    • 层级缩进
    • 文件类型图标
    • 目录统计(文件数、总大小)
  3. 忽略模式
    • 支持glob模式忽略特定文件
    • 默认忽略:.git、node_modules等
关键配置参数
  • 默认显示隐藏文件:否
  • 最大递归深度:无限制(但Token受限)
  • 忽略模式:可通过ignore_globs参数指定

需求点2:技能系统

功能点2.1:技能发现与安装

执行点2.1.1:浏览与搜索技能
用户操作
  1. 打开技能中心
    • 点击侧边栏"专家"入口
    • 或点击"技能中心"按钮
  2. 浏览技能市场
    • 分类浏览:编程、写作、数据分析、自动化等
    • 热门推荐
    • 最新更新
  3. 搜索技能
    • 输入关键词搜索
    • 按标签筛选
    • 按评分/下载量排序
  4. 查看技能详情
    • 点击技能卡片
    • 查看功能描述
    • 查看使用示例
    • 查看评分评价
    • 查看版本历史
系统逻辑
  1. 技能列表加载
    • 从ClawHub API获取技能列表
    • 或扫描本地技能仓库
    • 缓存列表提升加载速度
  2. 分类筛选
    • 按标签分类
    • 按评分排序(高到低)
    • 按下载量排序
    • 按更新时间排序
  3. 技能详情
    • 加载技能的SKILL.md
    • 渲染Markdown为HTML
    • 解析元数据:name、author、description、version

执行点2.1.2:安装与卸载技能
用户操作
  1. 安装技能
    • 在技能详情页点击"安装"按钮
    • 或从本地文件夹导入:
      • “从 ~/.skills/my-skill 安装技能”
    • 等待下载和安全检查
    • 安装成功提示
  2. 查看已安装技能
    • 在"已安装"标签页查看
    • 查看技能版本、大小、安装时间
  3. 卸载技能
    • 点击"卸载"按钮
    • 确认卸载操作
    • 技能文件被删除
系统逻辑
  1. 技能下载
    • 从ClawHub下载技能包
    • 或从本地路径复制
    • 解压到 ~/.workbuddy/skills/{skill_name}/
    • 保留文件结构:SKILL.md、references/、scripts/
  2. 安全检查
    • 调用 use_skill 加载 skills-security-check 技能
    • 扫描SKILL.md和所有脚本文件
    • 检测危险模式:
      • 危险命令:rm -rfsudomkfsdd if=
      • 代码注入:eval()exec()subprocess.call(shell=True)
      • 网络请求:检查是否连接未知服务器
    • 风险评级:
      • P0(严重):强烈警告,建议不安装
      • P1(警告):警告用户,需确认
      • P2(安全):通过检查,可安装
    • 向用户展示审计报告
  3. 技能注册
    • 将技能信息写入本地数据库
    • 更新可用技能列表
    • 解析triggers触发条件
  4. 卸载清理
    • 删除技能目录
    • 清理数据库注册信息
    • 保留用户数据(如有)
安全规则
  • P0风险:强烈建议不安装,需用户明确确认
  • P1风险:警告用户,需确认
  • P2风险:直接安装
  • 不执行技能中的自动运行脚本
关键配置参数
  • 技能安装路径~/.workbuddy/skills/
  • 安全检查开关:默认开启
  • 技能格式要求:必须包含SKILL.md

功能点2.2:技能使用与开发

执行点2.2.1:使用技能
用户操作
  1. 自动触发
    • 输入匹配技能triggers的消息
    • 示例:输入"创建PPT"自动加载pptx技能
    • 系统自动加载技能并执行
  2. 手动触发
    • @skill://技能名 语法
    • 从技能列表点击"使用"按钮
    • 示例:@skill://AI Dev Workflow
  3. 按技能指引交互
    • 技能加载后按SKILL.md定义的流程执行
    • 可能需要用户提供额外信息
    • 可能有中间确认步骤
  4. 查看技能输出
    • 技能执行结果展示
    • 生成的文件、报告等
系统逻辑
  1. 技能加载
    • 调用 use_skill 工具
    • 读取 SKILL.md 内容注入上下文
    • 加载 references/ 目录下的参考文档
    • 注册 scripts/ 目录下的脚本为可用资源
  2. 技能执行
    • 遵循 SKILL.md 定义的工作流步骤
    • 可调用内置工具(read_file、write_to_file等)
    • 可调用外部脚本
    • 支持与用户交互确认
  3. 技能输出
    • 生成文件:代码、文档、报告
    • 执行操作:创建项目、运行命令
    • 提供建议:架构方案、优化建议

执行点2.2.2:开发新技能
用户操作
  1. 启动技能创建向导
    • “创建一个新技能”
    • @skill://skill-creator
  2. 填写技能信息
    • 技能名称
    • 技能描述
    • 触发条件
    • 作者信息
  3. 编写SKILL.md
    • 定义工作流步骤
    • 编写详细指令
    • 添加示例
  4. 添加参考资源(可选):
    • 在 references/ 目录添加参考文档
    • 在 scripts/ 目录添加Python脚本
  5. 测试技能
    • 本地加载测试
    • 修复问题
    • 迭代优化
  6. 发布技能
    • 填写版本号(semver格式:1.0.0)
    • 填写变更日志
    • 上传到ClawHub技能市场
系统逻辑
  1. 技能脚手架
    • 调用 skill-creator 技能
    • 生成标准目录结构:
      my-skill/
      ├── SKILL.md
      ├── references/
      └── scripts/
      
    • 创建 SKILL.md 模板
  2. 技能验证
    • 检查 SKILL.md 格式
    • 验证必需字段:name、description
    • 测试脚本可执行性
  3. 技能发布
    • 打包技能文件
    • 上传到 ClawHub
    • 生成技能详情页
    • 等待审核(如需要)

需求点3:命令执行与系统集成

功能点3.1:命令行执行

执行点3.1.1:执行系统命令
用户操作
  1. 请求执行命令
    • “运行 npm install”
    • “执行 pytest tests/”
    • “启动开发服务器 npm run dev”
    • “编译项目 ./gradlew build”
  2. 查看命令输出
    • 实时显示stdout输出
    • 实时显示stderr错误
    • 显示退出码
  3. 处理交互
    • 自动响应提示:--yes-y--no-interaction
    • 或等待用户输入
  4. 长时间运行命令
    • 后台执行
    • 可查看实时日志
    • 可手动终止
系统逻辑
  1. 命令构建
    • 根据操作系统选择shell:
      • Windows:PowerShell
      • macOS/Linux:Bash
    • 处理路径转义(空格、特殊字符)
    • 拼接命令参数
    • 设置工作目录为当前项目根
  2. 命令执行
    • 调用 execute_command 工具
    • 继承环境变量
    • 可设置额外环境变量
    • 设置超时时间
  3. 输出处理
    • 流式返回输出(实时显示)
    • 区分stdout和stderr
    • 解析退出码(0=成功,非0=失败)
    • 禁用分页(git --no-pager、| cat)
  4. 安全控制
    • 敏感命令需确认:
      • 删除:rm、del、rmdir、shutil.rmtree
      • 系统配置:sudo、chmod、chown
      • 网络:curl、wget(上传数据时)
      • 格式化:mkfs、format
    • 禁止危险命令组合:rm -rf /、sudo rm -rf
    • 超时自动终止
安全规则
  • 工作区外命令需确认
  • 敏感命令需确认
  • 禁止执行的命令:
    • 递归删除系统目录
    • 格式化磁盘
    • 修改系统配置(无明确确认)
    • 网络上传数据到未知服务器
关键配置参数
  • 命令超时时间:300秒(5分钟)
  • 敏感命令列表:rm、del、sudo、chmod、mkfs、format
  • 自动响应提示:–yes、-y、–no-interaction

功能点3.2:运行时管理

执行点3.2.1:管理编程语言运行时
用户操作
  1. 查看可用运行时
    • “检查Python版本”
    • “查看Node版本”
    • “列出所有可用运行时”
  2. 安装特定版本
    • “安装 Python 3.12”
    • “安装 Node 20”
    • “安装 Python 3.10”
  3. 切换运行时
    • 自动检测项目需求
    • 自动选择满足要求的版本
    • 或手动指定版本
系统逻辑
  1. 运行时检测
    • 扫描系统已安装的运行时
    • 扫描隔离安装的运行时(~/.workbuddy/binaries/
    • 检查版本兼容性
    • 缓存检测结果
  2. 运行时安装
    • 调用 install_binary 工具
    • 从官方发行版下载
    • 安装到隔离目录:
      • Python:~/.workbuddy/binaries/python/versions/3.12.0/
      • Node:~/.workbuddy/binaries/node/versions/20.0.0/
    • 创建虚拟环境
  3. 环境隔离
    • Python:
      • 创建venv:python -m venv ~/.workbuddy/binaries/python/envs/default
      • 安装包到venv:venv/bin/pip install <pkg>
      • 运行脚本:venv/bin/python script.py
    • Node:
      • 使用项目级node_modules
      • 不全局安装(避免污染系统)
    • 不污染用户系统环境
关键配置参数
  • 运行时安装路径~/.workbuddy/binaries/
  • 虚拟环境路径~/.workbuddy/binaries/python/envs/
  • Python版本:3.13.12(已安装)
  • Node版本:可通过install_binary安装

需求点4:团队协作

功能点4.1:多代理协作

执行点4.1.1:创建团队与分配任务
用户操作
  1. 创建团队
    • “创建一个开发团队”
    • 定义团队名称:如"feature-team"
    • 定义团队目标:如"开发用户模块"
  2. 添加团队成员
    • 指定成员角色:
      • 前端开发
      • 后端开发
      • 测试工程师
      • 代码审查员
    • 设置权限模式:
      • acceptEdits:自动接受文件编辑
      • bypassPermissions:跳过所有确认
      • default:正常确认流程
      • plan:先规划后执行
  3. 分配任务
    • 向特定成员发送任务
    • 任务描述清晰具体
    • 成员并行工作
  4. 协调沟通
    • 成员间通过消息通信
    • 共享工作进展
    • 汇报完成状态
  5. 关闭团队
    • 任务完成后删除团队
    • 清理团队资源
系统逻辑
  1. 团队创建
    • 调用 team_create 工具
    • 创建团队目录:.workbuddy/teams/{team_name}/
    • 初始化团队配置文件
    • 设置团队目标
  2. 成员创建
    • 调用 task 工具创建子代理
    • 指定 subagent_name:code-explorer等
    • 指定 name:成员名称
    • 指定 mode:权限模式
    • 指定 team_name:所属团队
    • 成员异步执行(后台运行)
  3. 消息通信
    • 调用 send_message 工具
    • 支持消息类型:
      • message:私信
      • broadcast:广播
      • shutdown_request:关闭请求
      • shutdown_response:关闭响应
      • plan_approval_response:计划审批
    • 消息投递到成员邮箱
    • 成员下次turn时处理消息
  4. 任务协调
    • 跟踪成员状态
    • 收集结成果
    • 处理关闭请求
    • 汇总团队输出
  5. 团队清理
    • 调用 team_delete 工具
    • 停止所有成员邮箱轮询
    • 保存最终历史
    • 删除团队目录
关键配置参数
  • 团队目录.workbuddy/teams/
  • 最大成员数:10个
  • 消息投递:实时(成员下次turn时处理)
  • 子代理类型:code-explorer

需求点5:自动化系统

功能点5.1:定时任务与触发器

执行点5.1.1:创建自动化任务
用户操作
  1. 打开自动化管理
    • 查看现有自动化列表
    • 查看上次/下次执行时间
    • 查看执行状态
  2. 创建新自动化
    • 点击"新建自动化"按钮
    • 或请求创建:
      • “每天早上9点提醒我查看邮件”
      • “每小时检查一次构建状态”
      • “每周一生成周报”
  3. 配置触发条件
    • 定时触发
      • 每小时:FREQ=HOURLY;INTERVAL=1
      • 每2小时:FREQ=HOURLY;INTERVAL=2
      • 每天9点:FREQ=DAILY;BYHOUR=9;BYMINUTE=0
      • 每周一9点:FREQ=WEEKLY;BYDAY=MO;BYHOUR=9;BYMINUTE=0
      • 工作日:FREQ=WEEKLY;BYDAY=MO,TU,WE,TH,FR
    • 一次性触发
      • 指定具体日期时间:2026-04-10T14:30
    • 有效期
      • validFrom:任务开始生效日期
      • validUntil:任务失效日期
  4. 编写任务指令
    • 描述要执行的任务
    • 任务自包含(无需用户交互)
    • 示例:
      • “检查今日待办任务并发送提醒”
      • “运行测试并报告结果”
      • “拉取最新代码并构建”
  5. 配置执行参数
    • 指定工作区路径
    • 设置最大执行时长
    • 设置状态:ACTIVE 或 PAUSED
  6. 保存并启用
系统逻辑
  1. 自动化注册
    • 调用 automation_update 工具
    • 生成自动化ID
    • 写入配置文件:.workbuddy/automations/{id}/automation.toml
    • 注册到SQLite调度表
    • 计算下次执行时间
  2. 调度执行
    • 定时检查触发条件(每分钟)
    • 到期时启动后台会话
    • 执行任务指令
    • 记录执行日志
    • 更新上次执行时间
    • 计算下次执行时间
  3. 状态管理
    • ACTIVE:正常执行
    • PAUSED:暂停执行
    • 执行中:避免重复执行
    • 超时:自动终止
  4. 失败处理
    • 记录错误日志
    • 可配置重试次数
    • 发送失败通知
关键配置参数
  • 自动化存储路径~/.workbuddy/automations/
  • 调度检查间隔:每分钟
  • 最大执行时长:30分钟(可配置)
  • 失败重试次数:0次(默认不重试)
  • 时区:用户本地时区

需求点6:记忆系统

功能点6.1:工作记忆

执行点6.1.1:记忆读写与蒸馏
用户操作
  1. 自动记忆
    • 完成重要工作后,AI自动追加日志
    • 示例:
      • 创建/修改文件
      • 修复bug
      • 生成报告
      • 选择技术方案
    • 用户无需手动操作
  2. 手动记忆
    • “记住我喜欢用Kotlin”
    • “记录这个项目使用MVVM架构”
    • “记住我的代码风格偏好”
  3. 查看记忆
    • “查看我的工作记忆”
    • “我之前做过什么?”
    • “回忆一下上次的决策”
  4. 更新记忆
    • “更新记忆:改用Python”
    • “删除过时的记忆”
系统逻辑
  1. 日志写入
    • 追加到 .workbuddy/memory/YYYY-MM-DD.md
    • 记录内容:
      • 完成的工作
      • 关键决策
      • 代码变更摘要
      • 用户告知的偏好
    • 格式:Markdown
    • 追加式(不覆盖)
  2. 长期记忆更新
    • 更新 .workbuddy/memory/MEMORY.md
    • 存储内容:
      • 项目约定(架构模式、技术栈)
      • 个人偏好(语言风格、命名规范)
      • 稳定的跨会话事实
    • 更新式(覆盖旧值)
    • 注明变更原因和日期
  3. 记忆读取
    • 会话开始时自动加载:
      • MEMORY.md(长期记忆)
      • 今日日志(YYYY-MM-DD.md)
      • 昨日日志
    • 注入到上下文
    • 用户询问时检索相关记忆
  4. 记忆蒸馏
    • 每次会话开始时检查
    • 超过30天的日志需要蒸馏
    • 提取关键信息到MEMORY.md
    • 删除旧日志文件
    • 保持记忆简洁
关键配置参数
  • 记忆目录.workbuddy/memory/
  • 日志文件格式:YYYY-MM-DD.md
  • 长期记忆文件:MEMORY.md
  • 日志保留天数:30天
  • 蒸馏触发条件:每次会话开始

需求点7:结果展示与交付

功能点7.1:结果呈现

执行点7.1.1:展示工作成果
用户操作
  1. 自动展示
    • 任务完成后,AI自动判断结果类型
    • 选择合适的展示方式
    • 自动打开结果视图
  2. 手动请求展示
    • “展示生成的HTML”
    • “打开报告文件”
    • “预览网页”
  3. 下载交付物
    • 点击下载按钮
    • 打包多个文件
    • 选择保存位置
系统逻辑
  1. 结果检测
    • 判断产出文件类型:
      • HTML:使用preview_url
      • 报告/文档:使用open_result_view
      • 图片:直接渲染
      • 代码:代码块展示
    • 选择展示方式
  2. 预览渲染
    • HTML文件
      • 调用 preview_url 工具
      • 在内置浏览器打开
      • 支持热重载(开发服务器)
    • 文档文件
      • 调用 open_result_view 工具
      • 在Artifact视图展示
      • 支持Markdown渲染
    • 图片文件
      • read_file直接渲染
      • 支持缩放
    • 代码文件
      • 代码块展示
      • 语法高亮
      • 可复制
  3. 文件交付
    • 调用 deliver_attachments 工具
    • 按重要性排序
    • 打包相关文件
    • 提供下载链接
关键配置参数
  • Artifact目录%APPDATA%/WorkBuddy/brain/{conversation-id}/
  • 支持的预览格式
    • HTML:浏览器预览
    • PDF/DOCX/PPTX/XLSX:Artifact视图
    • 图片:直接渲染
    • Markdown:渲染展示

需求点8:知识库检索

功能点8.1:RAG知识检索

执行点8.1.1:查询知识库
用户操作
  1. 自动检索
    • 根据对话上下文自动判断是否需要检索
    • AI自动调用RAG_search
  2. 手动触发
    • “查询微信小程序开发文档”
    • “搜索腾讯云API使用方法”
    • “查一下TDesign组件库”
系统逻辑
  1. 知识库匹配
    • 根据查询意图匹配知识库
    • 可同时查询多个知识库
  2. 检索执行
    • 调用 RAG_search 工具
    • 传入查询字符串
    • 指定知识库名称
  3. 结果整合
    • 返回相关文档片段
    • 注入上下文
    • 生成基于知识库的回答
可用知识库
  • 腾讯云API
  • 微信云开发
  • 腾讯云实时音视频
  • TDesign
  • 微信支付
  • 微信小程序
  • 微信小游戏
  • 腾讯地图小程序

工作流总览

需求点 功能点 核心能力 关键工具
0. AI对话与智能执行 自然语言对话、多模态输入、会话管理 上下文组装、意图识别、工具选择、流式响应 read_file、write_to_file、execute_command
1. 文件系统操作 文件读写编辑、搜索探索 精确替换、内容搜索、目录浏览 read_file、replace_in_file、search_file、search_content
2. 技能系统 技能发现安装、技能使用开发 ClawHub集成、安全审计、工作流执行 use_skill、skill-creator
3. 命令执行与系统集成 命令行执行、运行时管理 Shell命令、环境隔离、版本管理 execute_command、install_binary
4. 团队协作 多代理协作 团队创建、成员分配、消息通信 team_create、task、send_message
5. 自动化系统 定时任务与触发器 Cron调度、后台执行、状态管理 automation_update
6. 记忆系统 工作记忆 日志写入、长期记忆、蒸馏清理 replace_in_file(追加日志)
7. 结果展示与交付 结果呈现 HTML预览、文档展示、文件交付 preview_url、open_result_view、deliver_attachments
8. 知识库检索 RAG知识检索 知识库匹配、文档检索、结果整合 RAG_search
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐