OpenCoworkAI安装、使用方法详细全解

数据来源: GitHub API、项目官方文档、第三方评测
仓库地址: https://github.com/OpenCoworkAI/open-cowork


一、项目概览

1.1 基本介绍

Open Cowork 是一款免费开源的 AI Agent 桌面应用,定位为 Claude Cowork 的开源替代实现。它将 Claude Code、OpenAI、Gemini、DeepSeek 等多种 AI 模型封装为图形界面,提供一键安装,无需编程或终端知识即可使用。

核心理念: 让每个人都能轻松使用 AI 驱动的桌面自动化。

1.2 关键指标

指标 数值
开源协议 MIT
主要语言 TypeScript
仓库大小 ~77.6 MB
创建时间 2026-01-13
社区 Discord + 微信群

1.3 一句话总结

Open Cowork 是基于 Electron + Claude Agent SDK 构建的桌面 AI Agent 应用,支持多模型、MCP 连接器、Skills 技能系统、VM 沙盒隔离、GUI 自动化和远程协作,是 Claude Cowork 的开源增强版。


二、竞品对比

特性 Claude Cowork OpenClaw Open Cowork
MCP & Skills
远程控制
GUI 操作
多模型支持 ✗ (仅 Claude) 部分 ✓ (广泛)
VM 沙盒隔离 部分 ✓ (WSL2/Lima)
开源
收费 订阅制 免费 免费 (仅付 API 费)

三、核心特性详解

3.1 一键安装

  • 提供 Windows (.exe) 和 macOS (.dmg) 预构建安装包
  • 支持 Homebrew 一键安装
  • 无需配置 Node.js / Python 环境

3.2 多模型支持

支持以下 AI 服务商和模型:

服务商 Base URL 推荐模型
OpenRouter https://openrouter.ai/api claude-4-5-sonnet
Anthropic (默认) claude-4-5-sonnet
智谱 AI (GLM) https://open.bigmodel.cn/api/anthropic glm-4.7, glm-4.6
MiniMax https://api.minimaxi.com/anthropic minimax-m2
Kimi https://api.kimi.com/coding/ kimi-k2
OpenAI 兼容 自定义 任意兼容模型
Gemini Google 官方 gemini-3-pro (推荐用于 GUI 操作)
DeepSeek 官方 API 多种模型
Qwen 通义千问 API 多种模型
Ollama 本地部署 任意本地模型
Grok xAI API 多种模型

底层架构: v3.0 移除代理层,所有请求通过 Claude Agent SDK 直连,采用 SDK-first 架构。

3.3 虚拟机级别沙盒隔离

三级安全保护:

级别 平台 技术 说明
基础 全平台 路径守卫 文件操作限制在工作区文件夹内
增强 Windows WSL2 命令在隔离的 Linux 虚拟机中执行
增强 macOS Lima 命令在隔离的 Ubuntu 虚拟机中执行

沙盒代码模块:

  • sandbox-adapter.ts - 沙盒适配器抽象
  • wsl-bridge.ts / wsl-agent/ - WSL2 通信桥
  • lima-bridge.ts / lima-agent/ - Lima 通信桥
  • path-guard.ts / path-resolver.ts - 路径安全守卫
  • sandbox-bootstrap.ts / sandbox-sync.ts - 初始化和同步
  • native-executor.ts - 回退模式下的本地执行器
  • path-containment.ts - 路径包含检查

3.4 Skills 技能系统

内置 5 个 Skills(位于 .claude/skills/ 目录):

Skill 功能
pptx PowerPoint 演示文稿生成
docx Word 文档处理
pdf PDF 处理与表单
xlsx Excel 电子表格生成
skill-creator 自定义技能开发工具包

特性:

  • 支持热重载(hot-reload)
  • 用户可添加自定义 Skill
  • 通过 skill-creator 工具创建新 Skill
  • Skills 管理模块位于 src/main/skills/skills-manager.ts

3.5 MCP (Model Context Protocol) 连接器

MCP 让 AI 能连接外部工具和服务。Open Cowork 支持三种传输方式:

传输方式 说明
stdio 标准输入/输出 (本地进程)
SSE Server-Sent Events (事件流)
Streamable HTTP 可流式化的 HTTP 连接

MCP 代码模块:

  • mcp-manager.ts - MCP 服务器生命周期管理
  • mcp-config-store.ts - MCP 配置持久化
  • mcp-oauth.ts - OAuth 认证支持
  • mcp-logger.ts - MCP 日志记录
  • gui-operate-server.ts - GUI 操作服务器 (6884 行)

支持的 MCP 连接器: 浏览器、Notion、自定义应用等

3.6 GUI 自动化操作

  • 可控制和操作桌面 GUI 应用程序
  • 屏幕截图 + 鼠标/键盘控制
  • 推荐模型: Gemini-3-Pro(最佳 GUI 理解能力)
  • v3.2.0 新增 Windows 桌面应用自动化(含微信工作流演示)
  • 底层的 gui-operate-server.ts 实现了完整的 GUI 操作引擎

3.7 远程控制

平台 状态
飞书 (Lark) 已支持,含配对模式和审批面板
Slack 已支持

远程控制代码模块:

  • remote-manager.ts - 远程连接管理
  • remote-config-store.ts - 远程配置存储
  • gateway.ts - 消息网关
  • message-router.ts - 消息路由
  • tunnel-manager.ts - 隧道管理(基于 ngrok)
  • channels/ - 多通道支持

3.8 其他核心特性

  • 多模态输入: 拖拽文件和图片到聊天框
  • 实时追踪: Trace Panel 观察 AI 推理和工具调用
  • 会话管理: SQLite 持久化会话历史
  • 内存管理: 统一存储、核心/经验记忆、源感知检索
  • 国际化: 中英文界面(i18next)
  • 实时日志: 日志轮转和查看器

四、技术架构

4.1 技术栈

层次 技术
桌面框架 Electron ^35.7.5
前端框架 React ^18.3.1 + React DOM
状态管理 Zustand ^5.0.12
构建工具 Vite ^7.3.1
CSS Tailwind CSS ^3.4.16 + PostCSS
语言 TypeScript ^5.3.3 (strict mode)
数据库 better-sqlite3 ^12.8.0
国际化 i18next ^25.10.1
测试 Vitest ^4.1.0
代码格式 ESLint ^8.56.0 + Prettier ^3.8.3
AI SDK @anthropic-ai/sdk ^0.39.0, @mariozechner/pi-coding-agent ^0.60.0
MCP SDK @modelcontextprotocol/sdk ^1.26.0
飞书 SDK @larksuiteoapi/node-sdk ^1.59.0
Slack SDK @slack/bolt 4.7.0, @slack/web-api 7.15.1
数学渲染 KaTeX ^0.16.45
Markdown react-markdown + remark-gfm + rehype-katex
远程隧道 ngrok ^5.0.0-beta.2

Node.js 版本要求: >= 22

4.2 项目目录结构

open-cowork/
├── src/
│   ├── main/                    # Electron 主进程 (Node.js)
│   │   ├── index.ts             # 主入口
│   │   ├── claude/              # AI Agent 执行
│   │   │   ├── agent-runner.ts        # Agent 执行逻辑 (124KB)
│   │   │   ├── agent-runner-loop-guard.ts  # 循环保护
│   │   │   ├── agent-runner-message-end.ts # 消息结束处理
│   │   │   ├── claude-sdk-one-shot.ts    # SDK 一次性调用
│   │   │   ├── pi-model-resolution.ts    # 多模型解析
│   │   │   ├── pi-session-runtime.ts     # 会话运行时
│   │   │   ├── shared-auth.ts            # 共享认证
│   │   │   ├── think-tag-parser.ts       # 思考标签解析
│   │   │   ├── tool-result-utils.ts      # 工具结果处理
│   │   │   └── windows-bash-operations.ts # Windows Bash 操作
│   │   ├── config/              # 配置管理 (electron-store)
│   │   ├── db/                  # SQLite 数据库
│   │   ├── ipc/                 # IPC 处理器
│   │   ├── memory/              # 内存管理
│   │   ├── sandbox/             # 沙盒与路径解析
│   │   │   ├── wsl-agent/       # WSL2 Agent
│   │   │   ├── lima-agent/      # Lima Agent
│   │   │   ├── wsl-bridge.ts
│   │   │   ├── lima-bridge.ts
│   │   │   ├── path-guard.ts
│   │   │   └── ...
│   │   ├── session/             # 会话管理
│   │   ├── skills/              # Skills 加载与管理
│   │   ├── tools/               # 工具执行
│   │   │   ├── tool-executor.ts
│   │   │   ├── sandbox-tool-executor.ts
│   │   │   └── path-containment.ts
│   │   ├── mcp/                 # MCP 连接器
│   │   │   ├── mcp-manager.ts
│   │   │   ├── mcp-oauth.ts
│   │   │   ├── mcp-config-store.ts
│   │   │   ├── mcp-logger.ts
│   │   │   └── gui-operate-server.ts
│   │   ├── remote/              # 远程控制 (飞书/Slack)
│   │   │   ├── remote-manager.ts
│   │   │   ├── gateway.ts
│   │   │   ├── message-router.ts
│   │   │   ├── tunnel-manager.ts
│   │   │   └── channels/
│   │   └── schedule/            # 定时任务
│   ├── preload/                 # Electron 预加载脚本
│   └── renderer/                # React 前端 UI
│       ├── components/          # UI 组件
│       │   ├── ChatView.tsx     # 主聊天界面
│       │   ├── ConfigModal.tsx  # 设置对话框
│       │   ├── ContextPanel.tsx # 文件上下文
│       │   ├── MessageCard.tsx  # 消息卡片
│       │   ├── PermissionDialog.tsx
│       │   ├── Sidebar.tsx      # 侧边栏
│       │   ├── Titlebar.tsx     # 自定义标题栏
│       │   ├── TracePanel.tsx   # 推理追踪面板
│       │   └── WelcomeView.tsx  # 欢迎页
│       ├── hooks/               # React Hooks
│       ├── store/               # Zustand 状态
│       ├── i18n/                # 国际化
│       ├── styles/              # Tailwind + CSS
│       ├── types/               # TypeScript 类型
│       └── utils/               # 工具函数
├── .claude/
│   └── skills/                  # 默认技能
│       ├── pptx/
│       ├── docx/
│       ├── pdf/
│       ├── xlsx/
│       └── skill-creator/
├── docs/                        # 文档
├── resources/                   # 静态资源
├── scripts/                     # 构建脚本
├── patches/                     # patch-package 补丁
├── tests/                       # 测试文件
├── website/                     # 官网 (VitePress)
├── electron-builder.yml         # Electron 构建配置
├── vite.config.ts               # Vite 配置
├── tailwind.config.js           # Tailwind 配置
└── package.json

4.3 核心工作流程

用户输入 → ChatView → IPC → Agent Runner
                                  ↓
                           Claude SDK / PI SDK
                                  ↓
                    ┌───────────┼───────────┐
                    ↓           ↓           ↓
                 MCP 工具   Skills   文件系统
                    ↓
              浏览器/Notion  文档生成  沙盒读写
                    ↓
              结果 → Trace Panel → 用户界面

五、安装与配置(详细步骤)

5.1 方式一:Homebrew 安装(macOS 推荐)

# 添加 Open Cowork 的 Homebrew tap
brew tap OpenCoworkAI/tap

# 安装 Open Cowork(跳过 Gatekeeper 验证)
brew install --cask --no-quarantine open-cowork

--no-quarantine 标志绕过 macOS Gatekeeper,不会出现"Apple 无法验证此应用"警告。

后续更新:

brew upgrade --cask open-cowork

5.2 方式二:下载安装包

步骤:

  1. 访问 Release 页面: https://github.com/OpenCoworkAI/open-cowork/releases
  2. 下载对应平台的安装包:
    • Windows: Open.Cowork-3.3.1-win-x64.exe
    • macOS (Apple Silicon): Open.Cowork-3.3.1-mac-arm64.dmg
  3. 安装:
    • Windows: 双击 .exe 文件,按提示完成安装
    • macOS: 双击 .dmg,将应用拖入 Applications 文件夹

macOS 安全提示处理:
如果提示"无法验证开发者":

  • 方案 A: 前往 系统设置 > 隐私与安全性,点击"仍要打开"
  • 方案 B: 使用 Homebrew 安装(推荐,自动跳过验证)

网络配置:
如果使用代理软件,需要开启"虚拟网卡 (TUN 模式)"以支持 WebSearch 等联网工具。

5.3 方式三:源码编译(开发者)

前置条件:

  • Node.js >= 22
  • npm 10+
  • macOS 或 Windows

步骤:

# 1. 克隆仓库
git clone https://github.com/OpenCoworkAI/open-cowork.git
cd open-cowork

# 2. 安装依赖(自动下载 Node 二进制 + 重编译原生模块)
npm install

# 3. 启动开发服务器
npm run dev

# 4. 构建生产安装包
npm run build

常用开发命令:

命令 用途
npm run dev 启动开发服务器 (Vite + Electron)
npm run dev:with-python 带 Python 环境的开发模式
npm run build 完整生产构建
npm run build:win Windows 专用构建
npm run lint ESLint 代码检查
npm run format Prettier 格式化
npx tsc --noEmit TypeScript 类型检查
npm run test 运行 Vitest 测试
npm run test:coverage 带覆盖率报告的测试

5.4 沙盒配置(可选但推荐)

Windows (WSL2):

# 如果尚未安装 WSL2
wsl --install
# 重启后,Open Cowork 会自动检测并启用 WSL2 沙盒

macOS (Lima):

# 安装 Lima
brew install lima
# Open Cowork 会自动创建名为 'claude-sandbox' 的 Lima 虚拟机

如果无法安装虚拟机,Open Cowork 会回退到路径守卫模式,仍能提供基本安全保护。


六、使用方法(详细)

6.1 首次配置

步骤 1: 获取 API Key

根据你的需求选择 AI 服务商:

服务商 获取 Key 地址 Base URL 推荐模型
OpenRouter https://openrouter.ai/ https://openrouter.ai/api claude-4-5-sonnet
Anthropic https://console.anthropic.com/ (默认) claude-4-5-sonnet
智谱 AI https://bigmodel.cn/glm-coding https://open.bigmodel.cn/api/anthropic glm-4.7, glm-4.6
MiniMax https://platform.minimaxi.com/subscribe/coding-plan https://api.minimaxi.com/anthropic minimax-m2
Kimi https://www.kimi.com/membership/pricing https://api.kimi.com/coding/ kimi-k2

步骤 2: 在应用中配置

  1. 打开 Open Cowork 应用
  2. 点击左下角 ⚙️ 设置 图标
  3. 在设置面板中填写:
    • API Key: 粘贴你的 API 密钥
    • Base URL: 根据上表填写(使用智谱/MiniMax 等非 Anthropic 原生接口时必须填写)
    • Model: 输入你想使用的模型名称
  4. 保存设置

步骤 3: 选择工作区

  1. 在主界面选择一个文件夹作为工作区
  2. AI Agent 将在此文件夹内读取和写入文件
  3. 所有操作被限制在此工作区范围内(沙盒保护)

6.2 日常使用

基本对话:
在聊天输入框中输入自然语言指令,AI 将在工作区内执行任务。

示例指令:

"读取当前文件夹下的 financial_report.csv,并帮我生成一份包含 5 页幻灯片的 PPT 总结报告。"
"整理这个文件夹,把图片归类到 images 子文件夹,文档归类到 docs 子文件夹。"
"帮我创建一个 Excel 表格,包含月度销售数据,字段有日期、产品、数量、金额。"

多模态输入:

  • 直接将文件拖拽到聊天输入框
  • 将图片拖拽到聊天输入框
  • 支持多种文件格式

实时追踪:

  • 在 Trace Panel 中观察 AI 的推理过程
  • 查看工具调用详情(MCP/Skills/文件系统操作)
  • 了解每一步的执行状态

6.3 使用 Skills 生成文档

生成 PPTX (PowerPoint):

"请帮我根据 README.md 的内容生成一份产品介绍 PPT,包含 8 页幻灯片。"

生成 DOCX (Word):

"将会议记录整理成一份正式的 Word 文档,包含标题、章节和要点。"

生成 XLSX (Excel):

"从日志文件中提取数据,生成 Excel 报表,包含汇总和图表。"

生成/处理 PDF:

"将这份 HTML 文件转换为 PDF 格式。"
"提取这份 PDF 中的所有表格数据。"

创建自定义 Skill:
使用内置的 skill-creator 工具,在对话中描述你需要的技能,AI 将引导你创建新的 Skill 定义文件,保存在 .claude/skills/ 目录下。

6.4 使用 MCP 连接器

配置 MCP 连接器:

  1. 打开设置面板
  2. 找到 MCP 连接器配置
  3. 添加连接器:
    • 浏览器: 让 AI 控制浏览器进行搜索和导航
    • Notion: 连接 Notion 工作区(需要先设置 Notion Integration Token,并在根页面添加连接)
    • 自定义: 支持 stdio / SSE / Streamable HTTP 三种传输协议

Notion 连接器特别步骤:

  1. 在 Notion 创建 Integration,获取 Internal Integration Token
  2. 在 Open Cowork 设置中填入 Token
  3. 在 Notion 根页面添加该 Integration 的连接(参考: https://www.notion.com/help/add-and-manage-connections-with-the-api)

6.5 GUI 自动化操作

适用场景: 控制桌面应用程序(如微信、Chrome 浏览器等)

使用步骤:

  1. 确保使用 Gemini-3-Pro 模型(推荐)
  2. 在对话中描述 GUI 操作需求
  3. AI 通过截图识别界面,自动执行点击和键盘操作

示例:

"帮我打开微信,给张三发送一条消息:'明天下午三点开会'。"
"打开 Chrome,访问 Google,搜索 'AI Agent 2026'。"

注意: GUI 操作需要适当的无障碍权限(macOS 需要在 系统设置 > 隐私与安全性 > 辅助功能 中授权)。

6.6 远程控制(飞书 / Slack)

飞书集成:

  1. 在 Open Cowork 设置中启用飞书远程控制
  2. 配置飞书应用凭证(App ID、App Secret)
  3. 首次使用时需要完成配对流程(配对模式 UI + 审批面板)
  4. 通过飞书发送指令,AI 在本地执行并返回结果

Slack 集成:

  1. 在设置中配置 Slack Bot Token
  2. 配对和授权
  3. 通过 Slack 频道或私聊发送指令

工作流程:

用户 → 飞书/Slack → ngrok 隧道 → Open Cowork → 本地执行 → 结果 → 飞书/Slack → 用户

6.7 会话管理

  • 新建会话: 在侧边栏创建新会话
  • 会话历史: 所有历史会话存储在本地 SQLite 数据库中
  • 会话切换: 侧边栏列出所有会话,点击切换
  • 上下文记忆: 每个会话保持独立上下文,支持跨会话检索(v3.3.0 新增内存系统)

6.8 环境配置(.env.example)

# API 配置
# 必填: 设置你的 API 认证令牌
# ANTHROPIC_AUTH_TOKEN=***

# 可选: 自定义 API 端点
# ANTHROPIC_BASE_URL=https://openrouter.ai/api

# 可选: 模型选择
# CLAUDE_MODEL=anthropic/claude-sonnet-4.5

# 可选: 自定义 Claude Code CLI 路径
# 重要: Windows 上使用正斜杠 (/) 而非反斜杠 (\)
# CLAUDE_CODE_PATH=C:/Users/yourname/AppData/Roaming/npm/node_modules/@anthropic-ai/claude-code/cli.js

七、版本历史

版本 日期 关键更新
v3.3.1 2026-05-23 最新稳定版
v3.3.0 2026-04-18 飞书远程控制配对 UI、官网、Codex PR Review Bot、安全加固(zip-slip/路径穿越)、截图显示优化
v3.3.0-beta.8 2026-03-29 ~100 个测试文件、8+10 安全漏洞修复、VM 沙盒命令注入防护
v3.2.0 2026-03-02 GUI 自动化(Windows)、拖拽文件/图片附件
v3.1.0 2026-02-13 V2 插件运行时、MCP 连接器管理、演示视频
v3.0.0 2026-02-08 重大重构: 移除代理层,SDK-first 架构
v2.0.0 2026-01-25 架构大改: Electron + React UI + 沙盒 + Skills
v1.0.0 2025-12-01 初始版本

八、开发路线图

已完成

  • 稳定的 Windows 和 macOS 安装包 + 构建验证
  • 完整文件系统沙盒 + 路径穿越/zip-slip 加固
  • VM 沙盒 (WSL2/Lima)
  • Skills (PPTX/DOCX/PDF/XLSX) + 自定义技能 + 热重载
  • MCP 连接器 (stdio/SSE/Streamable HTTP)
  • 富文本输入(文件/图片)
  • 多模型支持 (Claude/GPT/Gemini/DeepSeek/Qwen/GLM/Kimi/Grok/MiniMax/Ollama)
  • 中英文界面
  • 飞书远程控制(配对模式 + 审批面板)
  • 自动化 CI/CD + Codex PR Review Bot
  • 内存系统基础(统一存储 + 源感知检索)

短期计划 (v3.4.0)

  • 沙盒加固(VM 启动性能、跨平台一致性)
  • 安装包瘦身: 从 ~156MB 减至 ~80MB
  • 代码拆分(index.ts 2672行 → 拆分、gui-operate-server.ts 6884行 → 拆分)
  • 命名规范化(清理 75+ 遗留引用)
  • 工具补全(TodoWrite、AskUserQuestion、Glob、Grep、WebFetch、WebSearch)
  • 内存系统增强(提示注入控制、跨会话检索 UX)
  • 定时任务: Cron-like 任务调度
  • Linux 原生支持

中期计划 (v3.5.0+)

  • 插件系统: 社区驱动的可扩展架构
  • 多 Agent: 编排多个 Agent 执行复杂工作流
  • 工作区模板: 预配置环境(编程、写作、研究等场景)

长期愿景

  • Computer Use (CUA): 完整的 GUI 自动化
  • 协作模式: 多用户共享工作区
  • 移动伴侣: 移动端轻量监控和快速交互

九、安全模型

9.1 多层安全保护

  1. 路径守卫 (Path Guard): 文件操作严格限制在工作区文件夹内
  2. VM 沙盒: WSL2 (Windows) / Lima (macOS) 虚拟机隔离执行
  3. 权限审批: PermissionDialog 组件要求用户确认敏感操作
  4. 安全加固: zip-slip 防护、路径穿越防护、命令注入防护

9.2 安全审计

  • v3.3.0-beta.8 修复了 8 个严重 + 10 个高危安全漏洞
  • 20 个中等严重程度的加固修复
  • VM 沙盒防护(命令注入 + 符号链接攻击)
  • 安全策略文档: SECURITY.md
  • 依赖项安全更新(Dependabot 自动管理)

9.3 隐私保护

  • 所有数据存储在本地(SQLite)
  • 不会向 Open Cowork 服务器发送任何数据
  • 唯一的外部通信是与用户配置的 AI 模型 API
  • 敏感信息(API Key)日志脱敏

十、开发者指南

10.1 代码规范

  • TypeScript strict mode(禁止隐式 any)
  • ESLint + Prettier(2 空格缩进)
  • React 函数组件 + Hooks(禁止类组件)
  • Tailwind CSS 样式(禁止 CSS Modules)
  • 图标使用 lucide-react
  • 单个组件文件不超过 500 行
  • 所有用户可见文本必须通过 i18next 国际化

10.2 Git 工作流

main            — 稳定发布
dev             — 集成分支(PR 目标)
feature/<name>  — 新功能
fix/<name>      — Bug 修复

Conventional Commits(强制):

feat(mcp): add Streamable HTTP transport support
fix(sandbox): handle WSL2 path with spaces
docs: update README setup instructions
test(session): add unit tests for session-manager

10.3 PR 规范

  1. PR 目标为 dev 分支(发布除外)
  2. 每个 feat/fix PR 必须附带测试
  3. CI 必须通过(lint + type-check + test)
  4. 变更最小化、聚焦
  5. 禁止使用 any 类型

10.4 依赖管理

级别 范围 合并策略
自动合并 GitHub Actions / dev-deps patch+minor CI 通过即合并
快速审核 生产依赖 patch 查看 changelog 后合并
手动审核 生产依赖 minor 仔细阅读 changelog
专用分支 任何依赖 major 创建迁移分支,充分测试

10.5 测试

  • 框架: Vitest
  • 测试文件与源码同目录或 tests/ 目录
  • 约 100 个测试文件(v3.3.0-beta.8+)
  • 覆盖率报告: npm run test:coverage

十一、社区与生态

11.1 社区渠道

平台 地址 说明
GitHub https://github.com/OpenCoworkAI/open-cowork 代码仓库、Issues、Discussions
Discord https://discord.gg/pynjtQDf 实时聊天、技术支持
微信群 二维码见 README 中文社区

11.2 贡献者

主要贡献者包括:

  • @hqhq1025
  • @Sun-sunshine06
  • @JackXFan
  • @andoan16

十二、优缺点分析

12.1 优点

  1. 完全免费开源(MIT 协议),仅需支付 AI API 费用
  2. 多模型支持广泛,包括国产大模型(智谱、MiniMax、Kimi)
  3. 开箱即用,预构建安装包,无需编程知识
  4. 多级沙盒保护,WSL2/Lima 虚拟机隔离
  5. 功能丰富: MCP 连接器、Skills 系统、GUI 自动化、远程控制
  6. 活跃开发,从 v1.0 到 v3.3 快速迭代
  7. 国际化支持(中英文)
  8. 安全性重视,3 轮安全审计 + 持续加固
  9. 完善的测试覆盖(~100 个测试文件)
  10. 代码质量高,TypeScript strict + ESLint + Prettier + Conventional Commits

12.2 缺点 / 待改进

  1. 安装包较大(~156MB),计划在 v3.4.0 减至 ~80MB
  2. 暂无官方 Linux 安装包,仅支持源码编译
  3. 部分文件过大(gui-operate-server.ts 6884行、index.ts 2672行)
  4. 命名尚未完全规范化(75+ 遗留引用待清理)
  5. 工具集待补全(TodoWrite、WebFetch 等尚未原生实现)
  6. GUI 自动化依赖 Gemini-3-Pro,模型限制
  7. 内存系统仍为基础版本,prompt 注入控制待完善

12.3 适用场景

场景 推荐度 说明
文档生成(PPTX/DOCX/XLSX/PDF) ★★★★★ Skills 系统原生支持
文件整理与批量处理 ★★★★★ 沙盒内文件操作
桌面 GUI 自动化 ★★★★☆ 需要 Gemini-3-Pro
多模型对比测试 ★★★★★ 支持 10+ 模型提供商
远程办公协作(飞书/Slack) ★★★★☆ 远程控制已实现
Linux 服务器环境 ★★☆☆☆ 仅源码编译,无预构建包
大规模企业部署 ★★★☆☆ 待插件系统和多 Agent

十三、总结

Open Cowork 是 Claude Cowork 的一个优秀开源替代品,具有以下突出特点:

  1. 功能比 Claude Cowork 更强: 多模型支持、GUI 自动化、远程控制、开源可审计
  2. 安全性设计完善: 三级沙盒 + 路径守卫 + 安全审计
  3. 扩展性好: MCP 协议 + Skills 系统 + 即将推出的插件系统
  4. 开发者友好: 完善的 TypeScript 工程化、测试覆盖、贡献指南
  5. 社区活跃: 快速迭代(5 个月内从 v1.0 到 v3.3),多语言社区

推荐使用人群:

  • 需要使用 AI 进行桌面自动化的非技术用户
  • 希望替代 Claude Cowork 的多模型用户
  • 需要飞书/Slack 远程控制的团队协作
  • 对安全性有要求的用户(VM 沙盒隔离)
  • 想要自定义和二次开发的开发者

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐