一、OpenCLAWD 是什么?

OpenCLAWD(Open Cluster Lightweight Administration & Workflow Director),业内昵称“小龙虾”,是一款轻量级、高性能的开源集群管理与工作流调度工具。它专为中小规模分布式集群设计,核心聚焦资源调度、任务编排、节点监控三大核心场景,相比K8s等重型工具,OpenCLAWD具有部署简单、学习成本低、资源占用少的优势,非常适合研发测试环境、边缘集群、小型业务集群的快速管理。

“小龙虾”的昵称源于其核心特性:

  • 轻量灵活:像小龙虾一样“易部署、易存活”,单节点最小资源占用仅512MB内存、1核CPU;
  • 适配性强:兼容x86/ARM架构,支持Linux全发行版,可适配物理机、虚拟机、容器等多种部署环境;
  • 高性能:毫秒级任务调度延迟,支持万级任务并发,满足中小集群的调度需求。

二、OpenCLAWD 核心功能

  1. 集群节点管理:一键发现、注册集群节点,实时监控节点CPU、内存、磁盘、网络状态;
  2. 任务编排调度:支持批处理任务、定时任务、依赖型工作流编排,支持任务优先级配置;
  3. 资源隔离控制:基于cgroup实现节点资源配额管理,避免单任务占用过多集群资源;
  4. 日志与告警:内置日志收集与可视化面板,支持邮件/钉钉/企业微信告警触发;
  5. API 与 CLI 双交互:提供完整RESTful API,同时保留简洁的命令行工具,适配自动化脚本与人工操作。

三、OpenCLAWD 安装步骤

前置条件

  • 操作系统:CentOS 7+/Ubuntu 18.04+/Debian 10+(Linux内核≥3.10);
  • 依赖环境:Python 3.8+、Docker 20.10+(可选,容器化部署)、SSH免密登录(集群节点间);
  • 权限要求:安装用户需具备root/ sudo权限;
  • 端口要求:开放8080(Web面板)、9090(节点通信)端口。

方式1:一键脚本安装(推荐)

# 下载官方一键安装脚本
curl -fsSL https://raw.githubusercontent.com/openclawd/openclawd/main/install.sh -o install_clawd.sh

# 赋予执行权限
chmod +x install_clawd.sh

# 执行安装(指定安装目录为/opt/clawd,自动配置环境变量)
sudo ./install_clawd.sh --install-dir /opt/clawd --auto-config

# 验证安装
clawd --version
# 输出示例:OpenCLAWD v1.8.2 (build: 20260315) 即为安装成功

方式2:手动编译安装(适合定制化需求)

# 1. 安装编译依赖
sudo yum install -y gcc python3-devel git  # CentOS
# sudo apt install -y gcc python3-dev git  # Ubuntu/Debian

# 2. 克隆源码仓库
git clone https://github.com/openclawd/openclawd.git
cd openclawd

# 3. 编译并安装
sudo python3 setup.py build
sudo python3 setup.py install

# 4. 初始化配置文件
sudo clawd init --config /etc/clawd/clawd.conf

方式3:Docker容器化安装

# 拉取官方镜像
docker pull openclawd/clawd:latest

# 启动容器(映射端口与配置目录)
docker run -d \
  --name clawd-server \
  -p 8080:8080 -p 9090:9090 \
  -v /etc/clawd:/etc/clawd \
  -v /var/lib/clawd:/var/lib/clawd \
  --privileged=true \
  openclawd/clawd:latest

四、OpenCLAWD 快速使用教程

1. 初始化集群(首次使用)

# 初始化主节点(本机作为集群主控)
sudo clawd cluster init --master $(hostname -i)

# 添加工作节点(假设工作节点IP为192.168.1.101/102)
sudo clawd node add --host 192.168.1.101 --username root --password your_password
sudo clawd node add --host 192.168.1.102 --username root --password your_password

# 查看集群节点状态
clawd node list
# 输出示例:
# IP地址          状态    CPU使用率  内存使用率  角色
# 192.168.1.100   在线    15%        22%         主节点
# 192.168.1.101   在线    8%         15%         工作节点
# 192.168.1.102   在线    10%        18%         工作节点

2. 创建并提交任务

# 创建简单的批处理任务(在所有工作节点执行磁盘检查)
cat > disk_check_task.yaml << EOF
task_name: disk_check
task_type: batch
target_nodes: all  # 所有工作节点
commands:
  - df -h
  - du -sh /var/log
schedule: immediate  # 立即执行
EOF

# 提交任务
clawd task submit --file disk_check_task.yaml

# 查看任务执行状态
clawd task status --task-id <任务ID>  # 提交任务后会返回任务ID

# 查看任务执行结果
clawd task log --task-id <任务ID>

3. 可视化面板操作

安装完成后,直接访问主节点IP的8080端口(如http://192.168.1.100:8080),使用默认账号(admin/admin123)登录Web面板:

  • 节点监控:在“集群管理-节点监控”查看所有节点的实时资源状态;
  • 任务管理:在“任务中心”创建、编辑、终止任务,查看任务执行日志;
  • 告警配置:在“系统配置-告警规则”添加磁盘使用率≥90%、CPU使用率≥80%等告警规则。

4. 常用运维命令

# 重启OpenCLAWD服务
sudo systemctl restart clawd

# 查看服务运行状态
sudo systemctl status clawd

# 导出集群配置
clawd config export --file /backup/clawd_config.yaml

# 移除故障节点
clawd node remove --host 192.168.1.102

五、常见问题与解决方案

  1. 节点添加失败:检查节点间SSH免密登录是否配置、9090端口是否开放,执行clawd node test --host <节点IP>测试连通性;
  2. 任务执行超时:在任务配置中增加timeout: 300(单位:秒),或检查节点资源是否充足;
  3. Web面板无法访问:检查防火墙/安全组是否开放8080端口,执行netstat -tulpn | grep 8080确认端口是否被占用;
  4. 资源监控数据缺失:确保节点安装sysstat工具(yum install -y sysstat/apt install -y sysstat)。

六、总结

  1. OpenCLAWD(小龙虾)是轻量级集群管理工具,核心优势是部署简单、资源占用低,适配中小规模集群场景;
  2. 安装推荐使用一键脚本,容器化部署适合快速测试,手动编译适合定制化需求;
  3. 核心使用流程为“初始化集群→添加节点→提交任务→监控执行状态”,支持CLI与Web面板双端操作。

附:官方资源

  • 官方文档:https://docs.openclawd.org
  • GitHub仓库:https://github.com/openclawd/openclawd
  • 社区交流:Discord(https://discord.gg/openclawd)、Gitee镜像(https://gitee.com/openclawd/openclawd)

注:本文适配OpenCLAWD v1.8.x版本,不同版本的命令/配置可能略有差异,请以官方文档为准。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐