OpenClaw简单介绍

OpenClaw(也被称为“龙虾”AI)是一个开源的、本地优先的AI智能体框架。

它的核心定位是连接大模型的“思考”能力和本地系统的“执行”能力,让AI不仅能“说”,更能直接“动手”完成真实世界的工作

OpenClaw核心优点

  • “本地优先”与数据主权:所有敏感数据(如API密钥、文件、日志)默认存储在本地,不上传云端,最大程度保障用户隐私和数据安全。

  • “身脑分离”的多Agent协作:通过将Agent的“物理配置”(躯壳)与“认知记忆”(大脑)解耦,实现了更灵活、安全的专业Agent协同工作模式。例如,你可以配置一个“代码助手”Agent和一个“资讯搜集”Agent,它们在自己的独立工作区运行,仅在需要时协作,互不干扰。

  • 更聪明的“记性”:最新的lossless-claw上下文插件彻底改变了OpenClaw的记忆方式。它不再简单地丢弃旧对话,而是将历史消息持久化存储并生成摘要。在进行超长对话或复杂任务时,Agent可以通过摘要回溯任何历史细节,确保上下文“永不丢失”。

  • 不断进化的安全与可控性:最新的v3.8版本引入了ACP溯源机制,让每个指令都“自带身份证”,Agent能清晰识别是谁、从哪个渠道、有什么权限发来的指令,极大提升了多用户场景下的安全性和可追溯性。同时,官方也提供了便捷的备份命令 openclaw backup,让你在升级或修改配置前可以“一键存档”,有备无患。

OpenClaw(小龙虾)核心功能与场景

  • 系统与文件自动化
    • 批量整理文件、重命名、备份;执行 Shell 命令、管理进程、定时任务;
    • 权限分级与白名单,沙箱隔离防止误操作。
  • 浏览器与办公自动化
    • 自动登录网站、填写表单、数据抓取、截图;
    • Excel/CRM 数据互通、邮件分类归档、生成报表与会议纪要。
  • 开发与运维辅助
    • 代码生成、调试、Git 提交;服务器监控、日志分析、一键部署;
    • 多节点协作,Manager+Worker 架构处理复杂任务。
  • 多模型与多通道协同
    • 按任务动态切换模型(逻辑用 Claude,文案用 GPT);
    • 一处配置,多端(IM/Web/CLI)同步响应;
    • 支持递归自学习:自主编写调试代码,封装为新技能。
  • 安全机制
    • 技能沙箱隔离、操作权限白名单、会话加密;
    • 本地数据不默认上传,满足隐私合规需求。
  • 开发者效率神器:在聊天群里发一句“帮我在项目里删除所有 console.log”,Agent会自动打开IDE、定位文件并完成修改;或者一句“部署到测试环境”,它会自动执行一系列部署命令。

  • 办公自动化:自动整理邮件、将会议录音转为文字并生成待办事项、定时抓取竞品价格并生成报表发送到群聊。

  • 个人生活助理:早晨自动推送天气和日程、根据指令整理电脑里的图片视频、甚至通过集成控制智能家居。

OpenClaw标准工作流

  • Observe:网关接收指令,加载记忆上下文;
  • Think:大脑层规划执行步骤,选择模型与技能;
  • Act:执行层调用对应技能在沙箱完成操作;
  • Feedback:结果回传,失败则重新规划重试;关键数据写入记忆层。

OpenClaw核心架构

        (一)接入层(Gateway):多端统一的 “交通枢纽”

统一入口:对接飞书、Telegram、钉钉、WebUI、CLI 等多端;

消息路由:   内置任务队列(默认串行避免冲突);

协议标准化:基于 JSON-RPC 2.0 与 MCP 协议,支持会话隔离。

 身份与会话管理:处理用户认证、会话绑定,为后续的权限校验和任务隔离打下基础

网关控制层 :作为系统的流量与调度核心,负责消息的路由分发、会话的维护以及资源的分配智能路由:将指令精准分发到对应的Agent模块。
会话与记忆调度:管理任务上下文,协调短期和长期记忆的读写。
权限控制:执行基础的权限校验和初步的沙箱隔离

    (二)大脑层(Model/Agent):智能决策的 “指挥中心”

大模型适配:适配 GPT、Claude、DeepSeek、Ollama 本地模型

任务处理:指令解析、任务拆解、推理决策、生成执行步骤 

         解析用户指令(比如把 “统计文件夹大小” 拆解为 “调用文件系统技能 + 计算大小 + 格式化输出”)、推理决策、生成具体执行步骤;

任务规划:将复杂任务(如“部署到测试环境”)分解为具体的执行步骤(git pull, npm install等)

多智能体协同:支持将一个复杂任务拆分,由多个专业Agent分工协作完成

可追溯:记录推理轨迹(比如 “为什么选择终端命令而不是文件 API”),方便审计和问题排查;记录推理轨迹(Reasoning Traces),便于审计回溯

架构可控:控制与执行解耦,可云端 / 本地灵活部署

        (三)执行层(Skills):落地任务的 “工具库”

插件化 + 沙箱隔离:每个技能(比如 “终端命令执行”“浏览器自动化”)是独立插件,在沙箱中运行(一个技能出错不影响其他);

能力封装:覆盖常见操作场景 —— 文件系统(读 / 写 / 删文件)、终端命令(执行 shell/python 指令)、浏览器自动化(爬取网页 / 模拟点击)、API 调用(对接第三方服务);封装文件系统、终端命令、浏览器自动化(Playwrigh

t/Puppeteer)、API 调用;

低代码开发:用 Markdown 声明式开发技能(比如定义 “输入参数→执行逻辑→输出格式”),非专业开发者也能自定义技能,门槛低

 技能生态:拥有5700+个预定义“技能”(如发送邮件、操作浏览器、执行脚本),形成强大的自动化模块库。

系统操作:能直接进行文件读写、运行Shell命令、控制鼠标键盘等。

        (四)记忆层(Memory):留存信息的 “知识库”

本地优先:核心记忆文件(MEMORY.md 存事实 / 偏好,比如 “用户习惯用 Linux 终端”;SOUL.md 存人格)存在本地,隐私可控;

分层记忆:短期上下文(当前会话的聊天记录)+ 长期知识图谱(跨会话的关键信息,比如 “用户上周统计过的文件夹路径”),支持跨会话回溯;

离线可用:所有记忆数据本地存储,断网时仍能调用历史信息。

混合记忆:短期记忆存储会话上下文,长期记忆(通过lossless-claw等插件)持久化用户偏好和历史任务。

上下文永不丢失:通过插件化上下文引擎,可将历史对话持久化并生成摘要,需要时可回溯,解决了AI“失忆”的痛点。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐