一、 AI 与大模型相关

1.1  Agent(智能体)

定义:具备自主规划、工具调用、记忆管理、任务执行能力的 AI 实体,能主动完成复杂目标。

核心能力:拆解任务、调用 API / 工具、自主决策、持久记忆、后台执行。

区别:普通 AI “一问一答”;Agent“给目标→自动干活→反馈结果”。

1.2  RAG(Retrieval-Augmented Generation,检索增强生成)

定义:结合信息检索与文本生成的技术,让 AI 先从外部知识库查资料,再生成准确回答。

核心价值:解决大模型 “幻觉”、知识过时问题,提升事实准确性。

对比微调:RAG 成本低、可实时更新知识库;微调改变模型行为、成本高。

1.3 Token(令牌)

定义:大模型处理文本的最小计费 / 计算单位。

换算:约 1 token ≈ 1 个汉字,或 1 token ≈ 0.75 个英文单词。

作用:衡量模型输入 / 输出长度,决定 API 调用费用与算力消耗。

1.4 Prompt Engineering(提示词工程,简称:PE)

多场景含义:AI / 开发 / 金融等

AI / 开发:常指 Prompt Engineering(提示词工程),通过优化指令提升模型输出质量。

金融:Price-to-Earnings Ratio(市盈率),股价 / 每股收益,衡量估值。

开发:Portable Executable(可移植执行文件),Windows 下.exe/.dll 格式。

1.5  API(Application Programming Interface,应用程序编程接口)

定义:软件系统间通信与数据交互的标准接口,类似 “服务调用说明书”。

作用:让不同程序 / 服务互相调用能力(如天气 API、支付 API、模型 API)。

OpenClaw 视角:连接大模型(如 GPT/Claude)与本地工具的 “桥梁”。

二、云计算与网络

2.1  云计算(Cloud Computing)

定义:通过互联网按需获取计算、存储、网络、数据库等 IT 资源,按使用量付费。

核心模式:IaaS(基础设施)、PaaS(平台)、SaaS(软件)。

优势:弹性扩展、降低成本、按需使用、全球部署。

2.2  VPC(Virtual Private Cloud,虚拟私有云)

定义:公有云中逻辑隔离的私有网络环境,用户可自定义 IP 段、路由、安全策略。

核心价值:在公有云上构建 “专属网络”,保障资源安全与网络可控。

用途:部署云服务器、数据库、容器等,构建企业级云上架构。

三、OpenClaw(核心框架)

3.1 来历

Openclaw 该智能体具备本地数据主动采集能力,可在未经用户明确授权的情况下自动读取终端敏感信息,并结合系统级权限实现远程控制、数据外传等恶意行为。核心架构由Gateway(网关)、Agent(智能体)、Skills(技能)和Memory(记忆)构成 。其兼容多种操作系统。用户可通过WhatsApp、Slack等即时通讯工具作为交互界面与系统对接。部署在本地电脑并获得相应权限后,可以直接访问系统 。通过部署多台电脑和多个智能体,可以实现自动化处理邮件、阅读文档、编写代码、发布社交媒体内容等工作。

3.2 它跟Claude、ChatGPT、Gemini的区别

Claude/ChatGPT/Gemini:云端大模型,主要聊天、推理、写东西。Claude最稳(少胡说)、ChatGPT最快通用、Gemini最会搜+多模态(图表视频)。全靠服务器,数据走出去。

OpenClaw:本地守护进程,能执行任务(比如“备份桌面”它真去mv文件)。记忆超长、常驻后台,像机器人管家。缺点?推理没云端深,得接模型(Claude/GPT/Ollama本地)

3.3 基础

(1)定义:开源、本地优先、模型无关的 AI Agent 运行框架 / 网关,让 AI 直接执行真实任务。

(2)核心定位:AI 的 “身体 / 执行系统”,连接大模型(大脑)与本地工具 / 设备(手脚)。

(3)核心特性:

本地部署:数据全在本地,隐私可控,不上传云端。

模型无关:兼容 GPT、Claude、Ollama 等,可自由切换。

技能扩展:通过 Skills 插件实现文件管理、发邮件、浏览器控制、代码运行等。

多渠道交互:支持飞书、钉钉、Telegram、Discord 等 50 + 平台。

自主执行:后台运行、持久记忆、自动完成复杂工作流。

口号:The AI that actually does things(真正能做事的 AI)。

3.4OpenClaw架构设计

1.分层式架构
基础层+工具层+适配器层+预处理层四层架构。基础层封装操作系统差异,跨平台兼容,灵活部署在服务器或嵌入式设备。

2.模块化组件
四大核心模块:渠道适配器(交互)、智能体(决策)、技能插件(执行)、记忆系统(存储),分别处理通讯、推理、任务和数据。

3.动态扩展机制
npm包管理实现插件化,支持ChatGPT/Claude/GLM等大模型动态加载,用户可自由切换模型提供商。

3.5 核心技术实现原理

1.语言模型交互
"超长文本+指令标记"模式,打包用户输入+记忆数据+工具输出,模型响应触发工具调用。

2.工具调用流程
七步闭环:指令→解析→匹配→返回→分析→执行→反馈,形成完整任务流。

3.记忆管理系统
双级存储:短期记忆存72小时对话,长期记忆用SQLite+Markdown本地存储,多轮摘要突破长度限制。

4.主动执行能力
心跳机制(30分钟)读取habit.md执行任务,Cron Job定时触发;ReAct模型拆解复杂目标为步骤。

5.安全防护设计
默认关闭外部端口,推荐沙盒运行,指令白名单过滤高危操作,所有数据本地存储保障隐私。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐