AI 与大模型相关

星空

379人浏览 · 2026-03-26 07:28:22

星空 · 2026-03-26 07:28:22 发布

一、 AI 与大模型相关

1.1 Agent（智能体）

定义：具备自主规划、工具调用、记忆管理、任务执行能力的 AI 实体，能主动完成复杂目标。

核心能力：拆解任务、调用 API / 工具、自主决策、持久记忆、后台执行。

区别：普通 AI “一问一答”；Agent“给目标→自动干活→反馈结果”。

1.2 RAG（Retrieval-Augmented Generation，检索增强生成）

定义：结合信息检索与文本生成的技术，让 AI 先从外部知识库查资料，再生成准确回答。

核心价值：解决大模型 “幻觉”、知识过时问题，提升事实准确性。

对比微调：RAG 成本低、可实时更新知识库；微调改变模型行为、成本高。

1.3 Token（令牌）

定义：大模型处理文本的最小计费 / 计算单位。

换算：约 1 token ≈ 1 个汉字，或 1 token ≈ 0.75 个英文单词。

作用：衡量模型输入 / 输出长度，决定 API 调用费用与算力消耗。

1.4 Prompt Engineering（提示词工程，简称：PE）

多场景含义:AI / 开发 / 金融等

AI / 开发：常指 Prompt Engineering（提示词工程），通过优化指令提升模型输出质量。

金融：Price-to-Earnings Ratio（市盈率），股价 / 每股收益，衡量估值。

开发：Portable Executable（可移植执行文件），Windows 下.exe/.dll 格式。

1.5 API（Application Programming Interface，应用程序编程接口）

定义：软件系统间通信与数据交互的标准接口，类似 “服务调用说明书”。

作用：让不同程序 / 服务互相调用能力（如天气 API、支付 API、模型 API）。

OpenClaw 视角：连接大模型（如 GPT/Claude）与本地工具的 “桥梁”。

二、云计算与网络

2.1 云计算（Cloud Computing）

定义：通过互联网按需获取计算、存储、网络、数据库等 IT 资源，按使用量付费。

核心模式：IaaS（基础设施）、PaaS（平台）、SaaS（软件）。

优势：弹性扩展、降低成本、按需使用、全球部署。

2.2 VPC（Virtual Private Cloud，虚拟私有云）

定义：公有云中逻辑隔离的私有网络环境，用户可自定义 IP 段、路由、安全策略。

核心价值：在公有云上构建 “专属网络”，保障资源安全与网络可控。

用途：部署云服务器、数据库、容器等，构建企业级云上架构。

三、OpenClaw（核心框架）

3.1 来历

Openclaw 该智能体具备本地数据主动采集能力，可在未经用户明确授权的情况下自动读取终端敏感信息，并结合系统级权限实现远程控制、数据外传等恶意行为。核心架构由Gateway（网关）、Agent（智能体）、Skills（技能）和Memory（记忆）构成。其兼容多种操作系统。用户可通过WhatsApp、Slack等即时通讯工具作为交互界面与系统对接。部署在本地电脑并获得相应权限后，可以直接访问系统。通过部署多台电脑和多个智能体，可以实现自动化处理邮件、阅读文档、编写代码、发布社交媒体内容等工作。

3.2 它跟Claude、ChatGPT、Gemini的区别

Claude/ChatGPT/Gemini：云端大模型，主要聊天、推理、写东西。Claude最稳（少胡说）、ChatGPT最快通用、Gemini最会搜+多模态（图表视频）。全靠服务器，数据走出去。

OpenClaw：本地守护进程，能执行任务（比如“备份桌面”它真去mv文件）。记忆超长、常驻后台，像机器人管家。缺点？推理没云端深，得接模型（Claude/GPT/Ollama本地）

3.3 基础

(1)定义：开源、本地优先、模型无关的 AI Agent 运行框架 / 网关，让 AI 直接执行真实任务。

(2)核心定位：AI 的 “身体 / 执行系统”，连接大模型（大脑）与本地工具 / 设备（手脚）。

(3)核心特性：

本地部署：数据全在本地，隐私可控，不上传云端。

模型无关：兼容 GPT、Claude、Ollama 等，可自由切换。

技能扩展：通过 Skills 插件实现文件管理、发邮件、浏览器控制、代码运行等。

多渠道交互：支持飞书、钉钉、Telegram、Discord 等 50 + 平台。

自主执行：后台运行、持久记忆、自动完成复杂工作流。

口号：The AI that actually does things（真正能做事的 AI）。

3.4OpenClaw架构设计

1.分层式架构
基础层+工具层+适配器层+预处理层四层架构。基础层封装操作系统差异，跨平台兼容，灵活部署在服务器或嵌入式设备。

2.模块化组件
四大核心模块：渠道适配器（交互）、智能体（决策）、技能插件（执行）、记忆系统（存储），分别处理通讯、推理、任务和数据。

3.动态扩展机制
npm包管理实现插件化，支持ChatGPT/Claude/GLM等大模型动态加载，用户可自由切换模型提供商。

3.5 核心技术实现原理

1.语言模型交互
"超长文本+指令标记"模式，打包用户输入+记忆数据+工具输出，模型响应触发工具调用。

2.工具调用流程
七步闭环：指令→解析→匹配→返回→分析→执行→反馈，形成完整任务流。

3.记忆管理系统
双级存储：短期记忆存72小时对话，长期记忆用SQLite+Markdown本地存储，多轮摘要突破长度限制。

4.主动执行能力
心跳机制（30分钟）读取habit.md执行任务，Cron Job定时触发；ReAct模型拆解复杂目标为步骤。

5.安全防护设计
默认关闭外部端口，推荐沙盒运行，指令白名单过滤高危操作，所有数据本地存储保障隐私。