怎么看待OpenClaw？

m0_68684627

358人浏览 · 2026-03-25 18:51:57

m0_68684627 · 2026-03-25 18:51:57 发布

特别附："词元"为何是理解这一切的关键

引言：一只龙虾爬到Linux头顶

2026年3月，GitHub星标榜上出现了一个奇观——一只"龙虾"爬到了Linux头顶。

OpenClaw，这个从个人项目演变成的AI智能体框架，在不到四个月的时间里：

GitHub星标突破32万
衍生项目超过52个
覆盖9种编程语言，合计超61万星标
英伟达CEO黄仁勋称其为"我们这个时代最重要的软件发布"

在中国，"养虾"成为科技圈最热关键词。闲鱼上代部署标价50-300元，淘宝出现"虾缸"和"虾粮"套餐。

喧嚣之下，我们需要冷静下来。

前置概念：理解"词元"

在展开分析之前，必须先理解一个关键概念——词元（Token）。

2026年3月24日，工信部正式将"Token"的中文名确定为"词元"。

什么是词元？

概念	说明
定义	大模型处理文本的基本单位
中文计量	约0.5-1个汉字
本质	AI的"燃料"，按量计费

为什么理解词元很重要？

OpenClaw为什么有成本？ → 每次调用大模型都在消耗词元
为什么不同"龙虾"收费不同？ → 背后调用的模型词元定价不同
为什么安全风险被放大？ → 词元被盗用，等于钱包被掏空
为什么中美调用量对比重要？ → 词元消耗是AI应用活跃度的直接度量

一个直观例子：

"帮我整理桌面文件"这句话 ≈ 10个词元

让OpenClaw执行这个任务，加上思考、规划、反馈的循环，实际消耗可能高达500-5000词元。

理解了词元，就理解了OpenClaw的本质——它是一个"词元燃烧机"，把词元转化为行动。

一、技术视角：OpenClaw做了什么？

1.1 不只是"Claude, but with hands"

社区最流行的评价是"Claude, but with hands"。但这句话只说对了三分之一。

OpenClaw与三类既有产品的区别：

对比对象	传统形态	OpenClaw的突破
传统RPA	规则驱动，流程固化	语义理解，自主规划路径
云端大模型	只"说"不"做"	拥有shell、浏览器、文件系统权限
Claude Code	命令行工具，执行即退出	常驻后台，有心跳机制，会主动找你

更准确的理解： 一个跑在你机器上的、通过聊天软件操控的、永远在线的AI执行者。

三个核心特征：

本地优先
IM交互
自主执行

这构成了"AI Agent运行时"这个品类的最小定义。

1.2 四层架构

┌─────────────────────────────────────────┐
│              模型层                      │
│        理解意图、逻辑规划                  │
│        消耗词元的主要环节                  │
├─────────────────────────────────────────┤
│              技能层                      │
│          提供执行模块和工具                │
├─────────────────────────────────────────┤
│             工作流层                     │
│        编排多个技能形成任务链               │
├─────────────────────────────────────────┤
│              执行层                      │
│         在真实环境中落地执行                │
└─────────────────────────────────────────┘

1.3 技术本质：让AI拥有"手脚"

核心矛盾一：能力 vs 可控性

过去的AI只有"大脑"没有"手脚"，能聊天不能干活。但给AI手脚又面临失控风险。

OpenClaw的答案：ReAct范式——让AI在"思考→行动→观察"的循环中持续自我校正。这个循环每进行一次，就消耗一批词元。

核心矛盾二：通用性 vs 本地化

云端AI强大但碰不到本地文件，本地AI能干活但能力受限。

OpenClaw的答案：本地优先 + 多模型兼容——核心逻辑跑在本地，模型调用可以是云端API。用户可以根据自己的词元预算，选择不同价位的"大脑"。

二、商业视角：谁在"养虾"？

2.1 产业链全景

注：以下产业链信息据公开信息整理

环节	参与者	动作
上游算力	NVIDIA、AMD	推出"智能体主机"概念，强调端侧推理
中游模型	智谱、MiniMax、Kimi	推出AutoClaw、MaxClaw、KimiClaw
下游应用	腾讯、阿里、字节	整合进办公套件，抢占入口
云基础设施	阿里云、腾讯云	上线一键部署方案，捆绑词元套餐
硬件厂商	联想	推出"百应NUC"，主打3分钟本地部署
运营商	北京移动	应用到网络运维，人力成本下降60%

2.2 三种商业模式

路径	代表	特点	词元成本
本地部署（肉身上帝）	智谱AutoClaw	养在用户电脑里，能直接操控文件系统	自购API，成本透明
云端部署（灵魂出窍）	MaxClaw、KimiClaw	养在厂商服务器里，7×24小时在线	39-199元/月订阅
硬件捆绑（虾缸一体）	联想百应NUC	软硬件一体，物理隔离	一次性硬件成本

2.3 盈利困境：谁为词元买单？

实测数据：一个自动化新闻监控任务，每小时运行一次，每月成本接近330元。

"词元消耗是我们穷人的痛"

结构性矛盾：

对厂商：39-199元的订阅费要覆盖模型推理、算力、客服成本，利润空间极其有限
对用户：如果龙虾干的活不值那么多钱，卸载就是必然
对行业：真正的规模化商用，必须建立在"产出 > 词元成本"的基础上

目前能跑通这个算账逻辑的，主要是企业端场景，比如北京移动的网络运维。

三、安全视角：当"虾"有了最高权限

3.1 风险不是"有可能"，而是"已发生"

2026年3月，国家互联网应急中心（CNCERT）专门发布了OpenClaw的安全风险提示。

注：以下安全事故均据公开报道

真实安全事故：

事件	后果
深圳程序员API密钥被盗	3天花费1.2万元
Meta安全专家接入工作邮箱	AI无视停止指令，删除数百封邮件
指令模糊导致AI误删	调用删除接口，清空整个评论平台

3.2 漏洞类型与词元关联

漏洞类型	风险描述	与词元的关系
SMB凭证泄露	Windows用户可能被恶意网页窃取登录凭证	攻击者可滥用词元
环境变量注入	MAVEN_OPTS等路径可能被利用	可能导致词元消耗异常
Unicode零宽字符	审批提示被不可见字符伪装	诱导AI执行消耗词元的操作

核心事实： OpenClaw的风险不仅是"AI失控"，更是"攻击者通过AI控制你的系统，消耗你的词元"。

当Agent拥有系统最高权限，它本身就是最大的攻击面。词元，就是攻击者的"提款机"。

3.3 安全实践三原则

原则一：最小权限

告诉AI"你只许动这个文件夹"，而不是整个系统。

原则二：物理隔离

买台二手电脑专门"养虾"，主力机数据无恙。

原则三：盯紧账单

词元消耗异常赶紧拔网线——这是安全事件的第一信号。

四、文化视角：中美"养虾"差异

4.1 美国：Agent是同事

有人让Agent帮忙压价买车，省了4200美元
有人让它自主打赢保险理赔官司
企业用它自动化高价值商业流程

核心诉求：自动化——把重复耗时的工作交给AI，自己聚焦高价值任务。词元被视为"生产成本"，追求投入产出比。

4.2 中国：Agent是宠物

朋友圈有人晒"虾"帮忙炒股
闲鱼代部署"虾"标价50-300元
淘宝出现"虾缸"（硬件盒子）和"虾粮"（API充值卡）
用户给虾起名字、晒成长记录、比谁家的"虾"更聪明

核心诉求：参与感——不仅是使用AI，更是"养"一个属于自己的智能体。词元被视为"虾粮"，用户更关心"虾"有没有吃饱。

4.3 共同趋势：IM正在成为Agent的控制平面

没有额外入口，没有额外登录。出差路上通过微信给家里的Agent发条消息，它就能整理NAS文件、检查摄像头画面。

这个转变可能比"Agent能做什么"更深远——它改变了人机交互的入口形态。

五、理性审视：五大争议

5.1 是范式革命还是概念炒作？

AutoGPT走的是"全自主"路线——给AI一个目标，让它自己拆解、自己执行。但当时的模型能力撑不住，Agent在无意义循环里空转，烧掉大量词元却完不成任务。

OpenClaw走了一条不同的路："人在回路中"——人定方向，AI干活。

同时，2025年底的模型在函数调用准确率和稳定性上远超2023年水平。

5.2 成功率≠好用，背后是"大脑"的差距

根据全球首个龙虾大模型排行榜PinchBench，8款大厂"龙虾"能真正顺利完成任务的屈指可数。

结论： 同样的壳，换不同的脑，效果天差地别。看Claw产品，先看它接了什么"大脑"。

5.3 成本失控：龙虾到底多烧钱？

实测：让8只"龙虾"完成同一任务——整理10张照片按性别分类。其中一只还没完成任务就花掉了3块钱。

5.4 安全补丁永远在路上

3.22版本的安全补丁打了十多项，但"更新到官方最新版本，确实能修复已知的安全漏洞，但并不意味着完全消除安全风险"。

作为本地运行的AI代理，OpenClaw信任边界模糊、技能包市场缺乏审核，风险隐患长期存在。

5.5 生态繁荣下的隐忧

52个衍生项目、9种编程语言、61万星标——表面繁荣。

但六条分化路线中，哪条最终能跑出来，现在没有人知道：

极简派
安全派
企业派
记忆派
移植派
异见派

品类远未到收敛的时候。

六、结语：龙虾的启示

OpenClaw的爆火，本质上是"行动智能"这个品类的需求爆发。它告诉我们三件事：

第一，AI的下一步是"手脚"。

当大模型能力已经足够强大，真正的问题变成了"如何让AI在真实世界里干活"。OpenClaw用"本地优先+IM交互+自主执行"给出了一个答案。词元，是让这些手脚动起来的"能量"。