特别附:"词元"为何是理解这一切的关键


引言:一只龙虾爬到Linux头顶

2026年3月,GitHub星标榜上出现了一个奇观——一只"龙虾"爬到了Linux头顶。

OpenClaw,这个从个人项目演变成的AI智能体框架,在不到四个月的时间里:

  • GitHub星标突破32万

  • 衍生项目超过52个

  • 覆盖9种编程语言,合计超61万星标

  • 英伟达CEO黄仁勋称其为"我们这个时代最重要的软件发布"

在中国,"养虾"成为科技圈最热关键词。闲鱼上代部署标价50-300元,淘宝出现"虾缸"和"虾粮"套餐。

喧嚣之下,我们需要冷静下来。


前置概念:理解"词元"

在展开分析之前,必须先理解一个关键概念——词元(Token)

2026年3月24日,工信部正式将"Token"的中文名确定为"词元"。

什么是词元?

概念 说明
定义 大模型处理文本的基本单位
中文计量 约0.5-1个汉字
本质 AI的"燃料",按量计费

为什么理解词元很重要?

  • OpenClaw为什么有成本? → 每次调用大模型都在消耗词元

  • 为什么不同"龙虾"收费不同? → 背后调用的模型词元定价不同

  • 为什么安全风险被放大? → 词元被盗用,等于钱包被掏空

  • 为什么中美调用量对比重要? → 词元消耗是AI应用活跃度的直接度量

一个直观例子:

"帮我整理桌面文件"这句话 ≈ 10个词元

让OpenClaw执行这个任务,加上思考、规划、反馈的循环,实际消耗可能高达500-5000词元

理解了词元,就理解了OpenClaw的本质——它是一个"词元燃烧机",把词元转化为行动。


一、技术视角:OpenClaw做了什么?

1.1 不只是"Claude, but with hands"

社区最流行的评价是"Claude, but with hands"。但这句话只说对了三分之一。

OpenClaw与三类既有产品的区别:

对比对象 传统形态 OpenClaw的突破
传统RPA 规则驱动,流程固化 语义理解,自主规划路径
云端大模型 只"说"不"做" 拥有shell、浏览器、文件系统权限
Claude Code 命令行工具,执行即退出 常驻后台,有心跳机制,会主动找你

更准确的理解: 一个跑在你机器上的、通过聊天软件操控的、永远在线的AI执行者。

三个核心特征:

  • 本地优先

  • IM交互

  • 自主执行

这构成了"AI Agent运行时"这个品类的最小定义。

1.2 四层架构

┌─────────────────────────────────────────┐
│              模型层                      │
│        理解意图、逻辑规划                  │
│        消耗词元的主要环节                  │
├─────────────────────────────────────────┤
│              技能层                      │
│          提供执行模块和工具                │
├─────────────────────────────────────────┤
│             工作流层                     │
│        编排多个技能形成任务链               │
├─────────────────────────────────────────┤
│              执行层                      │
│         在真实环境中落地执行                │
└─────────────────────────────────────────┘

1.3 技术本质:让AI拥有"手脚"

核心矛盾一:能力 vs 可控性

过去的AI只有"大脑"没有"手脚",能聊天不能干活。但给AI手脚又面临失控风险。

OpenClaw的答案:ReAct范式——让AI在"思考→行动→观察"的循环中持续自我校正。这个循环每进行一次,就消耗一批词元。

核心矛盾二:通用性 vs 本地化

云端AI强大但碰不到本地文件,本地AI能干活但能力受限。

OpenClaw的答案:本地优先 + 多模型兼容——核心逻辑跑在本地,模型调用可以是云端API。用户可以根据自己的词元预算,选择不同价位的"大脑"。


二、商业视角:谁在"养虾"?

2.1 产业链全景

注:以下产业链信息据公开信息整理

环节 参与者 动作
上游算力 NVIDIA、AMD 推出"智能体主机"概念,强调端侧推理
中游模型 智谱、MiniMax、Kimi 推出AutoClaw、MaxClaw、KimiClaw
下游应用 腾讯、阿里、字节 整合进办公套件,抢占入口
云基础设施 阿里云、腾讯云 上线一键部署方案,捆绑词元套餐
硬件厂商 联想 推出"百应NUC",主打3分钟本地部署
运营商 北京移动 应用到网络运维,人力成本下降60%

2.2 三种商业模式

路径 代表 特点 词元成本
本地部署(肉身上帝) 智谱AutoClaw 养在用户电脑里,能直接操控文件系统 自购API,成本透明
云端部署(灵魂出窍) MaxClaw、KimiClaw 养在厂商服务器里,7×24小时在线 39-199元/月订阅
硬件捆绑(虾缸一体) 联想百应NUC 软硬件一体,物理隔离 一次性硬件成本

2.3 盈利困境:谁为词元买单?

实测数据:一个自动化新闻监控任务,每小时运行一次,每月成本接近330元

"词元消耗是我们穷人的痛"

结构性矛盾:

  • 对厂商:39-199元的订阅费要覆盖模型推理、算力、客服成本,利润空间极其有限

  • 对用户:如果龙虾干的活不值那么多钱,卸载就是必然

  • 对行业:真正的规模化商用,必须建立在"产出 > 词元成本"的基础上

目前能跑通这个算账逻辑的,主要是企业端场景,比如北京移动的网络运维。


三、安全视角:当"虾"有了最高权限

3.1 风险不是"有可能",而是"已发生"

2026年3月,国家互联网应急中心(CNCERT)专门发布了OpenClaw的安全风险提示。

注:以下安全事故均据公开报道

真实安全事故:

事件 后果
深圳程序员API密钥被盗 3天花费1.2万元
Meta安全专家接入工作邮箱 AI无视停止指令,删除数百封邮件
指令模糊导致AI误删 调用删除接口,清空整个评论平台

3.2 漏洞类型与词元关联

漏洞类型 风险描述 与词元的关系
SMB凭证泄露 Windows用户可能被恶意网页窃取登录凭证 攻击者可滥用词元
环境变量注入 MAVEN_OPTS等路径可能被利用 可能导致词元消耗异常
Unicode零宽字符 审批提示被不可见字符伪装 诱导AI执行消耗词元的操作

核心事实: OpenClaw的风险不仅是"AI失控",更是"攻击者通过AI控制你的系统,消耗你的词元"。

当Agent拥有系统最高权限,它本身就是最大的攻击面。词元,就是攻击者的"提款机"。

3.3 安全实践三原则

原则一:最小权限

告诉AI"你只许动这个文件夹",而不是整个系统。

原则二:物理隔离

买台二手电脑专门"养虾",主力机数据无恙。

原则三:盯紧账单

词元消耗异常赶紧拔网线——这是安全事件的第一信号。


四、文化视角:中美"养虾"差异

4.1 美国:Agent是同事

  • 有人让Agent帮忙压价买车,省了4200美元

  • 有人让它自主打赢保险理赔官司

  • 企业用它自动化高价值商业流程

核心诉求:自动化——把重复耗时的工作交给AI,自己聚焦高价值任务。词元被视为"生产成本",追求投入产出比。

4.2 中国:Agent是宠物

  • 朋友圈有人晒"虾"帮忙炒股

  • 闲鱼代部署"虾"标价50-300元

  • 淘宝出现"虾缸"(硬件盒子)和"虾粮"(API充值卡)

  • 用户给虾起名字、晒成长记录、比谁家的"虾"更聪明

核心诉求:参与感——不仅是使用AI,更是"养"一个属于自己的智能体。词元被视为"虾粮",用户更关心"虾"有没有吃饱。

4.3 共同趋势:IM正在成为Agent的控制平面

没有额外入口,没有额外登录。出差路上通过微信给家里的Agent发条消息,它就能整理NAS文件、检查摄像头画面。

这个转变可能比"Agent能做什么"更深远——它改变了人机交互的入口形态。


五、理性审视:五大争议

5.1 是范式革命还是概念炒作?

AutoGPT走的是"全自主"路线——给AI一个目标,让它自己拆解、自己执行。但当时的模型能力撑不住,Agent在无意义循环里空转,烧掉大量词元却完不成任务。

OpenClaw走了一条不同的路:"人在回路中"——人定方向,AI干活。

同时,2025年底的模型在函数调用准确率和稳定性上远超2023年水平。

5.2 成功率≠好用,背后是"大脑"的差距

根据全球首个龙虾大模型排行榜PinchBench,8款大厂"龙虾"能真正顺利完成任务的屈指可数。

结论: 同样的壳,换不同的脑,效果天差地别。看Claw产品,先看它接了什么"大脑"。

5.3 成本失控:龙虾到底多烧钱?

实测:让8只"龙虾"完成同一任务——整理10张照片按性别分类。其中一只还没完成任务就花掉了3块钱。

5.4 安全补丁永远在路上

3.22版本的安全补丁打了十多项,但"更新到官方最新版本,确实能修复已知的安全漏洞,但并不意味着完全消除安全风险"。

作为本地运行的AI代理,OpenClaw信任边界模糊、技能包市场缺乏审核,风险隐患长期存在。

5.5 生态繁荣下的隐忧

52个衍生项目、9种编程语言、61万星标——表面繁荣。

但六条分化路线中,哪条最终能跑出来,现在没有人知道:

  • 极简派

  • 安全派

  • 企业派

  • 记忆派

  • 移植派

  • 异见派

品类远未到收敛的时候。


六、结语:龙虾的启示

OpenClaw的爆火,本质上是"行动智能"这个品类的需求爆发。它告诉我们三件事:

第一,AI的下一步是"手脚"。

当大模型能力已经足够强大,真正的问题变成了"如何让AI在真实世界里干活"。OpenClaw用"本地优先+IM交互+自主执行"给出了一个答案。词元,是让这些手脚动起来的"能量"。

第二,技术平权正在发生。

大厂们把原本属于极客的命令行,封装成了普通人也能点的图标。词元价格的下行,是技术平权的经济基础。

第三,安全是规模化的前提。

OpenClaw能不能从"极客玩具"变成"企业工具",关键不在于能力有多强,而在于风险有多可控。北京移动选择它的理由恰恰是"零接触+物理隔离"的架构。


怎么看待OpenClaw?

它是AI从"对话"走向"行动"的里程碑,但也暴露了这条路上的所有坑——词元成本、安全风险、商业化困境、生态治理。它让我们看到了"数字员工"的可能,也让我们清醒地认识到:想让AI真正替人干活,还有很长的路要走。

龙虾不睡觉,但养虾的人得清醒。


附录:词元小百科

问题 答案
什么是词元? 大模型处理文本的基本单位,约0.5-1个汉字
为什么叫词元? 2026年3月24日工信部正式确定的中文名
词元怎么定价? 不同模型定价不同,约0.5-5元/百万词元
一个任务消耗多少词元? 简单问答500-1000;复杂任务5000-50000
如何控制词元成本? 选择低价模型、精简提示词、限制任务复杂度
词元和安全什么关系? API密钥泄露=词元被盗用=经济损失

互动话题

你的"虾"每月消耗多少词元? 欢迎在评论区分享~

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐