你花三年学会的GIMP修图流程,AI一条命令就能跑完。你熬夜剪的视频,AI用Kdenlive十秒钟就能拼好。这不是科幻片——这是一个叫CLI-Anything的开源项目,上线6天GitHub星标破13000。

而当它和今年最火的AI助手OpenClaw接上线,事情就更离谱了。
在这里插入图片描述


前几天,一位做了六年平面设计的朋友跟我吐槽。

他说他们公司新来了一个实习生,技术一般,但这哥们儿用AI工具贼溜。别人还在手动抠图、调色、导出,他已经让AI帮他批量处理完了——而且质量不差。

“我花三个小时精修的图,他半小时出五张。老板根本不在乎你用什么工具,只看谁快。”

他沉默了一会儿说:“我突然觉得,我这六年练的手速和肌肉记忆,可能一文不值。”

我没忍心告诉他,事情可能比他想的还严重。

因为现在AI不只是"辅助"你用软件了——它正在学会"直接操作"软件。

今天这篇文章,就带你认识这个正在改变游戏规则的项目:CLI-Anything


一、CLI-Anything到底是什么?

一句话解释:CLI-Anything能把任何带图形界面的软件,自动变成AI可以直接调用的命令行工具。

听不懂?没关系,我翻译成人话。

你用GIMP修图,得打开软件、点菜单、选工具、调参数、一步步手动操作。这些操作对人类来说很直觉,但对AI来说是噩梦——AI看不懂按钮,点不准菜单,更别说处理复杂的多步操作了。

目前让AI操作软件主要有两种思路:

思路一:截屏流派。 就是Claude Computer Use和Perplexity Computer那种——让AI截屏看你的桌面,然后模拟鼠标点击。很直觉,但非常慢,容易出错,而且烧算力。PCWorld的记者实测Claude操控Mac,半小时就把五小时的用量额度烧完了。

思路二:命令行流派。 这就是CLI-Anything的路线——直接跳过图形界面,把软件底层的真实功能封装成一条条命令。AI不需要"看"屏幕,直接输入命令就能操控软件。快、准、稳。

打个比方:截屏流派就像让一个不懂中文的老外看着菜单上的汉字,靠图片识别点菜——能点,但慢且容易点错。命令行流派就像直接给他一份英文菜单,看完就能下单——精准高效。

CLI-Anything就是那个"自动翻译菜单"的工具。 它分析软件的源代码,自动生成一套完整的命令行接口。而且调用的是软件的真实后端——GIMP真的在渲染、Blender真的在建模、LibreOffice真的在生成文档。不是玩具,不是模拟,是真家伙。


二、它现在能操控哪些软件?

CLI-Anything由香港大学数据智能实验室(HKUDS)开发,3月8日上线,目前已经支持11款专业软件:

创意工具: GIMP(修图)、Blender(3D建模)、Inkscape(矢量设计)、Audacity(音频处理)、Kdenlive和Shotcut(视频剪辑)、OBS Studio(直播推流)

办公套件: LibreOffice(文档/表格/演示)

AI平台: Stable Diffusion、ComfyUI、InvokeAI

视频会议: Zoom

而且这只是第一批。CLI-Anything的设计是通用的——理论上任何有源代码的软件都能生成对应的命令行接口。社区正在以极快的速度贡献新的适配。


三、具体能干什么?看几个例子

例子一:AI帮你用GIMP做海报

以前你要打开GIMP,新建画布,建图层,填充颜色,加文字,调透明度……一套流程走下来少说十几分钟。

现在用CLI-Anything:

# 新建一个1920x1080的项目
cli-anything-gimp project new --width 1920 --height 1080 -o poster.json

# 加一个纯色背景图层
cli-anything-gimp layer add -n "Background" --type solid --color "#1a1a2e"

# 加文字图层
cli-anything-gimp layer add -n "Title" --type text --content "2026年度报告" --font-size 72

# 导出为PNG
cli-anything-gimp export --format png -o poster.png

四条命令,搞定。而且每条命令都支持--json输出,AI可以链式调用,一气呵成。

例子二:AI帮你用LibreOffice写报告

# 新建Writer文档
cli-anything-libreoffice writer new -o report.json

# 加标题
cli-anything-libreoffice writer heading --level 1 --text "Q1季度报告"

# 加段落
cli-anything-libreoffice writer paragraph --text "本季度营收同比增长23%……"

# 导出为PDF
cli-anything-libreoffice export --format pdf -o report.pdf

AI不需要学会操作LibreOffice的菜单,它只需要会"说命令"就够了。

例子三:AI帮你用Blender渲染3D场景

以前Blender的学习曲线让多少人劝退?现在AI直接通过命令行调用Blender的真实渲染引擎,建模、打光、渲染——全程不需要打开那个让人头大的界面。

本质上,CLI-Anything消除了"会不会用软件"这个门槛。你不需要学软件,你只需要告诉AI你想要什么。


四、重头戏:CLI-Anything + OpenClaw = 你的全自动数字员工

CLI-Anything单独用已经很强了。但当它和OpenClaw——2026年最火的开源AI助手——结合起来,事情就进入了另一个维度。

先快速回顾一下OpenClaw

OpenClaw是一个运行在本地的AI代理,GitHub星标25万+,今年开源圈的现象级项目。它的核心能力是:你通过WhatsApp、Telegram、微信等聊天App给它下指令,它就在你的电脑上自动执行任务。它像一个7×24小时在线的数字助手——但不只是聊天,而是真的能动手干活。

OpenClaw本身通过一套"技能系统"来扩展能力。每个技能就是一个文件夹,里面有一个SKILL.md告诉AI"这个工具是干什么的、怎么用"。

它俩怎么结合?

CLI-Anything天然就是为OpenClaw这样的AI代理设计的。

从3月15日开始,CLI-Anything已经官方支持OpenClaw。而且社区还在ClawHub(OpenClaw的技能市场)上发布了CLI-Anything的技能包。也就是说,你现在可以这么玩:

第一步:安装CLI-Anything生成的命令行工具

比如你想让AI能操控GIMP,先把GIMP的CLI装上:

cd gimp/agent-harness && pip install -e .

装完之后,cli-anything-gimp这个命令就全局可用了。

第二步:在OpenClaw里安装CLI-Anything技能

npx clawhub@latest install cli-anything

或者直接在OpenClaw的技能目录里放入对应的SKILL.md,告诉OpenClaw"你现在有操控GIMP的能力了"。

第三步:用聊天App指挥你的AI干活

现在,你可以在WhatsApp或者Telegram里对OpenClaw说:

“帮我把桌面上那20张产品图都处理一下,统一裁成800×800,加上公司水印,然后导出到output文件夹。”

OpenClaw收到指令后,调用CLI-Anything生成的GIMP命令行接口,批量执行——打开图片、裁剪、加水印、导出。全程不需要打开GIMP的图形界面,全程不需要你在电脑前。

你可以在地铁上、在咖啡厅、在床上,用手机聊天的方式指挥你的电脑干活。

更进阶的玩法

当你把多个CLI-Anything工具组合起来,配合OpenClaw的自动化能力,可以搭出极其强大的工作流:

自媒体全自动流水线: 让OpenClaw监控你的选题表 → 用LibreOffice CLI生成文稿 → 用GIMP CLI制作配图 → 用Kdenlive CLI自动剪辑口播视频 → 最终输出一套图文视频素材包。你只需要给一个选题,剩下全自动。

设计师批量出图: 客户发来50个产品的参数表,OpenClaw自动读取表格 → 调用GIMP CLI逐个生成产品展示图 → 调用Inkscape CLI生成矢量Logo → 调用LibreOffice CLI生成产品手册PDF。你喝杯咖啡的功夫,全部搞定。

开发者自动化运维: OpenClaw定时检查服务器状态 → 发现异常自动截图 → 用CLI-Anything调用Grafana生成监控报表 → 通过Telegram推送给你。你甚至可以在睡觉的时候让它帮你值班。

关键区别在于:这不是"AI辅助你操作软件",而是"AI代替你操作软件"。你从操作者变成了指挥官。


五、为什么说这件事很重要?

回到开头那个设计师朋友的故事。

他焦虑的是"实习生用AI比他快"。但CLI-Anything + OpenClaw带来的冲击远不止于此。

以前: 你学三年Photoshop,成为修图高手,靠这个技能找工作、接单、养活自己。你的"会用软件"就是你的护城河。

现在: AI通过CLI-Anything直接调用Photoshop的底层能力,不需要学习界面,不需要练习手速,不需要肌肉记忆。你花三年积累的"操作熟练度"——在AI面前等于零。

这不是危言耸听。CLI-Anything项目主页上的slogan写得明明白白:

“Today’s software serves humans. Tomorrow’s users will be agents.”

——今天的软件服务人类。明天的用户将是AI代理。

当GIMP、Blender、LibreOffice、Audacity这些专业工具都变成AI可以直接调用的"API",那些靠"会操作某个软件"吃饭的岗位,会发生什么?

不需要我说。你自己想。


六、普通人现在能做什么?

说了这么多,不是为了制造焦虑(好吧,也有一点)。而是想说:与其焦虑,不如先动手玩起来。

如果你是技术人员或者有一定命令行基础,现在就可以开始:

第一步,去GitHub搜索HKUDS/CLI-Anything,star一下,clone到本地。

第二步,在Claude Code里安装插件:

/plugin marketplace add HKUDS/CLI-Anything
/plugin install cli-anything

然后用/cli-anything <你想适配的软件路径>一条命令生成CLI。

第三步,配合OpenClaw使用。在ClawHub安装技能,或者手动将生成的CLI工具接入OpenClaw的技能系统。

如果你不是技术人员,也没关系。先把OpenClaw搭起来(社区有保姆级教程),然后等社区把更多软件的CLI技能包发到ClawHub上。以后你只需要在手机上打字,就能调动电脑上的一切。

工具正在变得越来越傻瓜。但"知道这些工具存在"这件事本身,就已经是一种优势了。


最后

CLI-Anything的作者、香港大学的Chao Huang教授在推特上说了一句话:

“CLI is the universal language for both humans and AI agents.”

命令行,是人类和AI代理共通的语言。

有意思的是,AI时代最前沿的交互方式,居然是回到了计算机最古老的交互方式——命令行。图形界面是为人类设计的,而命令行天然就是为"输入指令、获得结果"这种逻辑设计的。

这大概就是技术最讽刺的地方:我们花了四十年让电脑学会"看图说话",结果AI说——不用了,我更喜欢打字。

而你的选择是:继续当那个手动点菜单的人,还是成为那个用一句话调动整个软件生态的人。


你觉得CLI-Anything这种项目会改变你的工作方式吗?评论区聊聊你用的软件和场景。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐