17.5k stars!一条命令,让任何软件都能被 AI Agent 直接操控!
一条命令,让任何软件都能被 AI Agent 直接操控
一、AI Agent 的"最后一公里"难题
大家都在谈 AI Agent 有多强,能规划、能推理、能写代码。但有一个问题被反复忽视:Agent 根本用不了大多数真实软件。
想让 Agent 帮你批量处理 GIMP 图片?没有 API。让它操控 Blender 渲染一个场景?得靠截图点击,脆弱得一碰就崩。想用 Agent 自动生成 LibreOffice 报表?只能用"残缺版"的 Python 封装,丢掉了 90% 的原生功能。
当前主流的三条路,条条都走不通:
- GUI 自动化(RPA):模拟鼠标键盘点击,界面一更新就全部失效,极其脆弱
- 官方 API:大量专业软件根本没有,或者接口残缺不全
- 重新封装实现:工程量巨大,且永远跑不过原生软件的完整能力
问题的本质在于:今天绝大多数软件是为"人类用户"设计的,而不是为 Agent 设计的。
香港大学数据智能实验室(HKUDS)的研究团队提出了一个不同的答案——CLI-Anything。
二、CLI-Anything 是什么?
CLI-Anything 是一个开源的 Claude Code 插件,核心能力只有一句话:把任何有源代码的软件,自动生成一套 Agent 原生的命令行接口(CLI)。
它的底层逻辑来自一个朴素的洞察:CLI 是人类和 AI Agent 共通的万能接口。
为什么 CLI 天然适合 Agent?
- 结构化、可组合:文本命令天然匹配 LLM 的输入格式,可以自由串联成复杂工作流
- 自描述:一个
--help就能让 Agent 在运行时自动发现所有可用功能,无需手写 API 文档 - Agent 友好:内置
--json标志,每条命令都能输出结构化 JSON,Agent 无需任何额外解析 - 确定且可靠:输出稳定一致,Agent 行为可预测,经过验证:Claude Code 每天通过 CLI 执行数以千计的真实任务
7 阶段全自动流水线
CLI-Anything 的核心是一套全自动 7 阶段生成流水线:
分析架构 → 设计 CLI → 实现模块 → 规划测试 → 编写测试 → 生成文档 → 发布
整个过程无需人工介入,最终产出一个包含以下特性的 Python CLI 包:
- REPL 交互模式:支持逐步迭代的会话式操作
- JSON 输出模式:
--json标志让 Agent 直接消费结构化数据 - 撤销/重做:完整的会话状态管理
- 全套测试覆盖:单元测试 + 端到端测试,目前 9 大应用共 1,436 个测试,通过率 100%
- 自描述文档:每个命令都有完整的
--help说明,Agent 可在运行时自主发现
已支持的软件生态
CLI-Anything 已经为大量主流开源软件生成了现成的 CLI 接口,覆盖范围相当广:
| 类别 | 代表软件 |
|---|---|
| 创意工具 | GIMP、Blender、Inkscape、Audacity、Kdenlive、Shotcut、OBS Studio |
| AI 平台 | Stable Diffusion WebUI、ComfyUI、InvokeAI、AnythingLLM |
| 办公套件 | LibreOffice(Writer/Calc/Impress) |
| 数据工具 | JupyterLab、DBeaver、Apache Superset、Metabase |
| 开发工具 | Jenkins、Gitea、Portainer、pgAdmin、SonarQube |
| 图表可视化 | Draw.io、Mermaid、PlantUML、Excalidraw |
![]() |
三、怎么用?
3.1 安装(Claude Code 插件方式,推荐)
在 Claude Code 会话中运行两条命令即可完成安装:
# 第一步:添加插件市场
/plugin marketplace add HKUDS/CLI-Anything
# 第二步:安装插件
/plugin install cli-anything
无需任何额外配置,装好即用。
Windows 用户注意:Claude Code 通过 bash 执行命令,需提前安装 Git for Windows(包含 bash 和 cygpath),或使用 WSL,否则会出现
cygpath: command not found报错。
3.2 手动安装(无需 Claude Code)
git clone https://github.com/HKUDS/CLI-Anything.git
cp -r CLI-Anything/cli-anything-plugin ~/.claude/plugins/cli-anything
# 在 Claude Code 中重新加载插件
/reload-plugins
3.3 为任意软件生成 CLI
安装完成后,只需将软件的本地路径或 GitHub 仓库地址传给插件,7 阶段流水线自动运行:
# 为本地 GIMP 源码生成 CLI(全 7 阶段自动完成)
/cli-anything ./gimp
# 直接从 GitHub 仓库构建
/cli-anything https://github.com/blender/blender
3.4 安装并使用生成的 CLI
生成完成后,将 CLI 安装到系统 PATH:
cd gimp/agent-harness
pip install -e .
# 验证安装
which cli-anything-gimp
# 查看所有可用命令
cli-anything-gimp --help
# 进入交互式 REPL 模式
cli-anything-gimp
# 输出结构化 JSON(供 Agent 消费)
cli-anything-gimp --json layer add -n "Background" --type solid --color "#1a1a2e"
3.5 增量优化覆盖范围
如果生成的 CLI 还不够完整,可以用 refine 命令做差距分析和补充,支持多次运行,每次都是增量的、非破坏性的:
# 全面优化——自动分析所有功能的覆盖差距
/cli-anything:refine ./gimp
# 定向优化——针对特定功能领域
/cli-anything:refine ./gimp "我需要更多图像批处理和滤镜相关的 CLI"
/cli-anything:refine ./blender "粒子系统和物理模拟"
3.6 运行测试与验证
# 运行测试套件
cd gimp/agent-harness
python3 -m pytest cli_anything/gimp/tests/ -v
# 验证 CLI 是否符合标准规范
/cli-anything:validate ./gimp
3.7 其他 AI 编程工具支持
除 Claude Code 外,CLI-Anything 也支持其他主流 AI 编程工具:
OpenCode:
cp CLI-Anything/opencode-commands/*.md ~/.config/opencode/commands/
cp CLI-Anything/cli-anything-plugin/HARNESS.md ~/.config/opencode/commands/
安装后获得 5 个斜杠命令:/cli-anything、/cli-anything-refine、/cli-anything-test、/cli-anything-validate、/cli-anything-list。
Codex:
bash CLI-Anything/codex-skill/scripts/install.sh
四、总结
CLI-Anything 提出了一个相当有前瞻性的命题:今天的软件是为人类设计的,但明天的用户将是 Agent——我们需要提前为这个迁移做好基础设施。
它的核心价值在于:
彻底绕开 GUI 自动化的脆弱性。不依赖截图、不依赖点击,直接对接软件的真实后端,保留 100% 的原生功能,稳定可预测。
一个命令,通吃所有软件。只要有源代码,无论是 GIMP、Blender、LibreOffice 还是你内部的私有工具,统统可以一键生成 Agent 可用的 CLI。
Agent 友好的设计哲学贯穿始终。结构化 JSON 输出、--help 自描述、REPL 模式、完整测试覆盖——每一个设计决定都在降低 Agent 的使用门槛。
多平台、多工具生态。Claude Code、OpenCode、Codex……CLI-Anything 的设计是平台无关的,正在向更多 AI 编程工具延伸。
如果你正在构建需要操控真实软件的 AI Agent,CLI-Anything 值得认真评估,它很可能是目前这个方向上最系统、最完整的开源解决方案。
项目地址:https://github.com/HKUDS/CLI-Anything
官网:https://clianything.org
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐




所有评论(0)