这是一篇深度解析 Google 新发布的 Android Agent 工具链的博客文章。文章结合了最新的行业趋势(如 MCP 与 CLI 之争)以及具体的工具技术细节,旨在为开发者提供一个从宏观背景到微观实践的全面视角。

2026 年初,AI Agent 的发展进入了“深水区”。当大众还在惊叹模型能写出一段漂亮的 UI 代码时,一线 Android 开发者却在被“幻觉”折磨:模型生成的 Gradle 配置已经过时了三个版本;它不知道最新的 Navigation 3 怎么用;甚至为了让它在模拟器上跑起来,你得反复复制粘贴十几条 ADB 命令。

LLM “懂代码”但“不懂工程”,这是过去两年 Android 开发最大的痛点。

2026 年 4 月,Google 正式发布了 Android Agent 开发三件套:Android CLI、Android Skills 以及 Android Knowledge Base。这不仅仅是发布了几个工具,它标志着 Google 正在试图将 Android 开发的“工程动作”标准化,把 Agent 从一个“只会敲键盘的实习生”改造成为一个“精通工具链的专家”。


一、 范式转向:为什么是 CLI 而非 MCP?

在解析具体工具前,我们必须理解背后的行业风向。

2025 年,MCP (Model Context Protocol) 曾被寄予厚望,试图为 Agent 打造一套通用的 JSON-RPC 协议标准。然而进入 2026 年,以 Perplexity CTO Denis Yarats 和 YC 掌门人 Garry Tan 为代表的技术领袖开始公开转向,倡导 CLI-first (命令行优先)

1. MCP 的“成长的烦恼”

MCP 试图在模型和工具之间建立一套“重协议”。但当工具数量激增时,三个致命缺陷显现:

  • Token 成本黑洞: 每个工具都需要庞大的 JSON Schema 描述。Agent 还没开工,光加载这堆“说明书”就要烧掉数万 Token。

  • 重复造轮子: 认证、鉴权、环境隔离,MCP 都得重写一套。而 CLI 可以直接复用 SSH、环境变量、.gitconfig 等沉淀了几十年的 OS 级基建。

  • 丧失可组合性: Unix 的灵魂是“管道(Pipe)”。CLI 的输出是文本,能轻易串联;MCP 的输出是封装的 JSON,调试起来像是在拆盲盒。

2. CLI:Agent 的“母语”

Google 此次发布的 Android CLI 显然顺应了这一潮流。它认为 Agent 已经足够聪明,不需要你把世界用 Schema 重新写一遍。

  • 按需加载: 需要用工具时,Agent 去读 --helpman 手册,开销极低。

  • 原子化: 把 SDK 安装、设备管理、布局分析全部封装成标准的命令。


二、 Android CLI:把工程动作变成“确定性接口”

Android CLI 被定义为“从终端进行 Android 开发的主要接口”。它的核心逻辑是:不要让模型去猜怎么写脚本,直接给它调用的接口。

1. 核心能力清单

通过 android 命令,Agent 现在可以稳定执行以下操作:

  • 环境搭建: android sdk install "platforms/android-35"

  • 项目初始化: android create --template=empty-activity-agp-9

  • 设备操控: android emulator start medium_phone

  • 布局感知: 这是最惊艳的功能。android layout --pretty 能以 JSON 格式返回当前屏幕的 UI 树,而 android screen capture --annotate 能直接给 UI 元素打标。

2. 解决“视觉盲点”

以往 Agent 很难理解它运行的代码在模拟器上长什么样。现在,通过 android screen resolve,Agent 可以将视觉标签(如 #5 按钮)转换为具体的坐标(x, y),从而实现自动化的点击和交互测试。这让 Agent 具备了真正的 UI 闭环调试能力


三、 Android Skills:把专家流程“可编程化”

如果说 CLI 是“手”,那么 Android Skills 就是“脑”。

Google 在 GitHub 上开源了 android/skills 仓库。每一个 Skill 都是一个遵循 agentskills.io 标准的目录,核心是一个 SKILL.md 文件。

1. 为什么要搞 Skills?

传统的文档(如官方 DevGuide)是写给人类看的,充满了叙述和背景。但 Agent 在执行任务时,需要的是:

  1. 前置条件(Prerequisites)

  2. 执行步骤(Steps)

  3. 禁止事项(Anti-patterns)

  4. 检查点(Checkpoints)

2. 覆盖关键路径

首批发布的 Skills 极其精准地踩在了开发者的痛点上:

  • Edge-to-edge 适配: 以前模型总是在 SystemBar 适配上出错,现在有了专属 Skill,它会按标准流程修改 ThemeWindowInsets

  • XML 到 Compose 迁移: 提供了一套可重复执行的转换逻辑,避免过时的转换代码。

  • AGP 9 升级与 R8 优化: 这种高风险工程动作,由 Skill 提供确定的“避坑指南”。

3. 激活机制

当你对 Agent 说“把我的应用界面实现全屏显示”时,CLI 会通过关键词匹配发现 edge-to-edge 技能,并将该技能的上下文注入模型。这避免了模型在启动时“背诵”全量知识,真正做到了按需取用


四、 Knowledge Base:对抗知识的“半衰期”

LLM 的训练数据总是有截止日期的,但 Android 的库更新是以周为单位的。Android Knowledge Base 解决了“模型知识过时”的问题。

通过 android docs searchandroid docs fetch 命令,Agent 可以实时检索官方最新的文档片段。

  • RAG 的官方化: 这本质上是 Google 提供了一个官方维护、高质量分块的 RAG(检索增强生成)数据源。

  • 权威对齐: 当 Agent 在决策“该用哪个库”时,它会优先参考 Knowledge Base 中的最新推荐,而不是训练数据里的旧方案。


五、 实战演练:一个 Agent 工作流的诞生

想象一下,你让一个支持 Android CLI 的 Agent(如 Claude Code 或 Gemini CLI)完成以下任务:“创建一个 API 35 的 Compose 项目,并适配全屏显示。”

  1. 发现与环境: Agent 调用 android sdk list 检查 API 35 是否安装。如果没有,调用 android sdk install

  2. 创建项目: 调用 android create --name="MyBestApp" --output="./my-app"

  3. 加载技能: Agent 识别到“适配全屏”需求,通过 android skills add edge-to-edge 获取最佳实践。

  4. 编写与运行: Agent 根据 Skill 指引修改代码,然后调用 android emulator startandroid run 部署应用。

  5. 验证: Agent 调用 android layout 检查布局高度是否填满了屏幕像素,确保适配成功。

官方数据显示,这种模式下 Token 消耗降低了 70%,任务完成速度提升了 3 倍。


六、 开发者该如何准备?

作为 Android 开发者,我们正处于从“代码编写者”向“Agent 编排者”转型的关键时刻。

1. 拥抱 CLI 环境

如果你习惯于只在 Android Studio 里点点点,现在是时候熟悉终端了。安装 Android CLI,尝试用命令去管理你的 SDK 和模拟器。

2. 沉淀团队的 Skills

不要只依赖 Google 官方的 Skills。每个团队都有自己的架构规范(如自定义的 BaseViewModel、特定的代码风格)。你可以参照 SKILL.md 的标准,将团队的规范写成 Skill。

  • 将 Skill 放在项目的 .skills/ 目录下。

  • 定义清晰的 YAML 元数据。

  • 这不仅能让 AI 更好用,也是最好的“新人入职文档”。

3. 关注分布式开发环境

这次发布传递出的一个强烈信号是:Android 开发正在脱离“单一 IDE”的束缚。 无论是在云端、第三方 Agent 还是定制化脚本中,高质量的 Android 开发能力正在变得无处不在。


结语

Google 的这一套组合拳,本质上是在做一件极其枯燥但正确的事情:清理工地的乱石,铺好标准的轨道。

当工程动作被接口化(CLI),当工作流被规范化(Skills),当最新知识被检索化(Knowledge Base),Agent 才真正具备了生产力。我们不再需要模型去“猜”怎么开发 Android,而是让它作为一名专家,熟练地操作这套官方提供的精密仪。

Android 开发的 Agent 时代,今天才真正拉开帷幕。


参考资料:

  • Android CLI 官方文档 (2026.04)

  • Android Skills GitHub Repository

  • Agent Skills Open Standard (agentskills.io)


作者:Li Caijun

专注 Android 新科技

如果本文让你对Android CLI有了新的认识,欢迎在评论区交流,点赞收藏不迷路!

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐