终结 LLM 的“幻觉开发”:Google 发布 Android CLI、Skills 与 Knowledge Base 深度解析
这是一篇深度解析 Google 新发布的 Android Agent 工具链的博客文章。文章结合了最新的行业趋势(如 MCP 与 CLI 之争)以及具体的工具技术细节,旨在为开发者提供一个从宏观背景到微观实践的全面视角。
2026 年初,AI Agent 的发展进入了“深水区”。当大众还在惊叹模型能写出一段漂亮的 UI 代码时,一线 Android 开发者却在被“幻觉”折磨:模型生成的 Gradle 配置已经过时了三个版本;它不知道最新的 Navigation 3 怎么用;甚至为了让它在模拟器上跑起来,你得反复复制粘贴十几条 ADB 命令。
LLM “懂代码”但“不懂工程”,这是过去两年 Android 开发最大的痛点。
2026 年 4 月,Google 正式发布了 Android Agent 开发三件套:Android CLI、Android Skills 以及 Android Knowledge Base。这不仅仅是发布了几个工具,它标志着 Google 正在试图将 Android 开发的“工程动作”标准化,把 Agent 从一个“只会敲键盘的实习生”改造成为一个“精通工具链的专家”。
一、 范式转向:为什么是 CLI 而非 MCP?
在解析具体工具前,我们必须理解背后的行业风向。
2025 年,MCP (Model Context Protocol) 曾被寄予厚望,试图为 Agent 打造一套通用的 JSON-RPC 协议标准。然而进入 2026 年,以 Perplexity CTO Denis Yarats 和 YC 掌门人 Garry Tan 为代表的技术领袖开始公开转向,倡导 CLI-first (命令行优先)。
1. MCP 的“成长的烦恼”
MCP 试图在模型和工具之间建立一套“重协议”。但当工具数量激增时,三个致命缺陷显现:
-
Token 成本黑洞: 每个工具都需要庞大的 JSON Schema 描述。Agent 还没开工,光加载这堆“说明书”就要烧掉数万 Token。
-
重复造轮子: 认证、鉴权、环境隔离,MCP 都得重写一套。而 CLI 可以直接复用 SSH、环境变量、
.gitconfig等沉淀了几十年的 OS 级基建。 -
丧失可组合性: Unix 的灵魂是“管道(Pipe)”。CLI 的输出是文本,能轻易串联;MCP 的输出是封装的 JSON,调试起来像是在拆盲盒。
2. CLI:Agent 的“母语”
Google 此次发布的 Android CLI 显然顺应了这一潮流。它认为 Agent 已经足够聪明,不需要你把世界用 Schema 重新写一遍。
-
按需加载: 需要用工具时,Agent 去读
--help或man手册,开销极低。 -
原子化: 把 SDK 安装、设备管理、布局分析全部封装成标准的命令。
二、 Android CLI:把工程动作变成“确定性接口”
Android CLI 被定义为“从终端进行 Android 开发的主要接口”。它的核心逻辑是:不要让模型去猜怎么写脚本,直接给它调用的接口。
1. 核心能力清单
通过 android 命令,Agent 现在可以稳定执行以下操作:
-
环境搭建:
android sdk install "platforms/android-35"。 -
项目初始化:
android create --template=empty-activity-agp-9。 -
设备操控:
android emulator start medium_phone。 -
布局感知: 这是最惊艳的功能。
android layout --pretty能以 JSON 格式返回当前屏幕的 UI 树,而android screen capture --annotate能直接给 UI 元素打标。
2. 解决“视觉盲点”
以往 Agent 很难理解它运行的代码在模拟器上长什么样。现在,通过 android screen resolve,Agent 可以将视觉标签(如 #5 按钮)转换为具体的坐标(x, y),从而实现自动化的点击和交互测试。这让 Agent 具备了真正的 UI 闭环调试能力。
三、 Android Skills:把专家流程“可编程化”
如果说 CLI 是“手”,那么 Android Skills 就是“脑”。
Google 在 GitHub 上开源了 android/skills 仓库。每一个 Skill 都是一个遵循 agentskills.io 标准的目录,核心是一个 SKILL.md 文件。
1. 为什么要搞 Skills?
传统的文档(如官方 DevGuide)是写给人类看的,充满了叙述和背景。但 Agent 在执行任务时,需要的是:
-
前置条件(Prerequisites)
-
执行步骤(Steps)
-
禁止事项(Anti-patterns)
-
检查点(Checkpoints)
2. 覆盖关键路径
首批发布的 Skills 极其精准地踩在了开发者的痛点上:
-
Edge-to-edge 适配: 以前模型总是在
SystemBar适配上出错,现在有了专属 Skill,它会按标准流程修改Theme和WindowInsets。 -
XML 到 Compose 迁移: 提供了一套可重复执行的转换逻辑,避免过时的转换代码。
-
AGP 9 升级与 R8 优化: 这种高风险工程动作,由 Skill 提供确定的“避坑指南”。
3. 激活机制
当你对 Agent 说“把我的应用界面实现全屏显示”时,CLI 会通过关键词匹配发现 edge-to-edge 技能,并将该技能的上下文注入模型。这避免了模型在启动时“背诵”全量知识,真正做到了按需取用。
四、 Knowledge Base:对抗知识的“半衰期”
LLM 的训练数据总是有截止日期的,但 Android 的库更新是以周为单位的。Android Knowledge Base 解决了“模型知识过时”的问题。
通过 android docs search 和 android docs fetch 命令,Agent 可以实时检索官方最新的文档片段。
-
RAG 的官方化: 这本质上是 Google 提供了一个官方维护、高质量分块的 RAG(检索增强生成)数据源。
-
权威对齐: 当 Agent 在决策“该用哪个库”时,它会优先参考 Knowledge Base 中的最新推荐,而不是训练数据里的旧方案。
五、 实战演练:一个 Agent 工作流的诞生
想象一下,你让一个支持 Android CLI 的 Agent(如 Claude Code 或 Gemini CLI)完成以下任务:“创建一个 API 35 的 Compose 项目,并适配全屏显示。”
-
发现与环境: Agent 调用
android sdk list检查 API 35 是否安装。如果没有,调用android sdk install。 -
创建项目: 调用
android create --name="MyBestApp" --output="./my-app"。 -
加载技能: Agent 识别到“适配全屏”需求,通过
android skills add edge-to-edge获取最佳实践。 -
编写与运行: Agent 根据 Skill 指引修改代码,然后调用
android emulator start和android run部署应用。 -
验证: Agent 调用
android layout检查布局高度是否填满了屏幕像素,确保适配成功。
官方数据显示,这种模式下 Token 消耗降低了 70%,任务完成速度提升了 3 倍。
六、 开发者该如何准备?
作为 Android 开发者,我们正处于从“代码编写者”向“Agent 编排者”转型的关键时刻。
1. 拥抱 CLI 环境
如果你习惯于只在 Android Studio 里点点点,现在是时候熟悉终端了。安装 Android CLI,尝试用命令去管理你的 SDK 和模拟器。
2. 沉淀团队的 Skills
不要只依赖 Google 官方的 Skills。每个团队都有自己的架构规范(如自定义的 BaseViewModel、特定的代码风格)。你可以参照 SKILL.md 的标准,将团队的规范写成 Skill。
-
将 Skill 放在项目的
.skills/目录下。 -
定义清晰的 YAML 元数据。
-
这不仅能让 AI 更好用,也是最好的“新人入职文档”。
3. 关注分布式开发环境
这次发布传递出的一个强烈信号是:Android 开发正在脱离“单一 IDE”的束缚。 无论是在云端、第三方 Agent 还是定制化脚本中,高质量的 Android 开发能力正在变得无处不在。
结语
Google 的这一套组合拳,本质上是在做一件极其枯燥但正确的事情:清理工地的乱石,铺好标准的轨道。
当工程动作被接口化(CLI),当工作流被规范化(Skills),当最新知识被检索化(Knowledge Base),Agent 才真正具备了生产力。我们不再需要模型去“猜”怎么开发 Android,而是让它作为一名专家,熟练地操作这套官方提供的精密仪。
Android 开发的 Agent 时代,今天才真正拉开帷幕。
参考资料:
-
Android CLI 官方文档 (2026.04)
-
Android Skills GitHub Repository
-
Agent Skills Open Standard (agentskills.io)
作者:Li Caijun
专注 Android 新科技
如果本文让你对Android CLI有了新的认识,欢迎在评论区交流,点赞收藏不迷路!
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)