Spring AI Alibaba 1.x 系列【27】Nacos AI Agent 管理平台与 Skill Registry 发布详解
1. Nacos AI 能力
Nacos 自 3.0版本 起定位升级为一个易于构建 AI Agent 应用的动态服务发现、配置管理和 AI 智能体管理平台,为企业级 AI 应用提供统一的资源注册、发现与治理能力。
1.1 Agent 注册中心
Agent2Agent (A2A) 协议是由 Google 开发并捐赠给 Linux 基金会的一项开放标准,旨在实现 AI Agent 之间的无缝通信与协作,从而解决 multi-agent 数量增加时导致的运维、管理、部署成本过高的问题,实现像使用微服务一样使用 multi-agent 。
为了管理这些 Agent,Nacos 从3.1.0 版本开始,提供了 Agent 注册中心(A2A Registry),实现 Agent 的注册、发现、命名空间隔离、版本管理等功能。
创建 Agent 管理页面:

1.2 MCP 管理
1.2.1 手动注册和导入
支持在控制台手动注册、市场导入 MCP Server 服务:

1.2.2 自动注册与发现
支持通过使用 Spring AI Alibaba 框架或 Nacos MCP Wrapper Python 开发 MCP Server。MCP Server 启动后可动态注册至 Nacos 并纳入统一管理,具备以下能力:
MCP Server服务动态管理:通过MCP服务列表对服务信息进行增删改查- 描述动态生效:工具描述、参数定义等元信息支持运行时热更新,无需重启服务
MCP Server Tools动态开关:支持对MCP Server下的Tools在运行时动态开启/关闭,无需重启服务- 全链路集成:服务注册信息自动同步至
Nacos配置中心与服务发现模块,适配AI Agent调用需求
注册到 Nacos MCP Registry 中的服务,可通过 Spring AI Alibaba 框架或 Nacos MCP Router 实现发现与调用,也可对接 Higress 网关,完成全链路集成。

1.2.3 存量 API 转换 MCP
Nacos 能够通过与 Higress 等 AI 网关结合,在0 代码改动的前提下,将存量 API 转换为 MCP 服务。
本文档将说明如何在 Nacos 上将已注册的存量 API 声明为 MCP 服务,并通过 Higress 的协议转换能力实现 MCP Tools 调用。
1.2.4 MCP Router
Nacos MCP Router 是一个基于 MCP 官方 SDK 开发的标准 MCP Server,为 MCP Client 提供 MCP Server 的智能搜索、安装、代理等功能,极大简化了 MCP 服务的使用流程。
同时,Nacos MCP Router 与 Nacos MCP Registry 相结合,可实现 MCP Server 治理能力,例如 MCP Server 及工具的可见性控制、版本管理等。

1.2.5 Dify 发现 Nacos MCP 服务
Nacos MCP 插件支持将 Nacos 中注册的 SSE/Streamable Http 类型 MCP Server 服务,转化为 Dify 中的工具调用。
通过 Nacos MCP 插件,Dify 应用可以动态发现 Nacos 中的 SSE/Streamable Http 类型 MCP Server 服务。Nacos MCP 插件还可协助模型按需挑选并路由 MCP 服务,有效降低模型调用的 Token 消耗。
1.3 Skill 管理
Skill Registry 是 Nacos 提供的 Skill 管理中心,作为团队与组织的私有 Skill 仓库。它将 Skill 的存储、版本管理、安全审核与分发集中在同一平台,方便团队成员便捷地发现、安装与共享 Skill。
Nacos 从 3.2.0 版本开始提供 Skill 管理中心(Skill Registry),支持 Skill 的创建、版本管理、安全审核、发布及分发等能力。

1.4 Prompt 管理
Nacos 提供了 Prompt 全生命周期的统一管理能力:
- 集中存储:所有
Prompt资源统一托管,通过控制台即可查看全貌 - 环境隔离:通过命名空间实现开发、测试、生产环境的完全隔离,防止误操作影响生产环境
- 权限管控:细粒度的权限控制,确保只有授权人员可以修改关键配置
- 快速检索:支持按名称模糊搜索和标签筛选,在大量
Prompt中也能快速定位目标
当企业存在多个 AI 应用场景(涉及客服、营销、运营等多个部门)时,集中管理可以显著提升配置检索效率,大大降低配置错乱风险。

1.5 AgentSpec 管理
Nacos AgentSpec 管理是 Nacos 面向 AI Agent 规模化治理提供的智能体标准规范统一管控能力,用于对 Agent 的定义、元信息、能力边界、调用协议、依赖资源等进行标准化配置与集中管理,是 Nacos 构建企业级 AI 控制平面的核心模块之一。
通过 Nacos AgentSpec 管理,企业可实现跨团队、跨场景 AI Agent 定义标准化、配置可追溯、权限可管控,解决 Agent 混乱、版本不一致、调用不可控等问题,支撑企业级 Agent 规模化落地与统一治理。

1.6 Copilot AI
Nacos Copilot 是 Nacos 从 3.2.0版本 开始推出的内置 AI 辅助能力模块,基于 agentscope-java 接入大模型,将大模型能力深度集成到 Nacos 控制台中,为 AI 应用开发提供 Prompt与Skill全生命周期AI辅助。

2. Nacos Skill Registry 发布说明
本内容来源于 Nacos 官方博客
2.1 背景与前言
过去一年,团队内部围绕AI应用开发范式展开了持续讨论,核心聚焦于低代码平台与高代码框架的选型权衡:
- 低代码平台:以
Dify为典型代表,核心优势是门槛低、业务流程确定性高,可快速搭建基础AI应用,但灵活度受限,难以适配复杂、多变的业务场景; - 高代码框架:核心基于
ReAct结构,以LLM+Prompt+Tool为核心,由大模型自主决策执行任务,灵活度极强,能充分发挥AI的泛化推理能力,但存在幻觉问题突出、Prompt调试成本高、落地难度大等痛点。
这一选型困境,随着 Anthropic 推出 Skill 得到有效破解——Skill 成为低代码与高代码之间的关键平衡点:既保留了高代码框架的灵活度,又通过能力封装与边界约束,大幅提升 Agent 在特定任务上的执行确定性与可复用性,迅速被各企业用户广泛采纳。而年前 OpenClaw 的快速出圈,进一步推动了 Skill 生态的爆发,ClawHub、SkillHub 等公开 Skill 市场如雨后春笋般涌现,目前公开 Skill 规模已达数万级,生态仍在高速扩张。
然而,公开 Skill 市场的繁荣背后,隐藏着不容忽视的安全隐患。根据 Snyk 对 ClawHub 中 3984 个 Skill 的采样报告显示,存在安全缺陷的 Skill 占比高达 36.82%,其中 CRITICAL 级别安全问题占比 13.4%,凭证 Secret 泄漏、Prompt 注入等高危问题频发。这些安全隐患,不仅可能导致企业数据泄露、业务中断,更成为企业内部规模化落地 Agent 应用的重大阻碍,也凸显了 Skill 全生命周期安全管控的必要性。

2.2 企业落地 Skill 面临的核心挑战
结合内部团队交流及外部企业实践反馈,梳理出企业在内部落地 Skill(技能)时,核心面临四大相互耦合的挑战,无法通过单点能力解决,需依托平台化治理体系统筹应对:
-
安全挑战:
Skill落地过程中,恶意代码、已知漏洞、敏感信息外泄等风险持续存在,且缺乏完善的准入管控机制,无法在Skill接入初期有效排查安全隐患,易引发数据泄露、系统被攻击等问题。 -
权限挑战:
Skill相关的权限边界模糊,谁可见、谁可用、谁可修改、谁可发布的职责划分不清晰,越权访问、违规操作的风险难以防范,无法实现精细化权限管控。 -
稳定性挑战:
Skill版本管理混乱,存在版本冲突、升级不可控等问题,且出现异常时难以快速回滚,易影响业务连续性,无法保障Agent调用Skill时的稳定性。 -
治理挑战:缺乏完整的审计日志,
Skill全生命周期的操作无法追溯,追溯链条断裂,缺少合规所需的证据链,难以通过监管审查,不符合企业合规运营要求。
上述四类挑战相互关联、彼此耦合,并非单一环节的问题,无法依靠单点优化解决,必须搭建全面的平台化治理体系,实现 Skill 从准入、权限、版本到审计的全流程管控,才能突破企业落地 Skill 的核心瓶颈。
2.3 企业级 AI 资源治理平台
Nacos 3.2 推出的私有化 Skill Registry,面向企业生产场景,在 Agent 与 Skill 之间构建「验证后信任」的治理层,将 Skill 的审核、管理、分发与追溯统一纳管,形成完整的企业级 AI 资源控制闭环。

2.4 快速开始
MacOS/Linux :
curl -fsSL https://nacos.io/nacos-installer.sh | bash
Windows (PowerShell):
iwr -UseBasicParsing https://nacos.io/nacos-installer.ps1 | iex
脚本运行后会自动打开 Nacos 控制台:

终端执行 nacos-setup —help 及 nacos-cli —help 查看更多功能。
2.4.1 Skill 安全审核流水线
Nacos 3.2 内置开箱即用的安全审核插件,覆盖 10+ 项常用风险扫描,同时提供标准接口支持插件化扩展,满足企业定制化安全策略需求。
审核流程遵循「未通过,不发布」的准入原则,将安全要求从「文档规范」升级为「系统强约束」,彻底消除人为绕过风险。Skill 入库前必须经过可编排、可审计、可升级的审核流程,实现多维扫描、风险分级、审核决策的全流程管控。


2.4.2 多版本管理与灰度分发
版本生命周期管理:支持草稿(DRAFT)、审核中、灰度(GRAY)、正式(FORMAL)、下线等完整生命周期,每个阶段状态明确,版本不可变。
标签灰度放量:通过 dev/lastest/stable 等标签绑定版本,精准控制分发范围,支持逐步放量,降低新版本上线风险。
异常快速回滚:灰度阶段发现问题,切换标签映射即可实现秒级回滚,无需重新发版,保障业务稳定性。

2.4.3 权限模型与多层隔离
Nacos 3.2 采用三层边界设计,实现细粒度的权限管控:
RBAC角色权限:定义发布者、审核员、只读用户等角色,明确职责边界。- 命名空间隔离:隔离不同团队、环境与租户,防止越权访问。
Skill维度可见性:支持单Skill级别的公开、私有、指定范围开放配置,谁能看、谁能用、谁能改、谁能发,都有明确策略与责任归属。
2.4.4 全链路审计与追溯
Nacos 3.2 提供完整的审计能力,覆盖 Skill 全生命周期:
- 上传记录:谁在何时上传了哪个版本,来源可追溯
- 审核日志:谁审核、审核结论、审核时间全程留存
- 发布记录:谁发布、发布到哪些
Agent、发布策略存档 - 调用追溯:哪些
Agent调用了哪个版本,问题定位有据可查
只有审计闭环打通,运维、合规、治理才能真正形成体系,满足监管要求。
2.4.5 多途径 Skill 接入与分发
Nacos 3.2 提供多种灵活的 Skill 接入方式,满足不同场景下的获取和安装需求:
Agent自主发现CLI一键安装Shell脚本批量拉取
Nacos 提供引导 Skill,Agent 可通过以下命令自动发现可用能力:
curl -s https://download.nacos.io/SKILL.md
执行后将展示 Skill 安装指南及列表查询方法,帮助 Agent 快速定位和获取所需能力。
通过 nacos-cli 工具实现 Skill 的快速下载与安装,支持从 Registry 直接拉取并本地部署。
# 列出所有可用 Skills
nacos-cli skill-list
# 按名称过滤查询
nacos-cli skill-list --name mysql-query --page 1 --size 20
# 下载指定 Skill 到本地
nacos-cli skill-get mysql-query -o ~/.skills
详细指令参考 Nacos CLI 文档。
支持通过 skills.sh 脚本链接 Nacos Registry 批量获取 Skills,适用于自动化部署和 CI/CD 场景。
# 配置 Nacos Registry 地址
export SKILLS_API_URL=http://${nacos.host}:9080
# 使用 npx 执行 skill 命令安装
npx skills add mysql-query redis-query
2.5 开放架构:插件化企业定制扩展

2.6 多Agent协作生态:构建企业私有 AI 管理平台
Nacos 3.2 作为底层基础设施,与 HiClaw(Agent 执行层)、HiMarket(私有化市场层)形成完整的企业私有 AI 管理平台生态:
HiClaw:Agent运行时,消费Skill、Prompt、AgentSpec资源HiMarket:基于Nacos定制的私有化Skill市场 +Worker市场Nacos:统一AI资源管理(Prompt、Skill、MCP、AgentCard)、治理与插件化扩展
去年9月份,我们畅想了配置驱动的 Agent 网络架构,如今,Nacos + HiMarket + HiClaw 已将这一架构畅想变为现实。
2.7 迈向多 Agent 架构网络的协作中枢
Nacos 3.2 是一个起点,完成了全面拥抱AI时代的第一步。

我们期望未来Nacos成为企业AI时代的资源治理基础设施一部分,成为多Agent架构网络的协作中枢:
- 统一资源控制平面:整合四大注册中心,统一身份、权限、版本与分发策略,形成企业级一致入口。
- 治理能力持续深化:增强审核、灰度、审计与回滚能力,让每次资源变更可验证、可追溯、可止损。
- 场景化智能推荐:基于场景做
AI资源推荐,支持AgentSpec自动化组装,降低Agent构建门槛。 - 多
Agent协作中枢:在AgentSpec之上构建Agent Team Spec,形成基础AI资源+单Agent组装编排+多Agent协作网络构建体系;基于OT协议集成Agent运行时数据,升级Nacos Copilot实现智能数据分析,实现多Agent协作安全可控地自我进化。

2.8 后续版本规划
为实现上述目标,Nacos结合社区反馈与路线图规划,AI Registry将在后续版本中持续演进:
AI资源生命周期管理:引入活跃度检测机制,实现热数据启动加载、冷数据按需延迟加载及自动下线,优化资源占用。- 数据智能层:基于
OT协议集成Tracing数据,构建无本地存储的Copilot智能分析能力,实现AI资源运行态可观测。 - 全链路审计追溯:补齐
AI资源操作的完整审计日志与全链路追溯能力,满足企业合规要求。 - 语义智能检索:基于向量数据库与大模型实现自然语言搜索、
AgentSpec自动化组装与智能路由。 - 多协议适配与开放生态:除适配
A2A Protocol 1.0.0版本外,还将探索ACP、Matrix等主流Agent通信协议的对接,支持AgentCard字段规范演进与跨平台Agent互操作,构建开放的Agent协作生态。 Coding Agent插件:分阶段演进Coding Agent能力,从Markdown指令到MCP协议支持,最终提供原生远程MCP端点,实现在Claude Code、Cursor等工具中直接操作Nacos资源。
2.9 结语
Nacos在过去8年中成为微服务时代的基础设施之一,收获了开源社区开发者的广泛支持。我们希望Nacos在AI时代也能与大家结伴同行、共同成长。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐
所有评论(0)