最近获取的信息太多,抽空思考了下,觉得有必要扩大一些视角,从整体再看看近期 AI 发展的热点及背后的逻辑。所以整理本文。这些文章更多是自我学习的一个沉淀和思考。


为什么 AI 产业正在从 模型竞争 转向 Agent OS 竞争 。理解这一点,可以更清晰地看到 Skill、MCP、Generative UI 为什么会同时出现,并成为下一代 AI 平台的核心。

在这个体系中:

• Skill 是能力模块

• MCP 是连接协议

• Agent OS 是调度系统

• Generative UI 是交互界面

它们共同构成下一代 AI 软件平台。AI 技术正在从Model-centric AI 转向 Agent-centric AI,再进一步发展为 AI Operating System。

未来的 AI 应用市场,本质不是 App Store,而是 Skill + Agent OS + 协议的组合。也就是说:不是 用户选App 而是 Agent 自动组合 Skill 。

Agent OS

为什么在 AI 时代,真正的控制点在“协议层”,而不是模型层?这件事的本质,其实可以用一条非常清晰的技术—商业演化链路来解释。

过去十年,AI 技术竞争几乎全部集中在模型层:Application → Model → Compute,谁拥有更大的模型、更多的数据和算力,谁就占优势。

但随着大模型能力逐渐趋同,技术栈开始发生变化:Application → Agent OS → Model→ Compute,模型仍然重要,但系统控制权开始向 Agent OS 层转移。

同时模型层的优势也在逐渐缩小大模型领域的技术扩散非常快,例如 Transformer、RLHF、LoRA、MoE这些技术几乎在 6-12 个月内就会被整个行业采用;开源模型正在缩小差距,很多应用层能力已经不再依赖单一闭源模型;现代 AI 系统越来越多采用:multi-model system,很多应用层能力已经不再依赖单一闭源模型。

当模型变得类似时,真正的竞争点就变成:谁控制 AI 系统的运行环境,也就是Agent OS。Agent OS 的核心职责包括:任务规划、Skill 调度、Tool 调用、状态管理、上下文管理、多 Agent 协作,它本质上是 AI 的运行平台。

Skill 是 AI 生态的应用

AI 正在从会回答问题 转向 能完成任务 ,而 Skill 正是这一转变的核心载体。

随着 AI 从聊天机器人(Chatbot)向行动型智能体(AI Agents)演进,系统能力的边界正在发生根本变化。AI 不再只是进行语言交互,而需要具备与现实系统交互、执行复杂任务、调用外部服务、进行多步规划的能力。在这一背景下,AI Skill 可以定义为一种可被调用、组合和调度的任务能力模块,使大模型能够将抽象推理能力转化为具体行动。

这标志着 AI 系统正在经历一条清晰的能力演进路径:知识型 AI → 推理型 AI → 行动型 AI。进一步地,随着 Skill 的标准化与模块化,它很可能演化为一种新的平台生态形态,类似于App Store → Skill Store。

在这一体系中,AI 平台将逐步具备Skill Marketplace(技能市场)、Skill Registry(技能注册与发现机制) 、Skill 插件系统(可扩展能力模块)。这一生态成立的前提,是接口层的标准化。当类似Model Context Protocol这样的协议逐步统一之后,会形成一条关键链路:标准化接口→ Skill 可复用→ Skill 可组合→ Skill 可交易。在这个条件下,Skill Marketplace 将自然出现,其底层逻辑与移动互联网时代的 App Store 本质一致。

因此,未来 AI 平台的竞争焦点将不再仅仅是模型能力,而是Skill 生态能力。具体来说,核心竞争力将体现在能否高效管理 Skill、能否灵活组合 Skill、能否稳定调度 Skill。也就是说谁能够更高效地组织和调度 Skill,谁就拥有更强的 AI 系统能力。

这一变化同样正在重塑 AI 模型的评估体系。过去评估主要关注知识储备,例如MMLU;随后转向推理能力,例如GSM8K;而现在评估重点正在进一步转向行动能力(Action Capability),例如AgentBench。这类评估不仅关注模型输出是否正确,还会考察多步骤任务执行能力、工具调用的准确性与稳定性、在真实或半真实环境中的操作能力。

MCP:Skill 生态的基础协议

Skill 要运行,就必须连接各种系统。例如:GitHub、Slack、Notion、企业数据库,为了统一连接方式,出现了Model Context Protocol。MCP 的目标是为 AI 模型提供统一的工具和数据访问协议。

在 AI 时代,模型决定能力上限,但协议决定生态控制权。换句话说,模型 = 引擎 ;协议 = 交通规则 + 路网。谁造出更好的引擎不一定赢,但谁控制路怎么走,谁就控制整个系统。

我们看三个经典技术周期,无不印证了这个发展路径:

1、 互联网时代,关键协议是 HTTP

浏览器可以访问任何网站→ 网站爆发→ Web 生态形成;真正的控制点不是浏览器,而是:HTTP + URL

2、 移动互联网时代,关键协议(广义)是 iOS / Android API 标准

开发者 → 写一次 App → 分发到平台;控制点是操作系统(不是芯片、不是单个 App)

3、 云计算时代,关键接口 API / SDK

控制点是 AWS / Azure / GCP,谁定义调用方式→ 谁控制开发者→ 谁控制生态。

4、 现在映射到 AI,关键协议(可能)是 MCP

过去:人 → 点击 UI → 调用 API 现在:AI → 调用 Skill → 调用 Tool

调用者从人变成AI,会引发一系列新问题:AI 如何理解世界?AI 如何调用工具?AI 如何访问数据?未来这可能都是协议层(MCP 等)来控制。

Generative UI:Agent OS 的交互层

当 AI 可以执行任务时,传统 UI 会变得非常僵硬。例如传统软件:固定界面→ 用户操作→ 软件执行

Agent 系统:用户目标→ AI 规划任务→ 动态生成界面,这就是 Generative UI。

例如当 AI 规划旅行时,系统可能自动生成: 航班比较界面、酒店地图、行程表。这些界面不是预先设计的,而是 AI 根据任务生成。因此Generative UI 是 Agent OS 的交互层。

Gen UI 在前面有讲过,此处就略过。

AI 巨头的布局

OpenAI

在做:ChatGPT → Agent OS + Skill 平台

OpenAI通过ChatGPT逐渐增加: 工具调用、应用连接、Agent 能力

Google

在做:Gemini + Workspace → AI OS

Google 通过 Gemini,整合:Workspace、搜索、Android

Microsoft

在做:Copilot → OS级 Agent

Microsoft 将 Agent 系统整合到:Windows、 Office、Azure

Anthropic

在做:Claude + MCP → 协议层控制

Anthropic通过 Claude 重点发展:安全 Agent、工具调用能力

当然国内的大厂也在积极布局,从 Agent OS 、Skill 平台建设的路径来看,跟国外的巨头方向一致。但是在 MCP 层,未来可能会存在不同的发展路径。

未来 AI 平台的结构

未来的 AI 平台可能长这样:Users → Generative UI → Agent OS → Skill Ecosystem → Tools / APIs → Real World Systems 。模型只是其中一层Model Layer,而真正的系统控制权在Agent OS。而核心资产可能是:Skill 生态、Agent OS、用户数据与上下文,而不是单纯的大模型。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐