摘要

企业级 AI 的落地重心,已经落到数据使用能力。数据入口分散、多源异构、治理断层和多模协同,共同推动了一种新的基础设施形态的出现。数据访问控制平面提供的,并非一组松散能力,而是一套完整的中间层秩序:标准接入负责统一入口,联邦执行负责跨源运行,安全治理负责生产边界,多模融合负责长期演进。

一、企业级 AI 正在逼近数据体系的真实边界

每一轮技术革命都会经历相似的路径:先出现新的交互入口,随后原有基础设施被迫重组。

大模型进入企业环境之后,这条路径再次清晰显现。最初吸引注意力的,是自然语言交互、内容生成和推理能力。随着模型逐步进入业务流程,它的角色也迅速变化。模型开始理解业务上下文,开始参与流程,开始连接工具,开始调用数据。它从一个对话工具,逐步演变为企业系统中的新型访问主体。到了这个阶段,模型带来的问题已经不再局限于应用界面和用户体验,而是直达企业软件最深处的基础设施层。

企业数据从来没有以单一、整齐、同质的形态存在。交易库保存实时状态,分析库服务离线洞察,数仓和湖仓承担整合计算,文档系统沉淀知识材料,向量库支撑语义检索,图库维护关联关系,对象存储容纳大量非结构化信息。不同系统有不同协议、不同权限、不同更新方式,也有不同的数据语义。对人类使用者来说,这些差异可以依靠经验、制度和流程去弥合;对模型来说,这些差异一旦直接暴露在调用层,就会迅速变成执行难题与治理风险。

所以,生产级 AI 的关键问题已经发生转移。模型能力持续提升,认知层面的障碍正在快速下降;数据接入、执行控制和治理秩序的缺口,却在规模化应用中越来越醒目。模型扩展了智能边界,企业系统需要同步重建一层新的中间秩序,去承接模型参与之后的数据访问与运行责任。

这个问题的本质,不在“模型能不能工作”,而在“系统能不能长期运行”。前者依赖模型能力,后者依赖基础设施能力。企业级 AI 的下一阶段,终究会落到基础设施的组织能力上。

二、数据访问控制平面的提出

沿着企业智能化落地的现实路径观察,一种新的基础设施轮廓已经逐渐成形。

模型与企业数据之间,需要一层统一中间层:向上承接模型和应用的标准调用,向下连接多种异构数据系统,在中间完成接入控制、执行协调、治理闭环和多模协同。这一层,可以准确地定义为数据访问控制平面。

它对应的不是单点工具,不是某一种数据库能力的伸展,也不是几项技术名词的组合包装。它是一套组织方式,一套面向生产环境的运行秩序,一套重新定义企业数据调用关系的基础设施逻辑。没有这层平面,模型面对的将始终是一组彼此分离的数据孤岛;有了这层平面,模型面对的才是一套可以长期运行、可治理、可扩展、可持续演进的数据能力体系。

从工程角度看,控制平面通常承接协议代理、驱动等多种接入形态,提供统一解析、联邦计划、异构连接器、权限控制、敏感数据处理、审计监测、可观测和弹性运维等能力。它的存在,不是为了替代已有数据库,也不是为了否定既有数据平台,而是为了在现有体系之上建立一层新的协调机制,使模型参与之后的数据链路重新获得秩序。

控制平面的能力很多,真正构成其骨架的,主要有四项:标准接入、联邦执行、安全治理与多模融合。这四项能力并列存在,彼此支撑,共同定义了 AI 时代企业数据基础设施的新形态。

三、控制平面的四项核心能力

1. 标准接入

企业 AI 一旦进入规模化阶段,最先暴露的问题通常是入口碎片化。

如果每一种数据库、每一类数据系统都分别建设一套模型接口,企业最终维护的只会是一组分散适配器。入口一旦分散,平台能力就无法形成。能力边界难以定义,授权口径难以统一,运维方式难以收敛,后续扩展不断依赖局部适配。随着接入对象增多,系统很快会从“灵活”滑向“脆弱”。

MCP 的意义,正是在这一背景下被放大。它为模型访问数据和工具提供了标准化基础。协议的价值,不只是“可以连接”,更在于“可以沉淀”。但协议基础只有建立在统一入口之上,才会真正转化为平台能力。否则,MCP 仍然会退化成逐库适配、逐点治理的分散体系。

标准接入承担的核心任务,是把复杂性收拢在基础设施内部。上层模型和应用看到的,应当是稳定、统一、可复用的调用方式;底层数据系统可以继续保持各自差异,由中间层完成连接、适配、映射和编排。入口收拢之后,平台能力才有形成的基础,后续执行和治理也才有统一落点。

2. 联邦执行

统一入口解决的是接入秩序,统一执行解决的是运行秩序。

企业数据场景真正复杂的地方,在于跨源访问。订单数据、画像数据、知识材料、语义索引、关系图谱和历史归档通常分布在不同系统中。一个业务问题要形成完整答案,往往需要跨多个系统联合取数。单一数据库中的查询可以交给数据库内核处理;跨多个系统的请求,则需要统一执行层来承担查询拆解、路由规划、能力下推和结果归并。

一旦这一层缺位,复杂性就会向上游蔓延。模型会承担本不该承担的执行责任,应用层会堆积大量手工编排逻辑,企业还可能为了绕开统一执行而依赖高成本的数据复制体系。表面上,任务依旧完成了;从长期运行看,系统的可维护性、可扩展性和可审计性都会受到削弱。

联邦执行的价值,在于为多源异构场景建立统一秩序。它既不用重建一个大而全的数据中心,也不用在真正执行前进行全量数据搬迁,而是在既有系统基础上,为跨源访问提供稳定的执行机制。数据依旧分布在原有位置,执行逻辑被收敛到控制平面内部。由此,复杂性不会继续向模型和应用扩散,基础设施重新获得对跨源访问的组织能力。

3. 安全治理

企业级 AI 的落地成败,最终要落到访问和执行边界上。

数据进入大模型链路之后,系统关注点自然会发生变化。访问主体是否可信,权限范围是否清楚,敏感字段是否需要处理,执行过程是否能够留痕,异常行为能否被识别,风险事件如何处置,这些问题都会直接决定系统能否进入真实生产。只要治理能力仍然散落在外围网关、业务系统和线下流程中,链路就一定存在断点,责任也难以真正闭合。

安全治理进入控制平面之后,至少需要承接六类能力:主体识别与身份映射、权限边界控制、敏感数据保护、全链路审计、运行监测与风险处置、合规支撑。关键不在于这些功能是否存在,而在于它们是否位于访问链路的正确位置。如果将治理置于系统外围,系统只能偏向事后补救;因此将治理动作融入主链路,访问动作才会从一开始就被纳入秩序之中。

AI 场景中的治理要求比传统应用更高。模型的泛化能力更强,调用深度更深,覆盖范围更广,链路中的每一个治理缺口都会被迅速放大。到了这一阶段,治理已经成为生产成立的制度前提。访问必须可控,调用必须有界,结果必须可追溯。

4. 多模融合

AI 应用的发展方向,已经明确指向多模数据协同。

关系数据承担交易与主数据,文档承载知识与内容,向量支持语义检索,图结构表达关联与路径,搜索系统承担快速召回,对象存储容纳大规模非结构化信息。这些数据形态正在共同进入业务流程,构成新一代智能系统的事实基础。企业的数据基础设施因此不能继续只围绕单一数据库类型组织。

现实挑战同样清楚。存量企业很难承受一次性全面迁移到全新多模数据库体系的成本和风险。继续停留在单一数据范式之中,又难以支撑新的智能应用。更可行的路线,是通过统一中间层把既有数据库体系与新增多模能力连接起来,通过统一访问层完成语义收敛、能力编排和运行协同。

多模融合的现实含义,在于让新能力进入旧体系,让旧体系继续支撑新场景。企业需要的是持续演进的能力框架,不是一次性替换架构的冲动。控制平面为这种渐进式演进提供了承载面,也使多模能力的引入具备了现实路径。

四、控制平面的技术落点与中间件位置

控制平面并不是漂浮在概念层面的抽象表达,它有非常明确的技术落点。

从内部结构看,控制平面通常包括接入层、语义与解析层、执行层、治理层、融合层以及平台能力层。接入层负责承接 MCP、代理、驱动等多种入口形式;语义与解析层负责统一请求描述、方言解析和能力映射;执行层负责联邦计划、优化、下推与结果归并;治理层负责身份、权限、脱敏、审计与风险控制;融合层负责连接关系、文档、向量、图、搜索和对象存储等多类系统;平台层则支撑可观测、自动化运维、弹性扩展和高可用能力。

从架构位置判断,这层能力天然适合承载在中间件层。数据库层过于分散,应用层过于重复,只有中间件层同时具备统一接入、统一执行和统一治理的可能性。中间件位于模型、应用和数据库之间,既能够理解上层调用语义,也能够组织下层异构能力,因此最适合成为数据访问控制平面的承载位置。

Apache ShardingSphere 长期围绕解析、路由、执行、治理和多种接入形态演进,这一路径本身说明,中间件在 AI 时代的地位并未削弱。模型能力向前推进一步,基础设施秩序也必须同步重建一步。两者结合之后,企业级智能系统才具备进入真实生产的条件。

五、结语

企业级 AI 的竞争,已经进入基础设施阶段。

未来决定生产化深度的,既包括模型能力,也包括企业能否建立统一、稳定、可治理、可持续演进的数据访问控制平面。模型带来了新的智能入口,控制平面则决定这种智能入口能否真正进入企业软件的主链路,能否形成稳定运行的生产秩序,能否沉淀为下一代企业系统的共同底座。

每一轮重要技术变革,最终都会落到基础设施重写。数据库、网络、操作系统、云平台,都曾在各自时代完成过这样的重写。今天,随着模型深入企业流程,数据访问控制平面开始承担同样的历史角色。它组织的并不只是一次调用、一条链路或一个系统,它组织的是模型与数据之间的新关系,是企业软件在智能时代的新秩序,也是未来产业分工重新稳定下来的基础界面。

当模型从能力中心走向生产中心,控制平面就会从架构选择上升为时代命题。真正能够走得远的企业级 AI,最终都要在这层基础设施上完成定型。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐