上一篇文章里,我提出一个判断:工业软件的困境,本质是构建方式的结构性问题。要从“项目式开发”走向“机理驱动的能力构建模式”,关键在于建立一套以SECP(结构、事件、配置、流程)为核心的底层范式。

与上述情况极为相似,一个更现实、也更紧迫的问题浮现出来:工业AI,为什么也走进了同样的困境?

一、工业AI 现状:项目很多,产品很少

近几年,质量检测、预测性维护、工艺优化、能耗分析方向都有大量工业AI项目推进。

但一个明显的现象是:工业AI项目很多,真正的产品极少在某条产线试点时明明效果不错但换条产线,效果下降到另一个工厂则不得不重做。最后一个项目、一个模型、一次性投入始终做不成可持续的能力。

二、核心问题不在AI,而在泛化能力

很多人把问题归因到数据不够多、算法不够好、模型不够优。但最本质的问题其实是泛化能力不足

什么是泛化能力?简单说泛化能力决定了系统能不能在不同场景下持续有效。据此,工业AI可以清晰分成两类:

项目型AI不具备泛化能力,一换环境就失效。

产品型AI具备泛化能力,跨场景依然有效。

泛化能力的强弱,就是工业AI从项目走向产品的分水岭。

三、为什么泛化这么难?

回到上一篇文章的核心公式:App = f(S, E, C, P),工业系统的一切复杂性,都来自这四个维度的组合与变化。而SECP 并非凭空产生,每一个工业机理(Mechanism),都会在系统中留下特定的数据结构Data Shape),多个机理叠加,才形成了完整的SECP。

但大多数工业AI 项目,并没有从“Mechanism → Data Shape → SECP”这条路径建模,而是直接跳到了数据层,仅从海量数据中学习统计规律(Data Pattern)

四、Data Shape 与 Data Pattern本质不同

这里需要区分两个关键概念:

Data Shape(数据形态)由工业机理决定的结构化表达。它反映的是“工业世界由什么构成、如何组织”——比如设备之间的层级关系、事件的数据结构、配置的参数体系、流程的节点定义。

Data Pattern(数据模式)Data Shape 之上产生的统计规律。它反映的是“在特定场景下,数据呈现什么分布、什么趋势”——比如某台设备在某段时间内的振动阈值、某条产线在某段时间内的能耗曲线。

Data Shape 是稳定的,因为它来自机理Data Pattern 是变化的,因为它依赖具体场景。

用一个比喻:

  • Data Shape = 表格的语义化通用定义层级结构、数据类型、关联关系)

  • Data Pattern = 表格里填的数字(今天是多少、明天是多少)

大多数工业AI项目,只是直接去挖掘学“表格里的数字”,却没有去结合机理建模具备泛用性的数据语义和形态。一旦换了设备、换了产线,列定义变了,原来的数字规律大概率将失效。这就是泛化能力不足的根本原因。

举一个最简单的例子同样是“设备振动异常检测”:
如果只学 Data Pattern,模型学到的是:某台设备在某个时间段的振动数值分布
如果建模 Data Shape,系统理解的是:什么是设备、什么是振动事件、振动如何被采集、在什么工况下发生

前者换一台设备就失效,后者可以直接迁移,只需替换数据。

五、要做成产品,必须从Pattern 走向 Shape

SECP 的本质,正是对 Data Shape 的系统化表达:

S(Structure)定义工业实体的结构形态

E(Event)定义事件的数据形态

C(Configuration)定义配置的参数形态

P(Process)定义流程的节点形态

当用SECP 将 Data Shape 固定下来之后,变化不再作用在“模型”上,而是作用在“结构变量”上。

换设备 Structure 中的数据实例变化,但 Structure 的形态不变

换工艺 Process 中的节点实例变化,但 Process 的形态不变

换参数 Configuration 中的参数值变化,但 Configuration 的形态不变

模型结构不用重建,只需要调整实例数据从而提升泛化能力

六、从机理到能力:工业AI的关键跃迁

只停留在Data Shape 层还不够,真正的产品来自能力复用。在工程实践中,机理可以逐步转化为可复用的能力单元,最终沉淀为ABC(原子业务能力)。ABC与具体设备、数据、产品无关,只与机理及其数据形态的结构表达(SECP)绑定,同一个能力可在多场景复用,不同能力可自由组合。

ABC能力可以复用还有一个更深层的问题如何确保我们(即包括软件开发者,也包括工业人)对工业机理认知的准确、到位?机理从未变化,变化的只是我们对它的理解,以及我们能否把机理表达成结构!

这需要一套能够形成“结构闭环”的机制:

机理→ AI:用Data Shape(SECP)为AI建立结构边界,让模型在机理约束下学习,而不是在数据噪声中自由发挥。 

数据→ 机理认知:通过Data Pattern暴露机理尚未覆盖的区域,推动人类对机理的进一步理解,并逐步固化为新的结构表达。 

简单说:机理赋AI结构约束,数据反馈推动认知选迭代。

图片
标题 工业AI从项目走向产品的关键路径

七、工业AI的本质:不是模型,而是能力体系

这里有一个非常重要的认知转变:

维度

数据驱动的AI

机理驱动的AI

建模对象

Data Pattern

(运行中的统计规律)

Data Shape

(机理决定的数据形态

本质

把模型当成结果

把能力(ABC)当成结果

重点

拼精度

拼结构

依赖

依赖具体场景的数据分布

依赖稳定的机理结构

在上一篇中,我们已经给出:App = f(S, E, C, P)

工业软件,本质上是在既定结构之上的能力表达。进一步看,一个完整的工业场景,可以理解为:

Scenario = (S, E, C, P, G, R, A)

(G:目标,R:角色,A:自治程度)

在实际工程中,可以把问题理解为两种完全不同的能力,点击下方链接阅读全文:
陈刚直言 | 工业 AI 做不成产品,不在 AI,而在泛化能力

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐