陈刚直言 | 工业 AI 做不成产品,不在 AI,而在泛化能力
在上一篇文章里,我提出一个判断:工业软件的困境,本质是构建方式的结构性问题。要从“项目式开发”走向“机理驱动的能力构建模式”,关键在于建立一套以SECP(结构、事件、配置、流程)为核心的底层范式。
与上述情况极为相似,一个更现实、也更紧迫的问题浮现出来:工业AI,为什么也走进了同样的困境?
一、工业AI 现状:项目很多,产品很少
近几年,质量检测、预测性维护、工艺优化、能耗分析等方向都有大量工业AI项目推进。
但一个明显的现象是:工业AI项目很多,真正的产品极少,在某条产线试点时明明效果不错,但换条产线,效果下降,到另一个工厂则不得不重做。最后,一个项目、一个模型、一次性投入,始终做不成可持续的能力。
二、核心问题不在AI,而在泛化能力
很多人把问题归因到数据不够多、算法不够好、模型不够优。但最本质的问题其实是泛化能力不足。
什么是泛化能力?简单说,泛化能力决定了系统能不能在不同场景下持续有效。据此,工业AI可以清晰分成两类:
项目型AI:不具备泛化能力,一换环境就失效。
产品型AI:具备泛化能力,跨场景依然有效。
泛化能力的强弱,就是工业AI从项目走向产品的分水岭。
三、为什么泛化这么难?
回到上一篇文章的核心公式:App = f(S, E, C, P),工业系统的一切复杂性,都来自这四个维度的组合与变化。而SECP 并非凭空产生,每一个工业机理(Mechanism),都会在系统中留下特定的数据结构(Data Shape),多个机理叠加,才形成了完整的SECP。
但大多数工业AI 项目,并没有从“Mechanism → Data Shape → SECP”这条路径建模,而是直接跳到了数据层,仅从海量数据中学习统计规律(Data Pattern)。
四、Data Shape 与 Data Pattern的本质不同
这里需要区分两个关键概念:
Data Shape(数据形态):由工业机理决定的结构化表达。它反映的是“工业世界由什么构成、如何组织”——比如设备之间的层级关系、事件的数据结构、配置的参数体系、流程的节点定义。
Data Pattern(数据模式):在Data Shape 之上产生的统计规律。它反映的是“在特定场景下,数据呈现什么分布、什么趋势”——比如某台设备在某段时间内的振动阈值、某条产线在某段时间内的能耗曲线。
Data Shape 是稳定的,因为它来自机理;而Data Pattern 是变化的,因为它依赖具体场景。
用一个比喻:
-
Data Shape = 表格的语义化通用定义(层级结构、数据类型、关联关系)
-
Data Pattern = 表格里填的数字(今天是多少、明天是多少)
大多数工业AI项目,只是直接去挖掘学“表格里的数字”,却没有去结合机理建模具备泛用性的数据语义和形态。一旦换了设备、换了产线,列定义变了,原来的数字规律大概率将失效。这就是泛化能力不足的根本原因。
举一个最简单的例子,同样是“设备振动异常检测”:
如果只学 Data Pattern,模型学到的是:某台设备在某个时间段的振动数值分布。
如果建模 Data Shape,系统理解的是:什么是设备、什么是振动事件、振动如何被采集、在什么工况下发生。
前者换一台设备就失效,后者可以直接迁移,只需替换数据。
五、要做成产品,必须从Pattern 走向 Shape
SECP 的本质,正是对 Data Shape 的系统化表达:
S(Structure):定义工业实体的结构形态
E(Event):定义事件的数据形态
C(Configuration):定义配置的参数形态
P(Process):定义流程的节点形态
当用SECP 将 Data Shape 固定下来之后,变化不再作用在“模型”上,而是作用在“结构变量”上。
换设备→ Structure 中的数据实例变化,但 Structure 的形态不变
换工艺→ Process 中的节点实例变化,但 Process 的形态不变
换参数→ Configuration 中的参数值变化,但 Configuration 的形态不变
模型结构不用重建,只需要调整实例数据,从而提升泛化能力。
六、从机理到能力:工业AI的关键跃迁
只停留在Data Shape 层还不够,真正的产品来自能力复用。在工程实践中,机理可以逐步转化为可复用的能力单元,最终沉淀为ABC(原子业务能力)。ABC与具体设备、数据、产品无关,只与机理及其数据形态的结构表达(SECP)绑定,同一个能力可在多场景复用,不同能力可自由组合。
ABC让能力可以复用,但还有一个更深层的问题,如何确保我们(即包括软件开发者,也包括工业人)对工业机理认知的准确、到位?机理从未变化,变化的只是我们对它的理解,以及我们能否把机理表达成结构!
这需要一套能够形成“结构闭环”的机制:
机理→ AI:用Data Shape(SECP)为AI建立结构边界,让模型在机理约束下学习,而不是在数据噪声中自由发挥。
数据→ 机理认知:通过Data Pattern暴露机理尚未覆盖的区域,推动人类对机理的进一步理解,并逐步固化为新的结构表达。
简单说:机理赋AI结构约束,数据反馈推动认知选迭代。
七、工业AI的本质:不是模型,而是能力体系
这里有一个非常重要的认知转变:
|
维度 |
数据驱动的AI |
机理驱动的AI |
|
建模对象 |
Data Pattern (运行中的统计规律) |
Data Shape (机理决定的数据形态) |
|
本质 |
把模型当成结果 |
把能力(ABC)当成结果 |
|
重点 |
拼精度 |
拼结构 |
|
依赖 |
依赖具体场景的数据分布 |
依赖稳定的机理结构 |
在上一篇中,我们已经给出:App = f(S, E, C, P)
工业软件,本质上是在既定结构之上的能力表达。进一步看,一个完整的工业场景,可以理解为:
Scenario = (S, E, C, P, G, R, A)
(G:目标,R:角色,A:自治程度)
在实际工程中,可以把问题理解为两种完全不同的能力,点击下方链接阅读全文:
陈刚直言 | 工业 AI 做不成产品,不在 AI,而在泛化能力
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)