陈刚直言 | 工业 AI 做不成产品，不在 AI，而在泛化能力

陈刚直言

496人浏览 · 2026-05-26 16:22:45

陈刚直言 · 2026-05-26 16:22:45 发布

在上一篇文章里，我提出一个判断：工业软件的困境，本质是构建方式的结构性问题。要从“项目式开发”走向“机理驱动的能力构建模式”，关键在于建立一套以SECP（结构、事件、配置、流程）为核心的底层范式。

与上述情况极为相似，一个更现实、也更紧迫的问题浮现出来：工业AI，为什么也走进了同样的困境？

一、工业AI 现状：项目很多，产品很少

近几年，质量检测、预测性维护、工艺优化、能耗分析等方向都有大量工业AI项目推进。

但一个明显的现象是：工业AI项目很多，真正的产品极少，在某条产线试点时明明效果不错，但换条产线，效果下降，到另一个工厂则不得不重做。最后，一个项目、一个模型、一次性投入，始终做不成可持续的能力。

二、核心问题不在AI，而在泛化能力

很多人把问题归因到数据不够多、算法不够好、模型不够优。但最本质的问题其实是泛化能力不足。

什么是泛化能力？简单说，泛化能力决定了系统能不能在不同场景下持续有效。据此，工业AI可以清晰分成两类：

项目型AI：不具备泛化能力，一换环境就失效。

产品型AI：具备泛化能力，跨场景依然有效。

泛化能力的强弱，就是工业AI从项目走向产品的分水岭。

三、为什么泛化这么难？

回到上一篇文章的核心公式：App = f(S, E, C, P)，工业系统的一切复杂性，都来自这四个维度的组合与变化。而SECP 并非凭空产生，每一个工业机理（Mechanism），都会在系统中留下特定的数据结构（Data Shape），多个机理叠加，才形成了完整的SECP。

但大多数工业AI 项目，并没有从“Mechanism → Data Shape → SECP”这条路径建模，而是直接跳到了数据层，仅从海量数据中学习统计规律（Data Pattern）。

四、Data Shape 与 Data Pattern的本质不同

这里需要区分两个关键概念：

Data Shape（数据形态）：由工业机理决定的结构化表达。它反映的是“工业世界由什么构成、如何组织”——比如设备之间的层级关系、事件的数据结构、配置的参数体系、流程的节点定义。

Data Pattern（数据模式）：在Data Shape 之上产生的统计规律。它反映的是“在特定场景下，数据呈现什么分布、什么趋势”——比如某台设备在某段时间内的振动阈值、某条产线在某段时间内的能耗曲线。

Data Shape 是稳定的，因为它来自机理；而Data Pattern 是变化的，因为它依赖具体场景。

用一个比喻：

Data Shape = 表格的语义化通用定义（层级结构、数据类型、关联关系）
Data Pattern = 表格里填的数字（今天是多少、明天是多少）

大多数工业AI项目，只是直接去挖掘学“表格里的数字”，却没有去结合机理建模具备泛用性的数据语义和形态。一旦换了设备、换了产线，列定义变了，原来的数字规律大概率将失效。这就是泛化能力不足的根本原因。

举一个最简单的例子，同样是“设备振动异常检测”：
如果只学 Data Pattern，模型学到的是：某台设备在某个时间段的振动数值分布。
如果建模 Data Shape，系统理解的是：什么是设备、什么是振动事件、振动如何被采集、在什么工况下发生。

前者换一台设备就失效，后者可以直接迁移，只需替换数据。

五、要做成产品，必须从Pattern 走向 Shape

SECP 的本质，正是对 Data Shape 的系统化表达：

S（Structure）：定义工业实体的结构形态

E（Event）：定义事件的数据形态

C（Configuration）：定义配置的参数形态

P（Process）：定义流程的节点形态

当用SECP 将 Data Shape 固定下来之后，变化不再作用在“模型”上，而是作用在“结构变量”上。

换设备→ Structure 中的数据实例变化，但 Structure 的形态不变

换工艺→ Process 中的节点实例变化，但 Process 的形态不变

换参数→ Configuration 中的参数值变化，但 Configuration 的形态不变

模型结构不用重建，只需要调整实例数据，从而提升泛化能力。

六、从机理到能力：工业AI的关键跃迁

只停留在Data Shape 层还不够，真正的产品来自能力复用。在工程实践中，机理可以逐步转化为可复用的能力单元，最终沉淀为ABC（原子业务能力）。ABC与具体设备、数据、产品无关，只与机理及其数据形态的结构表达（SECP）绑定，同一个能力可在多场景复用，不同能力可自由组合。

ABC让能力可以复用，但还有一个更深层的问题，如何确保我们（即包括软件开发者，也包括工业人）对工业机理认知的准确、到位？机理从未变化，变化的只是我们对它的理解，以及我们能否把机理表达成结构！

这需要一套能够形成“结构闭环”的机制：

机理→ AI：用Data Shape（SECP）为AI建立结构边界，让模型在机理约束下学习，而不是在数据噪声中自由发挥。

数据→ 机理认知：通过Data Pattern暴露机理尚未覆盖的区域，推动人类对机理的进一步理解，并逐步固化为新的结构表达。

简单说：机理赋AI结构约束，数据反馈推动认知选迭代。

七、工业AI的本质：不是模型，而是能力体系

这里有一个非常重要的认知转变：

维度	数据驱动的AI	机理驱动的AI
建模对象	Data Pattern （运行中的统计规律）	Data Shape （机理决定的数据形态）
本质	把模型当成结果	把能力（ABC）当成结果
重点	拼精度	拼结构
依赖	依赖具体场景的数据分布	依赖稳定的机理结构

在上一篇中，我们已经给出：App = f(S, E, C, P)

工业软件，本质上是在既定结构之上的能力表达。进一步看，一个完整的工业场景，可以理解为：

Scenario = (S, E, C, P, G, R, A)

（G：目标，R：角色，A：自治程度）

在实际工程中，可以把问题理解为两种完全不同的能力，点击下方链接阅读全文：
陈刚直言 | 工业 AI 做不成产品，不在 AI，而在泛化能力

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

一个GitHub Issue就能投毒Claude Code？我拆解了整条供应链攻击链

上周Claude Code刚被AMD AI负责人用23万次调用记录实锤"越更新越差"[1]，这周它的GitHub Actions又被安全研究者扒出了一个供应链级别的漏洞——一个恶意GitHub Issue，就能让Claude Code帮你把仓库Secret全偷走，甚至往你的代码里投毒[2]。这个漏洞有多严重？CVSS v4.0评分7.8，Anthropic为此支付了4800美元赏金。更可怕的是，A