1,本体论架构

【本体论】解决了困扰企业数字化转型的根本问题:如何让散落在各个系统中的数据真正"说同一种语言"?如何让AI不仅能处理数据,还能理解数据的含义?如何让人类的决策经验变成系统可以学习的知识?

【第一层:数据源碎片化整合】企业内部系统割裂(不互通)导致的数据不兼容(DB、Excel、MD),使得数据整合成本极高,严重拖慢了管理决策的响应速度,导致数据资产无法实时转化为商业洞察。

  • 统一语义映射:屏蔽底层技术栈的复杂性,消除语义歧义,将分散在各系统中的不同代称,还原为业务逻辑中统一的唯一标识符,从而实现跨系统的数据互认。
  • 双向实时同步:当源系统的数据更新时,本体论中对应的对象也会自动更新。更重要的是,当用户通过本体论对数据进行修改(比如批准一个采购申请)时,这个变更会回写到源系统,保证数据的一致性。

【第二层:数据孪生的双重结构】本体论的核心层由两个相互依存的部分构成:语义层和动力层。

  • 语义层(定义是什么):这个企业由哪些"事物"构成?它们有什么特征?它们之间有什么关系?
    • 对象类型:语义层的基础单元。如员工、机器设备、订单代表真实世界中的实体。
    • 属性:对象的特性。如姓名、角色、部门。每个属性都有明确的数据类型,比如字符串、数字、日期、布尔值等。
    • 链接类型:对象之间的关系。用户-关注-另一个用户,图书-借阅者-读者,英雄角色-手持-宝剑。通过这些链接,本体论构建起一张复杂的知识图谱当你查看一个订单时,可以沿着链接追溯到下单客户、负责的销售员、生产该订单的工厂、使用的原材料、涉及的供应商,形成一张完整的关系网络。
  • 动力层(定义能做什么):语义层定义企业的静态结构,动力层定义动态行为。
    • 动作类型:不是 CRUD,而是明确的动作,这些动作不是在本体论内部闭环,而是会回写到源系统如批准采购申请(修改订单对象的状态属性,同时触发财务系统付款流程),修改员工角色(更新员工对象,同时触发权限系统重新计算,更新员工可访问数据范围)。
    • 函数:定义任意复杂度的业务逻辑和计算,输入是本体论中对象和属性,输出是新的计算属性、推荐决策、风险评分等。可以是简单的计算(如订单总额 = 单价 × 数量),也可以是复杂的机器学习模型(如设备故障预测、供应链优化路径)。
  • 接口层(多态与 AI 集成):语义层和动力层之间是一个关键的接口层。
    • 对象类型多态:像面向对象编程中的继承和多态,如果定义了一个Vehicle(交通工具)类型,那么Car(汽车)、Truck(卡车)、Plane(飞机)都可以是Vehicle的子类型。
    • AI 模型的无缝集成:机器学习模型的输出,可以直接映射为对象的属性。比如,一个设备故障预测模型,它的输入是 Machine 对象的历史运行数据(温度、振动、运行时长等),输出是一个故障概率值。这个概率值不是孤立的数字,而是直接成为 Machine 对象的 predicted_failure_probability 属性。

【第三层:AI 推理层】传统的企业系统,AI 只能做"数据分析"——给你一堆图表,告诉你过去发生了什么。但 Palantir 通过本体论,让AI进化为"决策智能"——不仅分析过去,还能预测未来、推荐行动、甚至自主执行。这就是 AIP(Artificial Intelligence Platform)的作用。它是 Palantir 本体论之上的AI推理引擎,核心能力包括:

  • 上下文感知推理:大语言模型(LLM)天然就擅长理解结构化的语义信息——对象、属性、关系正是它能够理解的"语法"。当你向AI提问"哪些订单有交付延期风险"时,AI 不是盲目地搜索所有数据,而是理解 Order 对象、Delivery 对象、Supplier 对象之间的关系,知道要检查什么属性(如 estimated_delivery_date、supplier_reliability_score),应用什么业务规则(如"距交付期不足3天且供应商可靠性低于70%")。
  • AI Agent构建:基于本体论,可以快速构建领域专用的智能体。比如,一个"采购优化Agent",它理解Supplier、RawMaterial、Order、Inventory等对象及其关系,

    能够:

    • 监控库存水平,预测何时需要补货

    • 比较不同供应商的价格、交付时间、可靠性

    • 生成采购建议,甚至自动创建采购订单(当然,受权限控制)

    • 从历史采购决策中学习,优化未来推荐

  • 决策智能与闭环学习:AI的推荐不是终点,而是闭环的起点。当 AI 推荐"应该向供应商 A 采购原材料 X "时,人类决策者可以接受、修改或拒绝这个建议。无论做出什么决策,这个决策及其结果(如实际交付时间、质量评分)都会回写到本体论。

【第四层:应用层】所有应用共享同一个本体论,意味着自动获得:统一的数据视图(无需重复集成)、一致的业务语义(无需重新定义概念)、内置的AI能力(无需单独训练模型)、细粒度的权限控制(继承本体论的安全策略)。

  • 用户甚至不需要学习任何界面操作,直接用自然语言与本体论对话:"给我列出所有故障风险超过 80% 的设备"、"为什么订单 #12345 会延期"、"如果我们将生产计划提前一周,会影响哪些订单"。AI 理解这些问题,转化为对本体论的查询,返回结果,甚至提供行动建议。

2,本体论案例

【问题】明明已经把数据库的表结构、字段定义都投喂给了AI,但AI的回答仍然频繁出错,甚至产生严重的幻觉。为什么单纯投喂表结构还不够?

表名: purchase_order
字段: po_id, supplier_id, promised_date, po_status
关系: purchase_order → goods_receipt (一对多)

AI 知道有个字段叫 promised_date,但不知道:

  • 这个日期是谁承诺的?(供应商还是采购方?)

  • 这个日期可以改吗?(业务规则)

  • 这个日期是怎么来的?(业务流程)

  • 这个日期用来算什么指标?(业务语义)

【构建业务知识图谱】不仅告诉AI数据是什么,还要告诉AI数据从哪来,到哪去,为什么。

第一层:领域术语词典(消除歧义)
    ↓
第二层:静态数据模型(数据存储)
    ↓
第三层:过程模型(数据如何产生)
    ↓
第四层:指标推理模型(数据如何使用)
    ↓
第五层:呈现约束模型(数据如何展示)
    ↓
第六层:上下文感知(理解用户意图)
    ↓
第七层:元模型治理(持续优化)

【第一层:领域术语词典(消除歧义)】解决最常见的同词不同义和同义不同词问题。

  • 显式定义:不要让 AI 猜,明确告诉它 准时 的唯一定义

  • 列出易混淆点:提前告诉 AI 这不是那个

  • 关联使用场景:让AI知道什么时候该用这个术语

术语: 履约准时率
业务定义:在承诺交付日期(含)之前完成实际收货的订单占比
同义词:[准时交付率,OTD,On-TimeDeliveryRate]
易混淆概念:
-不等于"发货准时率"(那是供应商视角)
-不等于"到货准时率"(那可能不包含质检)
判定标准:所有批次收货日期≤承诺交付日期
使用场景:[供应商绩效评估,采购效率分析,供应链风险预警]

给 AI 的价值:当用户问“上个月准时率多少”时,AI 可以明确回答“您问的是到货准时率,统计标准是……”

【第二层:静态数据模型(数据存储)】传统 ChatBI 已有的部分,但需要增强业务规则;也就是说,需要增加字段背后隐藏的业务含义和规则说明。

  • ❌ 传统:promised_date DATE(只知道类型)
  • ✅ 改进:promised_date DATE + 3条业务规则(知道含义和约束)
实体: purchase_order (采购订单)
关键字段:
  - promised_date: 承诺交付日期
    业务规则:
      - "必须在供应商确认订单后才有值"
      - "可以晚于需求日期,但需要采购员审批"
      - "若订单拆分送货,每个送货单有独立承诺日期"

给 AI 的价值:AI 知道这个字段“可以改”,且“改动需要审批”,在解释数据异常时能给出合理推测。

【第三层:过程模型(数据如何产生)】数据不是凭空产生的,而是业务流程的产物;就是通过对静态的数据结构增加动态的行为特征,将业务流程和业务活动转变为一种显性化的语义定义。

  • 时序关系:明确活动的先后顺序与依赖关系;
  • 角色明确:界定每个活动具体的负责人或岗位;
  • 数据转换:追踪每个活动所产生或修改的数据项;
  • 异常分支:定义质检不合格、订单取消等异常场景的处理机制。
流程: 采购订单履约全流程
触发条件: 采购需求产生 + 存在有效框架协议

活动1: 创建采购订单
  执行者: 采购员
  输入: 采购需求、框架协议
  输出: purchase_order (状态=draft)
  业务规则:
    - R001: 合同必须在有效期内
    - R002: 供应商不能在黑名单
    - R003: 需求日期 ≥ 当前日期 + 标准交付周期

活动2: 供应商确认订单
  执行者: 供应商
  输入: 订单草稿
  输出: promised_date (承诺日期)
  业务规则:
    - R004: 承诺日期必须晚于当前
    - R005: 若承诺日期超需求日期3天,需主管审批

活动3: 供应商发货
活动4: 仓库收货
活动5: 质量检验
  业务规则:
    - R010: 收货后24小时内必须完成质检
    - R011: 质检不合格→创建退货单→重新发货

活动6: 退货处理 (若质检不合格)
活动7: 订单完成确认
  触发条件: 所有物料收货完成 + 质检合格
  业务规则:
    - R013: 准时性判定 = MAX(收货日期) ≤ 承诺日期

给 AI 的价值:当用户提问“为什么这个订单延期了?”时,AI 可进行全链路追溯:订单 PO001 → 活动 5(质检)→ 不合格退货 → 活动 6(重新发货)→ 延期 7 天。因此,在拥有详细流程与活动的行为定义后,AI 的回答不再是简单的概率预测,而是基于业务流程的可解释推理。

【第四层:指标推理模型(数据如何使用)】传统 ChatBI 仅告诉 AI “准时率 = 准时订单数 / 总订单数”,但这远不够。既要知道数据是如何来,又需要知道数据是如何用。

  • 明确统计口径:不同角色对“准时率”的理解可能存在差异,需一次性界定清晰;

  • 完整数据血缘:实现“指标 → 物理表 → 业务流程”的全链路追溯;

  • 场景化模板:针对不同类型的问题,匹配差异化的答案构建结构。

指标: 采购订单履约准时率(M001)

业务定义:
在承诺交付日期(含)之前完成所有收货的订单占比,
反映供应商的交付能力

计算口径:
统计范围:po_statusIN('completed','closed')
统计周期:按订单创建日期(po_date)
排除规则:已取消订单、金额<1000元的小额订单

计算公式:
分子:准时订单数(MAX(收货日期)≤承诺日期)
分母:总订单数

完整SQL逻辑:[附完整可执行的SQL]

数据血缘:
来源流程:P001-采购订单履约全流程
来源表:purchase_order+goods_receipt
关键字段:promised_date,receipt_date

典型分析场景:
场景1:供应商绩效评估
    问题模式:"XX供应商上月的准时率是多少?"
    答案结构:数值+同比环比+排名+异常说明
    
场景2:延期原因分析
    问题模式:"为什么上个月准时率下降了?"
    答案结构:趋势图+根因分解(质检不合格X%,供应商延误Y%)
    
场景3:风险预警
    问题模式:"准时率低于80%的供应商有哪些?"
    答案结构:预警清单+风险等级+改进建议

用户问题:上月准时率 82%,为什么?

给 AI 的价值:

  • 查询 return_record 表,发现退货订单增加37%

  • 追溯到流程 P001-活动5,退货主要原因是 包装破损45%

  • 给出结论:准时率下降主要因质检不合格,建议加强供应商包装标准

【第五层:呈现约束模型(数据如何展示)】统一回答风格,提升用户体验。这个实际和 Claude Skills 技能包里面的案例,模板,最佳实践部分的定义思路完全一致。

  • 可视化规范
  • 报告模板
  • 问答模板

给AI的价值:标准化的回答结构,用户体验一致且专业。

【第六层:上下文感知(理解用户意图)】让AI理解用户的角色、时机、意图。

  • 组织上下文
  • 时间上下文
  • 用户画像
  • 对话记忆

给AI的价值:同样的问题,不同角色,不同时机给出差异化的答案。

【第七层:元模型治理(持续优化)】建立持续优化机制。让整个AI模型和AI应用能够自我进化,越来越聪明。

  • 版本管理
  • 责任划分
  • 质量监控

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐