数据架构是企业架构中连接业务、应用与技术的桥梁,通过数据资产目录厘清家底,数据标准统一语言,数据模型指导开发,数据分布拉通业务流,从而提升数据质量与运作效率,支撑业务决策与系统建设。

  1. 统一语言,消除歧义:通过业务术语与数据标准,提升沟通效率。

  2. 拉通业务流,提升运作效率:通过数据分布设计,消除信息孤岛。

  3. 厘清信息资产,满足用户消费:通过资产目录掌握数据家底。

  4. 改善数据质量,支撑决策:通过数据标准与责任机制。

  5. 推动集成共享,降低变革成本:减少数据冗余与系统耦合。

40多G、4000余份数字化资料合集:AI大模型及行业应用方案、企业数字化、数据中台、数据要素、数据资产、数据治理、数字化转型

一、数据架构的定位与整体价值

1. 数据架构在4A中的位置

  • 业务架构(BA):做正确的事,描述业务如何运作以实现战略。

  • 数据架构(DA):以结构化方式描述业务运作与管理决策所需的数据及其关系。

  • 应用架构(AA):支持业务与数据功能的系统实现。

  • 技术架构(TA):提供底层软硬件基础设施。

数据架构是连接业务、应用、技术三者的桥梁,承接业务的数据需求,牵引IT的规划设计。


二、数据架构的四大组件

组件

定义

核心价值

1. 数据资产目录

对数据进行分层分类,厘清数据资产

全盘掌握业务对象及数据家底

2. 数据标准

统一业务术语与数据定义

统一语言、消除歧义、提升数据质量

3. 数据模型

通过E-R建模描述数据及其关系

业务与技术沟通的桥梁,指导系统实现

4. 数据分布

数据在业务流程与系统中的流转视图

拉通业务流,消除信息孤岛


三、各组件详细内容

1. 数据资产目录

  • 五层数据结构

    • L1 主题域分组

    • L2 主题域

    • L3 业务对象

    • L4 逻辑数据实体

    • L5 属性

  • 业务对象是核心管理要素,具备唯一身份标识、相对稳定、可实例化。

  • 识别原则:与业务能力匹配、有唯一标识、可独立存在、有实例。

  • 示例:机场、政务服务的数据资产目录结构。

2. 数据标准

  • 业务术语:统一业务对象定义,消除歧义。

  • 数据标准:定义属性层的数据含义、格式、规则。

  • 作用

    • 统一规则与定义

    • 明确责任人(数据管家)

    • 提高数据质量与重用性

  • 示例:机场航班号、旅客姓名、报警防区等标准定义。

3. 数据模型

  • 三种模型层次

    • 概念模型:业务视角,实体与关系,无属性

    • 逻辑模型:细化实体、属性、主外键,范式化

    • 物理模型:数据库实现,考虑性能与存储

  • 流程:从信息调研 → 概念模型 → 逻辑模型 → 物理模型

  • 示例:机场值机数据模型、政务服务数据模型。

4. 数据分布

  • 信息链与数据流:描述数据在业务流程与系统中的创建、读取、修改、删除等操作。

  • 数据源

    • 数据首次正式发布的系统

    • 是唯一录入点

    • 保证数据血缘清晰、集成规范

  • 示例:机场数据分层处理架构、政务服务数据归集与应用架构。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐