从“能用”到“专业可控”：一款全新的 DICOM 脱敏专用工具终于更新了

jeffer_liu

341人浏览 · 2026-05-15 09:15:21

jeffer_liu · 2026-05-15 09:15:21 发布

多年以前，我们做过一款非常朴素的 DICOM 文件批量脱敏工具。长这个样子。
脱敏工具0.8
它的目标很简单：
针对医学影像 DICOM 文件中的患者姓名、医院名称、医院地址等敏感字段进行处理，支持批量选择文件夹、设置匿名化或删除规则，然后输出脱敏后的 DICOM 文件。

那个版本功能不复杂，界面也比较原始，但在当时解决了一个非常实际的问题：
医学影像数据想要用于测试、研发、教学、算法训练和数据共享，第一步必须先把敏感信息处理干净。

几年过去了，医学影像数据的价值越来越高，数据安全要求也越来越严格。
于是，我们终于重新做了一款更加专业、更加适合真实业务场景的 DICOM 脱敏专用工具。
在这里插入图片描述

一、为什么现在更需要专业的 DICOM 脱敏工具？

这几年，“数据要素”已经成为医疗信息化建设中非常重要的关键词。

医院沉淀了大量高价值数据，其中医学影像数据尤其典型：

CT、MR、DR、超声等影像数据量大；
DICOM 文件中包含完整检查信息；
影像数据可用于科研、教学、算法训练、质控分析；
影像与报告、诊断、随访信息结合后，具有更高的数据价值。

但问题也非常突出：

医学影像数据不是普通文件。

一个 DICOM 文件里面不仅有图像本身，还可能包含大量患者相关信息、检查信息、设备信息、医院信息和操作人员信息。

例如：

PatientName 患者姓名
PatientID 患者编号
PatientBirthDate 出生日期
PatientSex 性别
PatientAge 年龄
InstitutionName 医院名称
InstitutionAddress 医院地址
AccessionNumber 检查号
StudyID 检查 ID
OperatorName 操作员姓名
以及更多隐藏在 DICOM Tag 中的敏感字段

如果这些数据未经处理就流转到研发、测试、科研或第三方环境中，就可能带来隐私泄露和合规风险。

所以，在数据要素流通、数据资产建设、影像 AI 研发、医学科研数据共享等场景下，DICOM 脱敏不是辅助功能，而是基础能力。

二、历史版本：解决了问题，但不够专业

早期版本的设计比较直接。

它主要面向几个固定字段，例如患者姓名、出生日期、性别、年龄、医院名称、医院地址、检查号、操作员姓名、StudyID 等，用户可以选择匿名化或删除。

这种方式的优点是简单、容易理解，上手快。

但随着实际使用场景越来越复杂，问题也逐渐暴露出来：

脱敏字段有限
只能处理少量常见字段，难以覆盖更多 DICOM Tag。
规则不够灵活
不同医院、不同项目、不同科研场景，对脱敏规则的要求并不一样。
缺少任务化管理
大批量处理时，很难追踪任务状态、成功数量、失败数量、跳过数量和处理日志。
缺少数据查看能力
用户很难在处理前直观看到 DICOM 文件中到底有哪些 Tag、当前值是什么、是否启用脱敏规则。
不适合产品化交付
老版本更像一个内部小工具，而不是一个可以长期使用、维护和授权管理的软件产品。
三、新版本：面向真实场景的 DICOM 脱敏专用工具

这次更新，我们不是简单地“换个界面”，而是重新设计了工具的整体能力。

新版本围绕三个核心目标展开：

第一，能批量处理。
支持面向文件、文件夹、目录结构的 DICOM 批量脱敏处理，适合真实数据集整理、科研数据准备、测试数据构建等场景。

第二，规则可配置。
不再只固定几个字段，而是围绕 DICOM Tag 建立脱敏规则体系。用户可以根据不同分组启用、禁用、匿名化或清空指定字段。

第三，处理可追踪。
通过任务列表、进度、成功数、失败数、跳过数、日志、源目录和目标目录等信息，让批量处理过程更加透明。

标题四、新版本主要功能亮点

1. 批量匿名化任务管

新版本提供了任务化处理界面。
在这里插入图片描述

每一次批量脱敏都可以作为一个任务进行管理，任务中可以查看：

任务 ID
任务名称
任务状态
处理进度
成功数量
失败数量
跳过数量
创建时间
开始时间
结束时间
操作日志
源目录
目标目录

这对于大批量 DICOM 文件处理非常重要。

以前脱敏工具只是“点一下开始处理”，处理完了也不知道中间发生了什么。
现在可以清楚看到每个任务的执行情况，方便排查问题，也方便形成可追溯的数据处理记录。

2. DICOM 数据查看

新版本增加了 DICOM 数据查看能力。
在这里插入图片描述

用户可以选择 DICOM 文件后，查看文件中的 Tag 信息，包括：

TAG 编号
NAME 字段名称
当前值
是否启用
规则值

同时右侧还可以进行图像预览。

这意味着用户在脱敏前，可以先确认文件中到底包含哪些敏感字段，再决定如何处理。

这对于医学影像研发人员非常实用。
因为不同设备、不同医院、不同检查类型生成的 DICOM Tag 内容并不完全一致，很多敏感信息并不总是出现在最常见的位置。

3. 分组化脱敏规则配置

在这里插入图片描述

新版本按照 DICOM 信息结构进行了规则分组，例如：

Patient
Visit
Study
Procedure Step
Series
Image
Result
Interpretation
Equipment
Other

每一组下可以配置对应的 DICOM Tag 处理规则。

例如 Patient 分组下可以配置：

Patient’s Name
Patient ID
Issuer of Patient ID
Patient’s Birth Date
Patient’s Birth Time
Patient’s Sex
Other Patient IDs
Other Patient Names
Patient’s Age

每个字段都可以设置是否启用，以及采用何种处理规则。

常见规则包括：

random：随机匿名化
clear：清空字段
custom：自定义值
保留原值
按项目规则扩展

这样一来，工具就不再是“固定字段脱敏”，而是变成了一个可配置、可扩展的 DICOM 脱敏规则引擎。