【AI + DICOM无损压缩】基于Google NotebookLM,深入浅出了解DICOM JPEGLossless压缩算法

inter_peng

416人浏览 · 2026-03-17 09:44:44

inter_peng · 2026-03-17 09:44:44 发布

本文由Markdown语法编辑器编辑完成。

1.背景：

在上一篇博文<【DICOM Transfer Syntax UID】DICOM传输中一个非常重要却易被忽略的TAG>https://blog.csdn.net/inter_peng/article/details/158853403?spm=1001.2014.3001.5501
中，提到了在DICOM传输过程中，一个非常重要的概念——传输语法(Transfer Syntax UID)。

而Transfer Syntax UID, 主要会定义两个内容，byte ordering 和 compress，也就是：字节序和压缩算法。

这一篇，我们借助Google的一个AI工具，来学习DICOM中比较常见的一种无损压缩算法(JPEG Lossless)。

2.学习过程:

2.1 找权威论文

要学习图像的压缩算法，首先需要找到这个算法的来源，比如论文，专利等等。

因此，我首先在chatgpt里面询问，如果我想要了解JPEG Lossless无损压缩，需要看哪几篇论文。

在这里插入图片描述

序号	论文/文档	作者	备注
1	The LOCO-I Lossless Image Compression Algorithm: Principles and Standardization into JPEG-LS	作者: Marcelo J. Weinberger, Gadiel Seroussi, Guillermo Sapiro 发表: IEEE Transactions on Image Processing, 2000	这篇论文是 JPEG-LS 最被引用的权威论文，完整讲解了 JPEG-LS 的基础算法 LOCO-I（LOw COmplexity LOssless COmpression for Images） 1. 如何对像素进行预测; 2.残差（预测误差）的统计建模; 3.上下文相关编码（Context-based coding）； 4.使用可自适应的 Golomb / Rice 编码进行熵编码, 它同时解释了算法如何从概率建模逼近最优压缩，并且作为 ISO/ITU 标准的核心技术。该论文通常作为学习 JPEG-LS 算法原理的首选材料。
2	Information technology – Lossless and near-lossless compression of continuous-tone still images	ISO/IEC 14495-1: JPEG-LS 标准文档	1. 详细规定了 JPEG-LS 在无损与近无损模式下的所有编码细节 2.定义了预测器、上下文建模规则与压缩参数格式 3.说明了编码后的位流结构 4. 该标准是 DICOM 中 JPEG-LS 压缩必须遵从的技术规范。
3	From LOCO-I to the JPEG-LS Standard (ICIP’99)	作者: 同 Weinberger 等会议: IEEE ICIP 1999	作为早期科研报告，简要介绍 JPEG-LS 规范如何从最初的 LOCO-I 发展而来，包括上下文预测、码本选择、Golomb 编码策略等原理

以下是 chatgpt给出的关于三篇文献的推荐指数。
在这里插入图片描述

2.2 Google scholar (Google学术)

使用chatgpt, 找到了与DICOM JPEGLossless算法的三篇文章。为了确认这几篇文献的含金量，我依次把这三篇文章的题目，输入进了Google scholar的搜索框中。Google scholar是专门用来搜学术报告的网站，在每一篇文章下面，还会显示该篇文章被引用的次数。

如果一篇文章被引用的次数越多，那么说明它在本领域内的地位就越高。类似于Google搜索结果，使用的Page Rank的算法。

在这里插入图片描述
当我把第一篇论文的题目输入进去后，便出现了文章的摘要。更我我惊讶的是，这篇论文被引用的次数，达到了 2471次。那说明这篇论文的含金量非常高。

在这里插入图片描述

2.3 Google NotebookLM

紧接着出场的，是本篇文章的主角 —— Google NotebookLM （https://notebooklm.google/）。

官网给它的定位是: Your AI-Powered Research Partner. 你的AI加持(赋能)科研搭档。
在这里插入图片描述

读过研究生或博士的，都了解做科研，要经常阅读论文，写摘要，时刻关注相关领域内的科研进展，而且要求创新。而且一般导师下面的每个学生，研究的方向也不会完全相同。因此，更多的是要读国外的论文，寻找灵感和思路。做科研，是一条略显孤独的路。

而现在有了AI后，它就能时刻陪伴你了。

那么如果想快速了解以上几篇论文的内容要点，我们便可以使用 NotebookLM了。

进入笔记本后，既可以直接把论文的题目，贴在对话框里面，然后笔记本会自动联网搜索与输入框内相关的文献；也可以直接本地上传相关的论文文献。
在这里插入图片描述

上传完成后，它便会把所有相关的文献内容，都加载到它的知识库里。
在这里插入图片描述

当左侧所有的 checkbox都自动划上勾后，在中间的"对话"区域内，便会出现一个简短的摘要，来说明这些资料的概要内容。

由于我是把三篇与DICOM JPEGLossless的文章题目依次输入进入，NotebookLM又自动联网搜索了其他几篇相关的文献，因此它给出的摘要，也是介绍了这个算法的定义，来历和应用。

接下来，我们便可以在下面的对话框，来提问相关的问题。

比如，我输入: “能用初中生能听懂的方式，解释一下DICOM JPEGLOSSLESS的压缩原理吗?”

接下来它便开始按照初中生能理解的方式，开始普及这个算法知识。
在这里插入图片描述
我又问了，DICOM JPEGLossless和传统的JPEG 2000压缩算法的区别是什么？

经过几轮的对话，我对这个算法便有了一个大致的了解。

但是我怎么和别人分享呢？这时NotebookLM的最右侧，便给了我们很多的选择。可以生成视频讲解，音频概览，思维导图，PPT等。

在这里插入图片描述
右上角区域是可以选择的传播媒介。右下角区域便是生成的结果，包括视频，音频，演示文稿，博客文章等等。

生成视频时，可以选择不同的语言，视频的风格，甚至你可以告诉它，希望视频里面能够侧重讲解哪些内容。当这些都规定好后，它便开始默默地根据你的要求，来生成一篇像样的视频。

我分别生成了中文和英文两个视频。这两个视频，题目和讲解的侧重点各不相同。我还把中文和英文的视频，分别上传到了B站和Youtube上面。作为我在这两个视频平台上面的第一份视频稿件。

以下是两个视频在网站上的播放链接：

B站: https://www.bilibili.com/video/BV131AkzYEu4/?vd_source=952e0eacb46ee6d573b9f01638c0a293
在这里插入图片描述

Youtube: https://youtu.be/nGVYFVGU7zs
在这里插入图片描述

3 代码实践

接下来，我们主要利用pydicom, 来演示，如何进行JPEG Lossless的无损压缩。以及无损压缩可以达到的图像的压缩比例。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

基于PI、二阶滑模与有限集模型预测的永磁同步电机电流环控制策略研究（Simulink仿真实现）

永磁同步电机凭借高效率、高功率密度、低转矩脉动等优势，广泛应用于工业驱动、新能源装备、智能伺服等领域，其控制系统的动态响应速度、稳态控制精度与抗扰动能力直接决定整机运行性能。电流环作为永磁同步电机矢量控制系统的内环核心，承担着电流快速跟踪、抑制扰动、保障系统稳定运行的关键作用，其控制算法的性能优劣对电机调速、转矩输出特性影响显著。

AtomGit开源社区

混合储能永磁同步电机驱动系统仿真模型机理与特性（Simulink仿真实现）

混合储能永磁同步电机驱动系统仿真模型机理与特性解析。

AtomGit开源社区

【创新未发表】基于杜鹃优化算法的分时电价需求响应与综合能源系统双层调度模型（Matlab代码实现）

在 “双碳” 发展战略全面推进的背景下，风电、光伏等清洁能源规模化并网应用已成为能源转型的主流趋势。综合能源系统作为整合多种能源品类、实现多设备协同运行的新型能源载体，能够充分发挥多能互补、梯级利用的优势，有效承接高比例可再生能源接入。但风光能源固有的间歇性、随机性与反调峰特性，使得系统源荷双侧波动加剧，电网负荷峰谷差值不断扩大，弃风、弃光现象频发，不仅增加了系统调度运行压力，也制约了清洁能源的高