本文由Markdown语法编辑器编辑完成。

1.背景:

在上一篇博文<【DICOM Transfer Syntax UID】DICOM传输中一个非常重要却易被忽略的TAG>https://blog.csdn.net/inter_peng/article/details/158853403?spm=1001.2014.3001.5501
中,提到了在DICOM传输过程中,一个非常重要的概念——传输语法(Transfer Syntax UID)。

而Transfer Syntax UID, 主要会定义两个内容,byte ordering 和 compress,也就是:字节序和压缩算法。

这一篇,我们借助Google的一个AI工具,来学习DICOM中比较常见的一种无损压缩算法(JPEG Lossless)。

2.学习过程:

2.1 找权威论文

要学习图像的压缩算法,首先需要找到这个算法的来源,比如论文,专利等等。

因此,我首先在chatgpt里面询问,如果我想要了解JPEG Lossless无损压缩,需要看哪几篇论文。

在这里插入图片描述

序号 论文/文档 作者 备注
1 The LOCO-I Lossless Image Compression Algorithm: Principles and Standardization into JPEG-LS 作者: Marcelo J. Weinberger, Gadiel Seroussi, Guillermo Sapiro
发表: IEEE Transactions on Image Processing, 2000
这篇论文是 JPEG-LS 最被引用的权威论文,完整讲解了 JPEG-LS 的基础算法 LOCO-I(LOw COmplexity LOssless COmpression for Images)
1. 如何对像素进行预测;
2.残差(预测误差)的统计建模;
3.上下文相关编码(Context-based coding);
4.使用可自适应的 Golomb / Rice 编码进行熵编码, 它同时解释了算法如何从概率建模逼近最优压缩,并且作为 ISO/ITU 标准的核心技术。
该论文通常作为学习 JPEG-LS 算法原理的首选材料。
2 Information technology – Lossless and near-lossless compression of continuous-tone still images ISO/IEC 14495-1: JPEG-LS 标准文档 1. 详细规定了 JPEG-LS 在无损与近无损模式下的所有编码细节
2.定义了预测器、上下文建模规则与压缩参数格式
3.说明了编码后的位流结构
4. 该标准是 DICOM 中 JPEG-LS 压缩必须遵从的技术规范。
3 From LOCO-I to the JPEG-LS Standard (ICIP’99) 作者: 同 Weinberger 等
会议: IEEE ICIP 1999
作为早期科研报告,简要介绍 JPEG-LS 规范如何从最初的 LOCO-I 发展而来,包括上下文预测、码本选择、Golomb 编码策略等原理

以下是 chatgpt给出的关于三篇文献的推荐指数。
在这里插入图片描述

2.2 Google scholar (Google学术)

使用chatgpt, 找到了与DICOM JPEGLossless算法的三篇文章。为了确认这几篇文献的含金量,我依次把这三篇文章的题目,输入进了Google scholar的搜索框中。Google scholar是专门用来搜学术报告的网站,在每一篇文章下面,还会显示该篇文章被引用的次数。

如果一篇文章被引用的次数越多,那么说明它在本领域内的地位就越高。类似于Google搜索结果,使用的Page Rank的算法。

在这里插入图片描述
当我把第一篇论文的题目输入进去后,便出现了文章的摘要。更我我惊讶的是,这篇论文被引用的次数,达到了 2471次。那说明这篇论文的含金量非常高。

在这里插入图片描述

2.3 Google NotebookLM

紧接着出场的,是本篇文章的主角 —— Google NotebookLM (https://notebooklm.google/)。

官网给它的定位是: Your AI-Powered Research Partner. 你的AI加持(赋能)科研搭档。
在这里插入图片描述

读过研究生或博士的,都了解做科研,要经常阅读论文,写摘要,时刻关注相关领域内的科研进展,而且要求创新。而且一般导师下面的每个学生,研究的方向也不会完全相同。因此,更多的是要读国外的论文,寻找灵感和思路。做科研,是一条略显孤独的路。

而现在有了AI后,它就能时刻陪伴你了。

那么如果想快速了解以上几篇论文的内容要点,我们便可以使用 NotebookLM了。

进入笔记本后,既可以直接把论文的题目,贴在对话框里面,然后笔记本会自动联网搜索与输入框内相关的文献;也可以直接本地上传相关的论文文献。
在这里插入图片描述

上传完成后,它便会把所有相关的文献内容,都加载到它的知识库里。
在这里插入图片描述

当左侧所有的 checkbox都自动划上勾后,在中间的"对话"区域内,便会出现一个简短的摘要,来说明这些资料的概要内容。

由于我是把三篇与DICOM JPEGLossless的文章题目依次输入进入,NotebookLM又自动联网搜索了其他几篇相关的文献,因此它给出的摘要,也是介绍了这个算法的定义,来历和应用。

接下来,我们便可以在下面的对话框,来提问相关的问题。

比如,我输入: “能用初中生能听懂的方式,解释一下DICOM JPEGLOSSLESS的压缩原理吗?”

接下来它便开始按照初中生能理解的方式,开始普及这个算法知识。
在这里插入图片描述
我又问了,DICOM JPEGLossless和传统的JPEG 2000压缩算法的区别是什么?
在这里插入图片描述

经过几轮的对话,我对这个算法便有了一个大致的了解。

但是我怎么和别人分享呢? 这时NotebookLM的最右侧,便给了我们很多的选择。可以生成视频讲解,音频概览,思维导图,PPT等。

在这里插入图片描述
右上角区域是可以选择的传播媒介。右下角区域便是生成的结果,包括视频,音频,演示文稿,博客文章等等。

生成视频时,可以选择不同的语言,视频的风格,甚至你可以告诉它,希望视频里面能够侧重讲解哪些内容。当这些都规定好后,它便开始默默地根据你的要求,来生成一篇像样的视频。

我分别生成了中文和英文两个视频。这两个视频,题目和讲解的侧重点各不相同。我还把中文和英文的视频,分别上传到了B站和Youtube上面。作为我在这两个视频平台上面的第一份视频稿件。

以下是两个视频在网站上的播放链接:

B站: https://www.bilibili.com/video/BV131AkzYEu4/?vd_source=952e0eacb46ee6d573b9f01638c0a293
在这里插入图片描述

Youtube: https://youtu.be/nGVYFVGU7zs
在这里插入图片描述

3 代码实践

接下来,我们主要利用pydicom, 来演示,如何进行JPEG Lossless的无损压缩。以及无损压缩可以达到的图像的压缩比例。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐