如何将多模态MRI影像组学与HCC微血管侵犯的生物学机制（EMT、血管生成、ECM重塑）关联，并解释其对术前MVI预测及复发风险分层的机制意义

AI医影跨模态组学

397人浏览 · 2026-05-02 17:49:08

AI医影跨模态组学 · 2026-05-02 17:49:08 发布

导语

各位同学，大家好。做影像组学最怕什么？最怕模型跑得飞起，AUC刷到0.96，但别人一问“你这几个特征到底代表啥生物学过程”时，你只能沉默。这就好比算命算得挺准，但你自己也不知道为啥准——黑箱本箱。而真正能发高分、经得起推敲的研究，都在做同一件事：给影像特征找“生物学娘家”，让宏观的图像信号和微观的病理、细胞、基质、血管行为对上话。今天咱们通过一篇发表在《JHEP Reports》上的最新文献，看看作者是怎么把MRI的ECV和多期相增强模式，与肝细胞癌的微血管侵犯（MVI）、EMT、血管生成、细胞外基质重塑这些生物学机制优雅地挂靠起来，并且用Transformer融合模型实现了术前预测和复发风险分层。读完你会发现：原来影像组学也可以讲出有根有据、有血有肉的疾病故事。

★题目：Integrating multiphase MRI surrogates to improve microvascular invasion detection and recurrence risk stratification in HCC

（整合多期相MRI影像替代指标以改善肝细胞癌微血管侵犯检测与复发风险分层）

★期刊：《JHEP Reports》（中科院1区，IF=7.5）

★研究疾病：肝细胞癌（HCC）

★生物学机制：上皮-间充质转化、血管生成及细胞外基质重塑

★发表时间：2025年11月

研究背景-从 “临床问题” 落到 “生物学问题”

肝细胞癌（HCC）是全球范围内最常见且致死率最高的恶性肿瘤之一，即使接受根治性肝切除或肝移植，术后5年复发率仍高达40%–70%，严重制约患者长期生存。大量病理学证据表明，微血管侵犯（MVI）——即肿瘤细胞侵入内皮衬覆的微血管（包括门静脉、肝动脉及淋巴管）——是导致HCC早期复发和不良预后的关键病理因素。然而，目前MVI的金标准诊断依赖术后病理检查，术前活检因取样误差和肿瘤异质性而可靠性差，且无法用于术前治疗决策。因此，如何实现术前无创、准确地预测MVI，成为HCC精准治疗中亟待解决的临床难题。从生物学机制角度看，MVI并非孤立的病理现象，而是肿瘤高侵袭性行为的直接体现，其发生与上皮-间充质转化（EMT）、血管生成、细胞外基质（ECM）重塑等一系列微环境改变密切相关。这些生物学过程会显著影响肿瘤局部的微血管密度（MVD）、纤维化程度、细胞外间隙大小以及血流动力学特征。近年来，MRI衍生的细胞外容积分数（ECV）作为一种非侵入性影像生物标志物，能够定量反映ECM和微血管结构；同时，多期相动态增强MRI（动脉期、门脉期、平衡期）可捕捉肿瘤的血流灌注异质性。因此，理论上整合ECV与多期相MRI特征，能够间接“可视化”MVI背后的复杂生物学机制，为术前预测提供影像学替代指标。然而，传统影像组学方法难以充分建模这些多模态、多维度的生物学相关信息，亟需引入深度学习尤其是Transformer架构，以实现从影像表型到生物学行为的跨越。

研究目的（明确写出“三层目的”）

基于上述背景，本研究设定了清晰的三层研究目的。第一层（技术目的）：开发并外部验证一个基于Transformer架构的多模态深度学习融合模型——DL-TriFusion，该模型整合多期相动态增强MRI（动脉期、门脉期、平衡期）、ECV图以及关键临床变量，用于术前无创预测HCC患者的MVI状态。第二层（临床目的）：系统评估DL-TriFusion在术后复发风险分层中的价值，特别是将其与病理确诊的MVI进行头对头比较，验证影像替代指标是否在预测早期复发（≤2年）和晚期复发（>2年）方面具有更优的区分能力，从而为个体化手术规划、新辅助/辅助治疗筛选及术后监测策略提供决策支持。第三层（机制目的）：通过模型可解释性分析（Grad-CAM），揭示DL-TriFusion在做出预测时所关注的影像区域（如肿瘤边缘、瘤周强化区等），并将这些区域与已知的MVI相关生物学特征（如不规则边缘、微血管密度增高、ECM重构）进行关联，从而验证模型并非“黑箱”，而是学习到了具有生物学意义的影像模式，为影像生物标志物的机制合理性提供证据。三层目的层层递进：技术是实现手段，临床是应用导向，机制是科学内核——只有将预测性能挂靠到可解释的生物学基础上，模型才能真正获得临床和学术的信任。

研究思路（最核心：怎么挂靠机制）

本研究的核心研究思路在于如何将深度学习模型的预测能力挂靠到MVI的生物学机制上，具体分为四个关键步骤。第一步：选择具有生物学意义的影像替代指标。研究引入ECV作为核心输入之一，ECV通过公式ECV=(1−Hct)×(ΔSIliver/ΔSIblood) 计算，能够定量反映细胞外间隙大小，间接衡量微血管密度、纤维化和ECM重构——这些正是MVI发生的微环境基础。同时纳入多期相MRI（动脉期、门脉期、平衡期），捕捉肿瘤血流动力学异常和血管生成活性，两者结合实现了对肿瘤结构-功能双重生物学特征的影像编码。第二步：设计能够融合多模态信息的深度学习架构。研究采用3D MobileNetV2分别提取ECV和多期相MRI的特征，再通过Transformer的多头自注意力机制将这些影像特征与临床变量进行跨模态交互建模，使模型能够自动学习哪些影像-临床组合模式最能够代表MVI的生物学行为。第三步：通过消融实验验证各模态的机制贡献。研究发现，DL-ECV模型表现与DL-CE模型相当，提示ECV本身已蕴含丰富的MVI相关微环境信息；而DL-TriFusion（融合所有模态）显著优于任何单模态或双模态模型，证明结构（ECV）与功能（多期相）信息互补，共同刻画MVI的全景生物学图谱。第四步：利用Grad-CAM进行机制验证。模型预测时生成热力图，显示其重点关注不规则肿瘤边缘、瘤周强化区和瘤内高激活区域——这些区域在病理学上恰恰是侵袭性生长、血管生成活跃、MVI高发的部位。由此，研究完成了从“影像特征”到“生物学行为”的闭环解释，使DL-TriFusion不仅是一个高性能预测工具，更是一个可解释的、机制驱动的影像生物标志物模型。

数据和方法（机制部分怎么设计）

数据：共纳入924例经手术切除的HCC患者，来自5个三级医疗中心。其中训练队列361例（中心1-2，用于模型训练），内部验证队列155例（中心1-2，用于模型调参与初步验证），外部测试队列408例（中心3、4、5，分别188、136、84例，用于评估模型泛化性）。

图 1：患者筛选流程图

方法：① 多期相MRI采集（动脉期、门脉期、平衡期）→ ② ECV图生成（基于延迟期与平扫T1WI差值及Hct计算）→ ③ ROI手动勾画（肿瘤区域）→ ④ 预处理（空间重采样至128×128×128、Z-score强度归一化、随机3D旋转增强）→ ⑤ 3D MobileNetV2提取影像特征（分别提取ECV与多期相MRI特征）→ ⑥ Transformer多头自注意力融合（影像特征与临床变量拼接后经Transformer编码）→ ⑦ 分类输出（多层感知机预测MVI概率）→ ⑧ 模型解释（Grad-CAM生成热力图，定位生物学相关区域）。

研究结果（“从表型到机制”）

①表型层面：在表型层面，DL‑TriFusion模型表现出卓越的预测性能：训练、内部验证和外部测试队列中的AUC分别达到0.957、0.959和0.959，显著优于所有单模态及双模态模型（p < 0.001）。在复发风险分层方面，该模型的C‑index（内部验证0.837，外部验证0.755）显著高于病理确诊的MVI（0.447和0.520）；时间依赖性AUC显示，2年及5年的复发预测AUC分别为0.854/0.846和0.953/0.938，而病理MVI仅0.628/0.485和0.589/0.501。模型定义的高危组复发率显著升高，证明其影像替代指标在预后评估中优于传统病理指标。

图 2（模型性能对比图）：该图包含ROC曲线、PR曲线、校准曲线和决策曲线，对比了VICT2、临床、DL‑CE、DL‑ECV及DL‑TriFusion模型。DL‑TriFusion在各队列中AUC均达0.957–0.959，显著优于单模态及双模态模型，且校准良好、净获益最大。从机制角度看，DL‑ECV表现与DL‑CE相当，提示ECV本身已蕴含丰富的微环境结构信息（如纤维化、微血管密度）；而DL‑TriFusion的进一步提升证明结构（ECV）与功能（多期相）信息互补，共同刻画了MVI背后的复杂生物学行为。

图 3（混淆矩阵）：该图展示了各模型在训练、内部验证和外部测试队列中对MVI的预测分类结果。DL‑TriFusion的真阳性数和真阴性数均最高，假阳性数最少，表明其判别能力最强。在外部测试队列中，DL‑TriFusion正确分类了197例MVI阴性中的191例、155例MVI阳性中的140例。这一优势源于模型能够同时捕捉ECV反映的微环境重构和多期相反映的侵袭性血流模式，从而更准确地识别出那些真正具有微血管侵犯生物学行为的肿瘤，减少了影像学假阳性。

图 4（时间依赖性ROC曲线）：该图比较了DL‑TriFusion与病理确诊MVI对2年和5年复发的预测能力。在外部测试队列中，DL‑TriFusion的2年AUC为0.846，5年AUC为0.938；而病理MVI仅为0.485和0.501。影像组学模型显著优于病理金标准，原因在于病理MVI仅反映手术时的局部侵袭状态，而DL‑TriFusion整合了ECV（微环境结构）、多期相（血流功能）及临床变量，能够同时评估肿瘤内在侵袭性（驱动早期复发）和肝脏背景状态（驱动晚期复发），实现了对复发双重机制的更全面捕获。

图 5（Kaplan‑Meier复发分层图）：该图显示，基于DL‑TriFusion评分划分的高危组与低危组在复发‑生存曲线上存在显著分离（log‑rank p<0.001），C‑index达0.837（内部验证）和0.755（外部验证）；而基于病理MVI的分层效果极差（C‑index仅0.447–0.520）。2年累积复发率在DL‑TriFusion高危组为64.4%（外部），病理MVI高危组仅39.3%。这说明影像组学衍生的风险评分比单一病理指标更能反映真实的复发风险，因为模型重点学习了不规则边缘、瘤周强化等与EMT、血管生成直接相关的影像特征，这些正是驱动早期复发的核心生物学过程。

②机制层面：在机制层面，研究通过Grad‑CAM可视化揭示了模型决策的生物学基础。热力图显示，模型重点关注不规则肿瘤边缘、瘤周强化区以及瘤内高激活区域——这些区域在病理学上恰好对应侵袭性生长、血管生成活跃和微血管密度增高，是MVI发生的典型微环境特征。此外，仅使用ECV的模型（DL‑ECV）在多中心测试中表现与多期相模型相当，证实ECV作为细胞外基质和微血管结构的替代标志物具有内在的生物学信息。模型对HBV阳性/阴性、不同分化程度及不同中心亚组均保持稳定，进一步支持其学习到的影像模式具有跨人群的生物学普适性。

图 6（案例可视化及Grad‑CAM热力图）：该图展示了代表性MVI阳性与阴性病例的MRI图像、Grad‑CAM热力图及对应的H&E病理切片。热力图显示，模型在预测MVI阳性时高度关注肿瘤的不规则边缘、瘤周强化区及瘤内异质性区域；这些区域在病理切片上恰好可见微血管内癌栓形成。这一结果直接证明了模型学习到的影像特征与MVI的生物学机制高度一致——不规则边缘对应侵袭性生长，瘤周强化对应血管生成活性增高，而ECV图的激活区域反映ECM重构和微血管密度增加。Grad‑CAM为“黑箱”模型提供了生物学可解释性。

讨论（把机制故事讲圆）

本研究通过构建Transformer多模态融合模型DL‑TriFusion，成功实现了HCC患者术前MVI的无创预测，并在复发风险分层中显著优于病理确诊的MVI，其核心优势在于将预测能力挂靠到明确的生物学机制上。MVI的本质是肿瘤细胞侵入微血管，这一过程依赖于上皮‑间充质转化（EMT）、血管生成和细胞外基质（ECM）重塑等微环境改变。本研究通过引入ECV作为影像替代指标，定量反映了细胞外间隙大小、微血管密度和纤维化程度，从而“可视化”了MVI背后的结构基础；同时，多期相动态增强MRI捕捉了肿瘤血流动力学异常和血管通透性改变，补充了功能层面的信息。Transformer的自注意力机制有效融合了结构（ECV）与功能（多期相）特征以及临床变量，使模型能够学习到跨模态的、与侵袭性行为高度相关的影像模式。Grad‑CAM可视化进一步证实，模型重点关注不规则肿瘤边缘、瘤周强化区和瘤内高激活区域——这些区域在病理学上正是EMT活跃、微血管密度增高、ECM重构显著的部位，与MVI的生物学特征高度一致。值得强调的是，仅使用ECV的模型（DL‑ECV）在多中心测试中表现与多期相模型相当，提示ECV本身已蕴含丰富的微环境信息，可作为低成本、无辐射、无需额外扫描时间的生物学标志物。此外，模型对早期复发（侵袭驱动）和晚期复发（新生肿瘤驱动）的分层能力均优于病理MVI，原因在于病理MVI仅反映单一时间点的侵袭状态，而DL‑TriFusion整合了反映肿瘤固有侵袭性（ECV、边缘、瘤周强化）和肝脏背景（肝硬化、病毒状态）的多维信息，从而实现了更全面的复发风险预测。尽管存在回顾性设计、手动分割、以HBV人群为主等局限性，但本研究通过多中心外部验证、亚组分析、可解释性可视化等手段，将深度学习模型从“黑箱预测”提升为机制可解释的影像生物标志物，为影像组学与肿瘤生物学的交叉研究提供了范式参考。

这篇文献的可借鉴思路

这篇文献为影像组学/深度学习研究提供了多条可迁移的方法学思路，尤其适用于希望将预测模型挂靠生物学机制的研究者。第一，选择具有明确生物学意义的影像替代指标。本研究未盲目堆砌影像特征，而是精准选择了ECV——一个能够定量反映细胞外基质、微血管密度和纤维化的成熟参数，并论证了其与MVI微环境改变的关联。研究者可借鉴此思路，在其他实体瘤（如胃癌、胰腺癌、结直肠癌肝转移）中探索ECV或其他生理参数（如ADC、Ktrans、T1 mapping）作为微环境标志物。第二，多模态融合策略。本研究通过Transformer的自注意力机制融合了结构影像（ECV）、功能影像（多期相）和临床变量，比简单拼接或加权平均更有效地捕捉跨模态交互。未来研究可借鉴此架构，用于影像‑病理‑基因组学的多组学融合。第三，将复发分为早期（侵袭相关）和晚期（新生相关）进行分层分析，这有助于机制解耦——即明确模型预测的是肿瘤内在侵袭性还是肝脏背景风险，从而提升临床解释力。第四，Grad‑CAM可视化作为机制验证工具。本研究不仅用Grad‑CAM展示模型关注区域，还将这些区域与已知的病理特征（不规则边缘、瘤周强化）进行生物学关联，增强了审稿人和临床医生对模型的信任。任何影像预测模型都应包含此类可解释性分析，否则难以论证其生物学合理性。第五，多中心外部验证 + 亚组分析。本研究在HBV阳性/阴性、不同分化程度、不同中心亚组中均验证了模型稳定性，证明了其跨人群的泛化能力。第六，对比病理金标准与模型预测的预后价值。本研究直接证明模型预后优于病理MVI，这是影像替代指标超越传统诊断的有力证据，可作为类似研究的设计模板。第七，开源代码与数据共享计划，提升可重复性。总之，这篇文献展示了如何从临床问题出发，选择生物学相关的影像指标，设计多模态融合模型，并通过可视化手段验证机制合理性——这一完整链条可广泛应用于肿瘤影像‑机制研究中。

结语

总而言之，这篇文献给我们展示了影像组学“从表型到机制”的完整范式：不满足于高AUC，而是用ECV去量化细胞外基质和微血管密度，用多期相MRI去捕捉血管生成和血流动力学，用Grad‑CAM去验证模型关注的就是那些不规则边缘、瘤周强化的侵袭性区域。每一步都在回答“为什么这个影像特征能预测MVI”，而不是仅仅“能不能预测”。做影像组学研究，拼的不只是模型精度，更是特征的可解释性和机制的合理性。只有把宏观影像和微观病理、细胞、分子真正打通，我们的成果才不会沦为“玄学计算”，而是有机制根基、有临床价值、能真正指导治疗决策的真科学。希望大家以后都能少走弯路，学会给自己的影像特征找“生物学娘家”，轻松写出有深度、能高分发表的好文章！

参考文献Li F, Liu R, Cao JM, Lin P, Feng X, Xie Y, Xiang Y, Li HW, Zhang J, Qu H, Ning G, Zhuo L. Integrating multiphase MRI surrogates to improve microvascular invasion detection and recurrence risk stratification in HCC. JHEP Rep. 2025 Nov 20;8(2):101682. doi: 10.1016/j.jhepr.2025.101682.

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

AI耳机哪个牌子好？EARWEISS听智慧凭硬核技术脱颖而出

区别于外购芯片、贴牌组装的普通厂商，听智慧全产品线AI功能原生内置，全机型一站式接入Deepseek、豆包等七大主流AI大模型，无需单独下载各类AI软件，语音、文字双模式随时交互，后续依托 OTA 在线持续更新AI能力，从底层规避市面耳机AI卡顿、功能闲置的通病。在AI耳机同质化严重的市场环境中，依托真定制核心技术的听智慧，跳出参数内卷，用个体化定制 + 落地化AI功能，成为当下高端AI耳机的优质