如何将影像组学特征与瘤内微生物组丰度建立关联，并进一步解释其与乳腺癌新辅助治疗后肿瘤退缩模式、保乳手术适应性的机制联系

AI医影跨模态组学

1146人浏览 · 2026-04-21 14:30:51

AI医影跨模态组学 · 2026-04-21 14:30:51 发布

导语

各位同学，大家好。做影像组学最怕什么？怕的是模型AUC刷得挺高，一问“这特征到底代表啥”就哑口无言——活脱脱一个“黑箱算命先生”。今天这篇文献教了我们一招绝活：给影像特征找“生物学娘家”。人家不满足于单纯预测肿瘤退缩模式，而是硬生生把瘤内微生物组丰度这个看不见摸不着的微观变量，通过Spearman相关约束+组织学验证，牢牢挂靠到了MRI影像特征上。结果呢？模型不仅能告诉你“同心圆退缩还是非同心圆退缩”，还能理直气壮地说：“因为我捕捉到了微生物组的效应”。这才是从“算得准”升级到“讲得清”的正确姿势。下面咱们就拆解一下，这篇研究是怎么把影像组学、深度学习和微生物组串成一条完整的机制故事链的。

★题目：Intratumoral Microbiome–related MRI Model for Predicting Breast Cancer Shrinkage Pattern Following Neoadjuvant Therapy

（基于肿瘤内微生物组的MRI模型预测乳腺癌新辅助治疗后肿瘤萎缩模式）

★期刊：《Radiology》（中科院1区，IF=15.2）

★研究疾病：乳腺癌（breast cancer）

★生物学机制：瘤内微生物组

★发表时间：2025年8月

研究背景-从 “临床问题” 落到 “生物学问题”

乳腺癌是女性最常见的恶性肿瘤，新辅助治疗（NAT）后肿瘤的退缩模式（TSP）直接决定保乳手术的可行性与患者的远期预后。临床上，同心圆退缩意味着肿瘤向心性缩小，边界清晰，适合完整切除；而非同心圆退缩则常伴有散在残留灶，术后局部复发和远处转移风险显著升高。然而，目前缺乏能够在术前准确预测TSP的非侵入性生物标志物，导致部分本可接受保乳手术的患者被迫接受全乳切除，或反之，术后切缘阳性、需二次手术。MRI作为NAT疗效评估的核心影像手段，可提供丰富的形态与动力学信息，但传统影像评估依赖主观经验，难以捕捉肿瘤内部的异质性变化。近年来，影像组学和深度学习通过提取高通量定量特征，在一定程度上提升了预测能力，但仍将肿瘤视为均质整体，忽视了肿瘤微环境的动态演变。更为关键的是，瘤内微生物组已被证实可调节局部免疫应答、影响化疗敏感性，但其在TSP形成中的具体作用尚未被纳入影像建模。微生物组与影像表型之间的内在联系——即微生物代谢活动如何改变肿瘤灌注、坏死、纤维化等可被MRI捕获的特征——至今缺乏系统研究。因此，如何将瘤内微生物组这一生物学机制“挂靠”到MRI影像特征上，从而构建具有生物学可解释性的TSP预测模型，成为亟待解决的科学问题与临床需求。

研究目的（明确写出“三层目的”）

本研究旨在开发并验证一个与瘤内微生物组相关的MRI预测模型，用于精准预测乳腺癌患者NAT后的肿瘤退缩模式，进而为保乳手术决策提供客观依据。具体而言，本研究包含三个层次的目标：第一，临床目标——构建一个能够在多中心、大样本数据中稳定预测同心圆退缩与非同心圆退缩的融合模型，其预测性能（AUC）显著优于仅基于单一时间点或单一模态的模型，并在不同分子亚型和临床分期中保持鲁棒性，最终辅助临床医生在术前判断患者是否适合保乳手术。第二，技术目标——整合三维U-Net自动分割、habitat影像组学、ResNet-50深度学习特征以及纵向（治疗前、治疗中）MRI数据，通过特征筛选流程（ICC、Mann-Whitney U、Spearman相关、LASSO、Boruta）筛选出最具预测效能的影像特征，并证明这些特征彼此独立、互补，能够全面刻画肿瘤异质性。第三，机制目标——建立影像特征与瘤内微生物组丰度之间的定量关联，通过组织学验证（LPS免疫组化、16S rDNA荧光原位杂交）和分子生物学验证（16S rDNA PCR），证实模型所选特征确实反映了微生物组的真实丰度差异，从而赋予模型生物学可解释性，避免“黑箱”困境，为后续临床转化奠定理论基础。

研究思路（最核心：怎么挂靠机制）

本研究的核心思路是以“瘤内微生物组”为生物学桥梁，将影像表型与治疗反应机制挂靠，实现从“数据驱动”到“机制驱动”的跨越。具体流程分为四个环节：第一，影像数据与微生物组数据的并行采集——纳入12个中心2249例患者，获取治疗前及治疗中（mid-NAT）动态增强MRI，同时对手术标本进行16S rDNA定量PCR、LPS免疫组化和FISH，测定瘤内微生物组丰度。第二，影像特征的机制导向筛选——先通过三维U-Net自动分割肿瘤，再提取habitat radiomic（7338个）和ResNet-50（4096个）特征；关键步骤是仅保留与微生物组丰度显著相关（Spearman r > 0.8，P < 0.05）的特征，确保后续建模的输入特征具有生物学依据，而非纯粹统计学关联。第三，融合模型构建与验证——采用集成学习将筛选出的微生物组相关影像特征与临床病理因素融合，训练预测TSP的二分类模型；分别在内部验证集（335例）和外部验证集（1243例）中评估性能，并与单时间点模型（pre-NAT habitat、mid-NAT habitat、pre-NAT ResNet-50、mid-NAT ResNet-50）进行严格对比（DeLong检验）。第四，机制解释与验证——使用SHAP分析量化每个影像特征对预测的贡献，确认其独立预测价值；进一步通过组织学图像（图4）直接展示同心圆退缩患者中微生物组信号（LPS、16S rDNA）显著增强，而非同心圆退缩患者信号微弱，从而将影像模型的输出反推到微生物组丰度差异，完整闭合“影像特征—微生物组—退缩模式”的因果链条。这一思路的关键创新在于：不是将微生物组数据直接作为模型输入（成本高、临床不可及），而是通过影像特征间接、高效地捕捉其生物学效应，兼具可推广性与可解释性。

数据和方法（机制部分怎么设计）

数据：本研究回顾性纳入来自12个中心的2249例乳腺癌女性患者（中位年龄49岁），其中机构I–II按2:1随机分为训练集（671例）和内部验证集（335例），机构III–XII的1243例作为外部验证集；训练集用于模型开发，内部验证集用于调参与初步验证，外部验证集用于独立评估泛化能力。

图 1：患者筛选流程图

方法：预处理（信号归一化、体素重采样至1mm³、N4偏置校正）→ 3D U‑Net自动分割肿瘤 → k‑means聚类生成habitat亚区 → 提取habitat影像组学特征（7338个）和ResNet‑50深度学习特征（4096个） → 特征筛选：ICC>0.8 → Mann‑Whitney U检验（P<0.05） → Spearman相关筛选与瘤内微生物组丰度显著相关（r>0.8, P<0.05） → LASSO降维 → Boruta算法（最终保留11个habitat和11个DL特征） → 构建四个单时间点模型（pre‑NAT habitat, mid‑NAT habitat, pre‑NAT ResNet‑50, mid‑NAT ResNet‑50）和一个融合模型（集成学习整合影像特征与临床因素） → 在三个数据集中评估AUC、准确率、敏感度、特异度（DeLong检验比较模型） → 决策曲线分析临床净收益 → SHAP解释特征贡献 → 组织学验证（16S rDNA PCR、LPS免疫组化、FISH）确认微生物组丰度与TSP关联。

图 2：研究整体工作流程图

研究结果（”从表型到机制“）

1. 患者与分割性能：2249例患者中，同心圆退缩占55%。三维U‑Net在训练、内部验证、外部验证集的Dice系数分别为0.96、0.92、0.91（mid‑NAT为0.96、0.90、0.88），自动分割与手动分割高度一致。

2. 特征筛选结果：从7338个habitat和4096个DL特征中，经ICC、Mann‑Whitney U、Spearman相关、LASSO及Boruta逐步筛选，最终保留11个habitat特征和11个DL特征，均与瘤内微生物组丰度显著相关（Spearman r>0.8，P<0.05）。

3. 融合模型预测性能：在内部验证集中，融合模型AUC为0.89（95%CI:0.85‑0.93），显著优于四个单时间点模型（AUC 0.80‑0.83，均P<0.05）；外部验证集AUC为0.87（0.85‑0.89），同样优于单时间点模型（0.74‑0.81，均P<0.001），且在各分子亚型和肿瘤分期中保持稳定（AUC 0.84‑0.91）。

图 3（混淆矩阵与特征相关性）：该图包含两个核心部分：上方为融合模型在训练、内部验证、外部验证集中的混淆矩阵，显示准确率分别为89.9%、83.3%、79.2%，证明模型临床可靠性；下方为Spearman相关性热图，展示最终保留的11个habitat特征和11个DL特征与瘤内微生物组丰度之间均呈强正相关（r > 0.8，P < 0.05），且各特征彼此独立。机制挂靠体现在：影像特征与微生物组丰度的强相关性是模型预测TSP的生物学基础——模型并非“黑箱”拟合，而是通过影像间接捕获了微生物组的效应。

4. 微生物组组织学验证：同心圆退缩患者的16S rDNA PCR定量、LPS免疫组化平均强度（16.7 vs 3.9）及FISH微生物信号（500.9 vs 184.2）均显著高于非同心圆退缩患者（均P<0.001），直接证实瘤内微生物组丰度与同心圆退缩强相关。

5. 模型可解释性：SHAP分析显示所有入选特征均独立贡献于TSP预测，且彼此无强共线性；代表性病例影像（图4）直观展示了同心圆退缩肿瘤呈现致密、向心性强化，伴丰富微生物信号，而非同心圆退缩肿瘤呈散在、不规则强化，微生物信号稀疏。

图 4（代表性病例影像与病理对照）：该图左右并列展示两例患者：左侧为非同心圆退缩病例（50岁，HER2+），LPS免疫组化呈微弱棕色染色，FISH显示稀疏红色16S rDNA信号，MRI呈散在、不规则强化；右侧为同心圆退缩病例（45岁，三阴性），LPS呈强阳性棕染，FISH显示密集红色信号，MRI呈致密、向心性退缩。该图最直观地体现了机制挂靠：高微生物组丰度（LPS/FISH强阳性）对应同心圆退缩及典型影像特征，而低丰度对应非同心圆退缩及散在强化，从而将影像表型、微生物组丰度和治疗反应三者直接关联。

讨论（把机制故事讲圆）

本研究成功构建了一个与瘤内微生物组相关的MRI融合模型，能够准确预测乳腺癌新辅助治疗后的肿瘤退缩模式。该模型的优势不仅在于预测性能优越（内部验证AUC 0.89，外部验证AUC 0.87），更在于其生物学可解释性——我们通过严格的特征筛选流程，仅保留与瘤内微生物组丰度显著相关的影像特征，并在组织学层面（16S rDNA、LPS、FISH）直接证实了这种关联。这回答了“为什么影像能预测退缩模式”这一核心机制问题：微生物组通过调节局部免疫应答和肿瘤微环境（如改变灌注、坏死、纤维化程度），这些变化可被动态增强MRI捕获，进而表现为特定的影像组学和深度学习特征。与既往仅追求更高AUC的“黑箱”模型不同，我们的研究刻意将微生物组作为“生物学桥梁”，使得模型输出（同心圆vs 非同心圆退缩）可回溯到微生物丰度差异，从而增强了临床医生的信任度。值得注意的是，同心圆退缩患者中微生物组丰度显著更高，提示某些菌群（如产脂多糖的革兰阴性菌）可能通过激活Toll样受体通路、招募CD8+ T细胞，促进肿瘤向心性退缩。相反，非同心圆退缩患者微生物组匮乏，肿瘤异质性更突出，残留灶分散，术后复发风险增高。这一发现也为未来的微生物组调节疗法（如益生菌、粪菌移植）联合新辅助治疗提供了理论依据。当然，本研究也存在局限性：仅纳入中国人群，未包含多参数MRI或超声，且为二分类模型（未能区分进展性疾病）。但总体而言，本研究展示了一条可复用的路径——将“不可直接测量的生物学变量”通过影像特征间接建模，既保持了模型的临床可推广性，又赋予了其机制内涵。未来需开展前瞻性干预研究，验证该模型在真实手术决策中的临床效益。

这篇文献的可借鉴思路

本研究的最大借鉴价值在于影像组学如何“挂靠”生物学机制，而非停留在纯数据驱动的预测。具体可复用的思路包括：第一，以“生物学桥梁”为特征筛选的强制性标准。多数研究仅使用统计显著性（如P<0.05）或预测效能（如LASSO）筛选特征，而本研究增加了“与瘤内微生物组丰度显著相关（r>0.8）”这一生物学约束，确保模型输入特征具有机制内涵。这可以推广到任何有配对组织学或分子数据的研究中——例如，若预测免疫治疗响应，可强制影像特征与肿瘤浸润淋巴细胞密度、PD-L1表达或TMB相关。第二，纵向MRI+多模态融合的建模框架。本研究同时使用治疗前和治疗中MRI，并整合habitat影像组学（刻画肿瘤内空间异质性）与ResNet-50深度学习特征（捕捉全局形态模式），这种互补性设计显著提升了预测鲁棒性。第三，“间接建模”策略——不直接输入昂贵的、临床难以常规获取的生物标志物（如微生物组测序），而是通过影像特征学习其下游表型效应。这一策略极大降低了模型落地成本，同时保留了生物学解释力。第四，多层次的机制验证闭环：从影像特征筛选时的统计关联，到SHAP解释的独立贡献，再到组织学（IHC、FISH）和分子生物学（qPCR）的直接验证，形成了完整的“影像—机制—表型”证据链。第五，清晰定义临床相关的终点——将病理评估转化为二分类的“同心圆退缩 vs 非同心圆退缩”，直接对接保乳手术决策，使模型输出具有明确的临床操作价值。总之，对于希望做“有机制内涵的影像组学”的研究者，本文提供了一个从问题定义、特征筛选、模型构建到机制验证的完整范式，尤其适合在免疫微环境、代谢微环境、微生物组、缺氧、血管生成等可被影像间接反映的生物学领域推广。

结语

总而言之，这篇文献给我们最大的启发是：影像组学的终极目标不是炫技，而是对话——让宏观图像和微观病理、微生物、免疫通路对上话。别再只满足于“提特征→建模型→算AUC”的三板斧了。学学人家的思路：先找一个有生物学意义的“桥梁变量”（比如微生物组、免疫浸润、代谢酶），然后在特征筛选中强制加上“与该变量显著相关”的硬约束，最后用组织学或分子实验把证据链闭合。这样做出来的模型，既有预测力，又有解释力，审稿人看了都得点赞。希望大家以后都能告别“黑箱算命”，做出有血有肉、能讲好疾病故事的高分影像组学研究！

参考文献：Huang Y, Song X, Chen Y, Qiu H, Zhou T, Wang S, Zhou Y, Li W, Lin Y, Wang Q, Gu W, Zhu T, Wang K. Intratumoral Microbiome-related MRI Model for Predicting Breast Cancer Shrinkage Pattern Following Neoadjuvant Therapy. Radiology. 2025 Aug;316(2):e243545. doi: 10.1148/radiol.243545.

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

企业评估 Agent 成熟度的五级模型

智能Agent：是指能够感知环境、做出决策并采取行动以实现特定目标的计算机系统。它具有自主性、反应性、主动性和社交能力等特征。成熟度模型：是一种框架，用于描述一个实体（如组织、系统或过程）从初始状态到优化状态的演进路径。它通常由多个离散的级别组成，每个级别代表一组特定的能力和特征。Agent成熟度：指的是Agent系统在自主性、适应性、协作性、学习能力和可靠性等关键维度上的发展水平。在深入探讨上下

AtomGit开源社区

【EI复现】基于元模型优化算法的主从博弈多虚拟电厂动态定价和能量管理(Matlab代码实现）

基于元模型的优化算法是一种基于历史数据来驱动样本点的加入从而逼近局部或全局最优解的优化机制，能够改善传统启发式智能算法需要繁复数值模拟的缺陷，目前在飞行器设计等航空航天领域的应用[20]最为广泛，在电力系统方面也有初步的应用。提出基于 Kriging 元模型的博弈均衡算法，在求解过程中建立 Kriging 元模型替代 VPP 内部的能量管理模型，利用粒子群优化算法搜索优异采样点，更新修正 Krig