01

文献学习

图片

今天分享的文献是由浙江大学医学院附属第一医院苏新辉、刘华锋教授等团队于2026年5月19日在《European Journal of Nuclear Medicine and Molecular Imaging》(中科院1区top,IF=7.6)上发表的研究“An interpretable machine learning model integrating [18F]FDG PET-CT radiomics and clinical features for predicting perforation following chemotherapy in gastrointestinal lymphoma: a multicenter study”即整合 [18F]FDG PET-CT 放射组学与临床特征的可解释机器学习模型用于预测胃肠道淋巴瘤化疗后穿孔:一项多中心研究,该研究旨在开发一种可解释的机器学习模型,结合临床特征与 [18F]FDG PET/CT 放射组学特征,预测胃肠道淋巴瘤患者化疗后穿孔(PFCGL)。研究纳入257例多中心患者,使用五种机器学习算法构建模型,并通过SHAP方法提高模型可解释性。结果显示,结合临床与PET/CT放射组学的逻辑回归模型表现最优,AUC在训练、内部验证和外部验证中分别达到0.918、0.858和0.852。

创新点:①首次融合 [18F]FDG PET/CT 影像组学与临床特征,构建化疗后胃肠道淋巴瘤穿孔预测模型,填补领域空白。②多中心验证下对比5种机器学习算法,发现ExtraTrees与XGBoost表现最优,且引入SHAP可解释性分析。揭示影像组学特征贡献度远超传统PET参数(SUVmax等),是预测穿孔的最关键因素

临床价值:①提供可视化诺模图,实现个体化风险概率预测,指导预防性手术或密切监测策略的制定。②显著优于传统PET指标,早期识别高危患者,避免化疗后致命性穿孔及腹膜炎等严重并发症。③多中心外部验证保证模型泛化能力,可无缝整合入临床决策流程,优化医疗资源分配

图片

图 1:研究整体工作流程图

02

研究背景和目的

研究背景

胃肠道淋巴瘤化疗后穿孔(PFCGL)是一种罕见但极其危重且危及生命的并发症,其发生率约为9%,常表现为急性腹痛、腹胀、恶心呕吐等症状,严重影响患者预后并延长治疗周期。PFCGL的发生机制十分复杂,涉及化疗药物诱导的肿瘤细胞凋亡与坏死、局部炎症反应加剧、肠道壁微循环障碍及结构完整性破坏等多重病理生理过程。尽管已有研究表明T细胞表型、小肠受累(尤其是回肠和空肠)、深大溃疡及高肿瘤负荷是PFCGL的潜在危险因素,但临床实践中仍依赖经验性判断,难以在个体层面精准预测穿孔风险。与此同时,[18F]FDG PET/CT作为胃肠道淋巴瘤诊疗中的常用影像工具,不仅能显示肿瘤代谢活性,其影像组学特征(如熵、不均匀性、纹理特征)还可揭示肿瘤内部的代谢异质性和侵袭模式,这些特征与化疗后坏死、炎症反应及肠壁破坏密切相关。然而,目前尚缺乏能够整合多维信息、提供个体化风险概率的预测工具。因此,构建一个结合临床、病理与影像组学数据的可解释机器学习模型,对于优化化疗前风险评估、制定个体化治疗策略、改善患者生存具有重要的临床意义和紧迫性。

研究目的

本研究旨在开发并验证一个基于[18F]FDG PET/CT影像组学特征与临床病理特征的机器学习模型,用于在化疗前预测胃肠道淋巴瘤患者发生化疗后穿孔(PFCGL)的个体化风险。为实现这一目标,研究团队回顾性收集了两家医院共257例确诊患者的临床资料与PET/CT影像数据,从中提取FDG高摄取区域的影像组学特征,并整合临床变量(如CRP水平、病理类型等),采用五种机器学习算法(逻辑回归、支持向量机、随机森林、ExtraTrees、XGBoost)构建三类预测模型:仅临床特征模型、仅PET/CT影像组学模型以及两者结合的联合模型。研究进一步引入SHAP(SHapley Additive exPlanations)可解释性分析方法,以揭示各特征对预测结果的贡献程度,增强模型的临床可接受性。通过内部训练、内部验证及外部验证三组队列的严格评估,最终目标是筛选出最优算法与特征组合,形成一个可视化的诺模图(nomogram),为临床医生提供一种直观、可操作、个体化的风险评估工具,从而在化疗前识别高危患者,指导早期干预(如加强监测或预防性手术),最终改善患者预后并优化医疗资源配置。

03

数据和方法

研究数据

总样本量:257例患者

来源:两家医院(浙江大学医学院附属第一医院 + 国际医疗中心)

分组

内部训练集:144例(穿孔22例)

内部验证集:63例(穿孔11例)

外部验证集:50例(穿孔11例)

纳入标准:病理确诊、基线PET/CT、接受化疗

排除标准:数据不全、失访、既往恶性肿瘤史

技术方法

特征提取

临床特征:年龄、性别、B症状、LDH、β2-MG、CRP、IPI、ECOG PS、Ann Arbor分期、病理类型、Ki-67、SUVmax、MTV、TLG

PET/CT放射组学特征:7类(HISTOGRAM, BASED, GLCM, GLSZM, MORPHOLOGICAL, GLRLM, NGTDM)

特征筛选:Z-score标准化 + Pearson相关(阈值0.9)+ LASSO回归

建模算法:LR、SVM、RandomForest、ExtraTrees、XGBoost

模型评估:AUC、敏感性、特异性、校准曲线、DCA曲线、IDI分析

可解释性:SHAP值(全局 + 局部)

04

实验结果

独立临床风险因素:CRP升高、T细胞型非霍奇金淋巴瘤(T-NHL)

最佳临床模型:ExtraTrees(AUC:训练0.872,内部验证0.795,外部验证0.770)

最佳放射组学模型:ExtraTrees(AUC:训练0.857,内部验证0.849,外部验证0.807)

最佳组合模型(临床 + PET/CT):LR算法

训练集AUC:0.918

内部验证AUC:0.858

外部验证AUC:0.852

SHAP分析:放射组学特征贡献最大(平均SHAP值1.77),其次为CRP(0.65)和病理类型(0.52)

图片

图 2:手工特征的分类、选择与Rad-score分布

图2包含六个子图。A和B展示了提取的7类118个放射组学特征的数目与比例,包括直方图、GLCM、GLSZM等。C显示了各特征的P值分布,用于初步筛选。D和E展示了10折交叉验证中LASSO回归的系数路径与均方误差(MSE)随正则化参数λ的变化,最终选出非零系数的特征构建Rad-score。F为Rad-score直方图,显示穿孔组与非穿孔组的分数分布存在明显差异,表明放射组学特征能有效区分两组患者

图片

图 3:临床模型与PET/CT放射组学模型的ROC曲线比较

图3分为左右两半:左侧(A、B、C)为临床模型在训练、内部验证、外部验证队列中的ROC曲线,右侧(D、E、F)为放射组学模型的相应结果。图中绘制了五种机器学习算法(LR、SVM、随机森林、ExtraTrees、XGBoost)的ROC曲线。在临床模型中,ExtraTrees表现最佳(AUC最高达0.872);在放射组学模型中,XGBoost和ExtraTrees在验证队列中AUC保持稳定(约0.83-0.85),证明其良好的泛化性能。曲线越靠近左上角,模型判别能力越强。

图片

图 4:SHAP模型可解释性分析

图4通过SHAP值解释联合模型的特征贡献。A为条形图,显示放射组学特征的平均SHAP值最高(1.77),其次是CRP(0.65)和病理类型(0.52),表明放射组学特征对预测贡献最大B为散点图,横轴为特征值,纵轴为SHAP值,可见放射组学特征值越高,SHAP值越正,预示穿孔风险增加。C和D为瀑布图与力力图,分别展示高、低风险个体中各特征如何推动预测值从基线向风险概率演变,实现个体化预测解释

图片

图 5:联合模型与独立模型的ROC比较及IDI分析

图5的A、B、C分别展示了在训练、内部验证、外部验证队列中,临床模型、放射组学模型、联合模型三者ROC曲线的对比。联合模型(LR算法)的AUC在各队列中均最高(训练0.918、内部验证0.858、外部验证0.852),曲线显著左上方偏移。D、E、F为综合判别改善指数(IDI)分析,显示在训练集和内部验证集中,联合模型较另两个模型的IDI改善具有统计学意义(p<0.05),而在外部验证集中虽有提升但未达显著,提示多模态整合带来的增量价值需更大样本验证

图片

图 6:校准曲线与决策曲线分析

图6的A、B、C为联合模型的校准曲线,横轴为预测概率,纵轴为实际概率,虚线代表完美校准。各队列中校准曲线与对角线接近,且Hosmer-Lemeshow检验P值分别为0.572(训练)、0.320(内部验证)、0.633(外部验证),均大于0.05,表明模型校准良好。D、E、F为决策曲线,纵轴为净获益,横轴为阈值概率。联合模型(红色曲线)在较宽的阈值范围内(训练:0.0-1.0;内部:0.0-0.88;外部:0.0-0.92)净获益最高,说明该模型在临床决策中能带来最大的患者获益,优于单一模型。

图片

图 7:联合模型的列线图可视化

图7将最终选定的临床-PET/CT联合模型(LR算法)转化为临床可用的列线图。图中上方为评分标尺,中间列出三个预测因子:CRP水平(mg/L)、病理类型(T-NHL vs 非T-NHL)、PET/CT放射组学Rad-score。每个因子对应不同的分值,总分累加后映射到下方的穿孔风险概率轴。临床医生可通过输入患者的具体数值,快速估算个体化的化疗后胃肠穿孔风险,从而辅助制定预防或监测策略。列线图直观、简便,是模型临床转化的重要工具。

05

研究结论

该研究通过整合[18F]FDG PET/CT影像组学特征与临床指标,构建了预测胃肠道淋巴瘤化疗后穿孔(PFCGL)的机器学习模型,得出以下关键结论:临床独立危险因素包括C反应蛋白水平升高T细胞非霍奇金淋巴瘤亚型;而传统PET代谢参数(如SUVmax、MTV、TLG)预测效能有限。相比之下,影像组学特征能更好地捕捉肿瘤内部异质性及肠壁结构破坏信息,在模型中贡献最大(SHAP平均值为1.77)。采用逻辑回归算法构建的临床-PET/CT联合模型表现出最优且稳定的预测性能,在训练集、内部验证集和外部验证集中的曲线下面积分别达到0.918、0.858和0.852,显著优于单独的临床模型或影像组学模型。校准曲线和决策曲线分析进一步证实该模型具有良好的校准度和临床净收益。可视化列线图的建立为临床提供了一种个体化、可操作的风险评估工具,有助于在化疗前识别高风险患者,从而优化治疗决策。尽管研究存在回顾性设计、样本量有限等局限,但该模型为PFCGL的早期预测提供了创新且可解释的解决方案。


参考文献:Chen D, Li T, Cui J, Yang C, Liu Z, Huang H, Liu H, Su X. An interpretable machine learning model integrating [18F]FDG PET/CT radiomics and clinical features for predicting perforation following chemotherapy in gastrointestinal lymphoma: a multicenter study. Eur J Nucl Med Mol Imaging. 2026 May 19. doi: 10.1007/s00259-026-07921-3.

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐