哈尔滨医科大学附属第二医院成果:栖息地感知影像组学与自适应2.5D深度学习预测食管鳞癌NACI疗效及长期生存
01
文献信息

本次分享的文献是由哈尔滨医科大学附属第二医院超声科冷晓萍教授团队联合西安交通大学第一附属医院等多中心团队近日(2025年9月17日)在核医学与分子影像领域顶级期刊《Eur J Nucl Med Mol Imaging》(中科院1区,IF=7.6)上发表的研究“Habitat-aware radiomics and adaptive 2.5D deep learning predict treatment response and long-term survival in ESCC patients undergoing neoadjuvant chemoimmunotherapy”即栖息地感知放射组学与自适应2.5D深度学习预测接受新辅助化疗免疫治疗的食管鳞癌(ESCC)患者的治疗反应及长期生存,该研究为双中心回顾性研究,纳入269例未接受治疗的局部晚期ESCC患者(训练集n=144、验证集n=62、外部测试集n=63),基于基线PET/CT影像,开发整合“栖息地放射组学+2.5D深度学习(多实例学习MIL)+临床变量”的多模态框架,用于预测患者接受新辅助化疗免疫治疗(NACI)后的病理完全缓解(pCR)和总生存期(OS)。

图1(研究工作流程图):分A(分析流程)、B(临床验证)两部分。A展示“图像预处理→栖息地影像组学/2.5D 深度学习→特征融合→可解释性分析→疗效/生存预测”全链路;B通过2例患者(pCRvs非pCR)的PET/CT影像、ITH指数及预测概率,直观呈现模型临床应用场景。
02
研究背景及目标
研究背景
-
疾病负担:ESCC是高度侵袭性肿瘤,晚期患者5年生存率低于20%,NACI(化疗+免疫检查点抑制剂)可改善可切除性,但仅30-40%患者达pCR,疗效异质性显著。
-
现有困境:传统生物标志物(内镜活检、PET代谢参数如SUVmax)无法捕捉肿瘤空间异质性(ITH)——ITH是治疗耐药的关键驱动因素,导致临床无法精准分层患者,易出现“过度治疗(免疫不良反应)”或“治疗不足(疾病进展)”。
-
技术瓶颈:传统放射组学存在协议敏感性高、可解释性差、无法解析亚区域生物学特征;2D CNN丢失跨平面信息,3D CNN计算量大且易过拟合(医疗数据量有限)。
研究目标
-
通过体素级栖息地放射组学定量绘制肿瘤内/肿瘤周围异质性,解决传统放射组学ITH解析不足的问题;
-
利用2.5D 深度学习建模肿瘤横截面生物学特征,平衡3D空间信息保留与计算效率;
-
通过SHAP可解释性分析建立机制驱动的生物标志物,识别耐药相关肿瘤亚区域;
-
整合多模态数据,实现ESCC患者NACI治疗反应(pCR)和长期生存(OS)的精准预测与分层。
03
数据和方法
研究数据
数据来源与分组
总样本量:269例未治疗ESCC患者(双中心);
训练集(n=144)、验证集(n=62):均来自西安交通大学第一附属医院;
外部测试集(n=63):来自哈尔滨医科大学附属第二医院(独立验证,保证泛化性)。
纳入与排除标准
纳入标准:①组织学确诊ESCC;②局部晚期;③有基线PET/CT;④NACI后4-6周手术;⑤随访≥6个月;⑥临床病理资料完整。
排除标准:①既往恶性肿瘤;②远处转移(M1);③既往抗肿瘤/抗炎治疗;④图像质量差。
治疗与随访方案
NACI方案:帕博利珠单抗+铂类化疗,共3周期;
疗效评估:术后病理评估pCR;
随访:术后2年每季度随访,计算总生存期(OS,从治疗开始至死亡/末次随访)。
技术方法
影像预处理与肿瘤分割
预处理:PET/CT重采样至1×1×1mm³(三阶B样条插值,保留>95%放射组学特征方差);PET按肝实质(右肝3cm³ROI)Z-score归一化;CT窗宽40HU、窗位300HU(标准化软组织对比度);2.5D模型提取最大肿瘤截面±1/±2/±4层,训练集数据增强(旋转±15°、缩放±10%、翻转),验证/测试集仅中心裁剪至224×224像素。
分割:两位放射科医生(12年、15年经验)手动分割肿瘤及瘤周区域,分歧(体积差>5%或视觉争议)由资深医生(>20年经验)仲裁,最终Dice相似系数(DSC)>0.85(远超放射组学推荐阈值0.7-0.8),确保特征提取可靠性。
栖息地放射组学分析
栖息地划分:5×5×5体素滑动窗计算局部放射组学特征(强度、纹理、空间异质性),K-means聚类(Calinski-Harabasz指数优化,量化簇内紧凑度与簇间分离度),确定3个肿瘤亚区域:
H1:高代谢坏死周围区;H2:中代谢肿瘤侵袭前沿;H3:低代谢基质/坏死区(经病理代谢特征验证,见补充图1)。
特征提取与选择:PyRadiomics(符合IBSI标准)提取1834个特征/模态(形状、一阶强度、纹理如GLCM/GLRLM),多阶段筛选:
单变量过滤(正态用t检验,非正态用Mann-WhitneyU,P<0.05);
Pearson相关过滤(r≥0.8,去共线性);
mRMR(最小冗余最大相关性,保留高关联低冗余特征);
LASSO回归(10折交叉验证,λ=0.01),最终选32个鉴别特征。
2.5D深度学习模型
骨干网络:ResNet50(ImageNet预训练),PET/CT分通道输入,新增MixUp通道(PET与CT元素级平均)实现多模态融合,解决代谢-结构信息discordance。
多实例学习(MIL):将切片级特征转化为患者级预测,采用两种策略:
预测概率直方图(10bin分布,编码空间异质性);
TF-IDF加权词袋(优先高鉴别性切片特征);
分类器优化:对比SVM(径向基核)、ExtraTrees(Giniimpurity)、RandomForest(200棵树),SMOTE(k=5)解决类别不平衡,5折交叉验证优化超参数。
模型整合与评估
多模态整合:融合“栖息地特征+MIL特征+临床变量(如分期、SUVmax)”,构建5分类器集成模型+Crossformer架构。
评估指标:
诊断性能:AUC、灵敏度、特异度、DeLong检验(AUC差异显著性);
校准性能:Hosmer-Lemeshow检验(P>0.05为校准良好)、校准曲线;
预后性能:C指数(生存预测区分度)、Kaplan-Meier分析(高低风险组生存差异);
临床实用性:决策曲线分析(DCA,计算不同阈值下净获益);
可解释性:SHAP(量化特征贡献)、Grad-CAM(可视化模型注意力区域)。
04
实验结果图

图2(栖息地聚类优化图):A图为Calinski-Harabasz(CH)指数曲线,聚类数=3时CH指数最高,确定最优肿瘤亚区域划分;B、C图为PET/CT代表性影像,彩色标注H1(高代谢区)、H2(侵袭前沿)、H3(低代谢区),展示肿瘤空间异质性分布。

图3(栖息地签名性能与SHAP分析图):A-C为训练/验证/测试集ROC曲线,栖息地签名AUC分别为0.967、0.865、0.772;D为SHAP summary图,显示H2区贡献40%top特征;E为实例级SHAP瀑布图/力导图,明确wavelet LHH一阶熵(SHAP=+0.42)是核心预测特征。

图4(切片级与MIL签名ROC图):A-C为ResNet50切片级ROC曲线(训练/验证/测试集AUC:0.844、0.823、0.752);D-F为2.5D MIL签名ROC曲线,SVM构建的MIL模型在各队列AUC分别为0.936、0.861、0.810,验证其空间信息捕捉能力。

图5(2.5D MIL模型可解释性分析图):A为2例患者的SHAP分析,展示特征对pCR/非pCR预测的贡献差异;B为实例级SHAP力导图,呈现各特征对预测结果的累积影响;C为Grad-CAM热力图,显示模型优先关注肿瘤边缘高代谢区及瘤周免疫浸润区。

图6(ROC与校准曲线图):A-C为各签名训练/验证/测试集ROC曲线,联合模型AUC分别达0.975、0.920、0.824,显著优于单一签名;D-F为校准曲线,联合模型Hosmer-Lemeshow检验P>0.800,预测概率与实际结果高度吻合。

图7(DeLong检验结果图):对比训练(A)、验证(B)、测试(C)队列中各签名的AUC差异,联合模型较传统影像组学、临床模型的AUC提升具统计学意义(P<0.05),验证其性能优势。

图8(Kaplan-Meier生存曲线图):展示训练(A-C)、验证(D-F)、测试(G-I)队列中,栖息地、MIL、联合模型的高/低风险组OS曲线,三组队列均满足高/低风险组生存差异显著(P<0.001),验证模型生存分层能力。
图9(决策曲线分析图):呈现训练(A)、验证(B)、测试(C)队列的DCA曲线,联合模型在全决策阈值范围内,净获益较临床、影像组学等单一模型提升23-41%,证明其临床实用价值。
05
讨论
临床价值
精准患者分层:解决NACI疗效异质性问题,通过基线PET/CT即可预测pCR(测试集AUC=0.824),帮助临床筛选“真正获益患者”,减少非应答者免疫相关不良反应(如肺炎、结肠炎),同时避免应答者治疗不足。
预后风险分层:联合模型C指数=0.809,可将患者分为高低风险组(OS差异显著),指导个体化随访(高风险患者缩短随访间隔)。
机制解析与临床决策支持:SHAP识别H2(肿瘤侵袭前沿)为耐药关键区域,为“针对侵袭前沿的靶向治疗”提供方向;Grad-CAM可视化模型关注区域,增强临床医生对AI结果的信任度。
高临床可及性:基于常规PET/CT检查,无需额外侵入性操作;模型经多中心验证,校准良好且DCA净获益高,易整合入临床工作流。
技术亮点
ESCC特异性栖息地放射组学:首次针对ESCC代谢-结构异质性优化体素级聚类(3个栖息地),解析传统放射组学无法捕捉的亚区域特征,ΔAUC+3.6%(P<0.01)。
2.5D深度学习创新:±4层瘤周切片保留3D空间信息,计算量仅为3D CNN的1/5;MixUp通道融合PET(代谢)与CT(结构)信息,解决多模态discordance;MIL策略(预测概率直方图+TF-IDF)提升泛化性,验证集AUC=0.861。
可解释性突破:结合SHAP(量化特征贡献)与Grad-CAM(可视化注意力),解决AI“黑箱”问题,明确H2及小波熵特征为关键预测因子,为临床提供“可解释的精准”。
严格的多维度验证:双中心、训练-验证-测试三队列设计,全面评估诊断(AUC)、校准(HL检验)、预后(C指数)、临床实用性(DCA),结果可靠且可重复。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)