摘要

空间组学技术可生成转录本、蛋白质、代谢物与脂质的高维空间分辨分子数据,需要能够兼顾组织拓扑结构、多尺度组织特征与实验噪声的计算模型。尽管机器学习(ML)与深度学习(DL)方法已快速发展以满足相关分析需求,但领域内仍缺乏明确的方法学指导,无法针对特定空间约束与生物学问题选择适配的模型。本文对空间组学核心任务中的ML/DL方法进行了批判性与对比性综述,核心任务包括批次效应校正、分辨率增强、组织与细胞分割、空间结构域识别、细胞类型反卷积及模型可解释性分析。随机森林、聚类等经典ML方法可提供可解释的分析基线,但对非线性空间依赖关系的建模能力有限;卷积神经网络、图神经网络、Transformer与生成式模型等现代DL架构,可捕捉复杂空间模式并支持多组学整合,但仍面临数据稀缺、标注负担重、计算成本高与不确定性量化难的长期挑战。最优传输、跨模态注意力、图链接嵌入与基础模型等新兴策略可增强跨模态对齐效果,但其前提假设与应用约束仍需严格评估。本文进一步探讨了提升模型可扩展性、可重复性与临床适用性的实用解决方案,包括自监督预训练、联邦学习与标准化空间数据格式的应用。最终,本文提出了1套决策框架,可根据数据模态、空间分辨率、组织架构特征与临床应用场景,明确各类ML/DL方法的最佳适用场景。本文通过整合方法学批判与可落地的实操建议,为空间组学领域中ML/DL模型的可重复、可解释、临床可转化应用提供了路线图。

michel.salzet@univ-lille.fr

isabelle.fournier@univ-lille.fr

#空间组学 #机器学习 #深度学习 #图像分割 #多组学整合 #基础模型 #精准肿瘤学 #临床转化

图片

引言

图片

图1  地理空间遥感与空间组学分析流程的概念类比

地理空间遥感与空间组学分析流程的概念类比。2个领域共享通用的分析管线,首先是专用空间仪器(地理空间成像采用卫星,空间组学采用质谱仪),随后进行样本采集(地球表面区域vs生物组织)。2者均生成高光谱或高维分子数据,必须通过分割处理识别有意义的区域(土地利用分区vs组织结构域)。最终,对分割后的特征进行整合解读,在地理空间研究中实现生态、城市或环境洞察,在空间组学中实现细胞、分子或病理学洞察。

机器学习与深度学习基础

图片

图2  空间组学端到端分析工作流

空间组学端到端分析工作流。从多模态数据采集到生物学洞察与验证,该管线整合了预处理、机器学习、深度学习与多组学融合,以挖掘空间模式与生物学机制。

图片

图3  空间组学算法概览

空间组学算法概览。从经典方法到前沿方法,展示了各类算法的核心原理、典型任务、优势(绿色标注)与局限(红色标注)。经典方法包括成熟的机器学习技术与基础深度学习架构,前沿方法包括生成式模型、量子启发式机器学习等新兴范式。

持续存在的局限与可能的解决方案

图片

图4  空间组学中机器学习/深度学习策略选择的决策框架

空间组学中机器学习/深度学习策略选择的决策框架。该框架整合了5大核心要素:数据模态、空间分辨率、组织架构、注释可用性与分析目标,为算法选择提供指导。6条决策规则将特定输入条件映射为推荐的计算方法(如经典机器学习、CNN分割、跨模态Transformer、半监督学习、可解释模型、联邦学习)。备注部分重点标注了生成式数据一致性校正、邻域建模、不确定性量化、隐私保护基础设施等关键考量因素。推荐输出包括分割、细胞-细胞相互作用建模、数据整合、注释优化、临床预测与跨站点部署。

计算空间组学的未来方向

表1  空间组学中新兴的计算与理论方向及其潜在影响

空间组学中新兴的计算与理论方向及其潜在影响。每个方向均总结了其核心创新、对空间组学的潜在价值、主要障碍、与空间分析结合的具体案例及代表性参考文献。

图片

要点

  • 机器学习与深度学习方法贯穿空间组学全分析流程,覆盖从数据预处理、批次效应校正,到图像分割、空间结构域识别、细胞类型反卷积的所有核心环节。

  • 在异质组织架构中,图神经网络与视觉Transformer在捕捉非线性空间依赖关系、解析细胞-细胞微环境互作方面,性能显著优于传统机器学习方法。

  • 最优传输、图链接嵌入与交叉注意力机制,是当前在统一空间参考框架内整合转录组、蛋白组、代谢组与组织学多维度数据的方法学前沿。

  • 注释稀缺、计算扩展性受限、模型黑箱化、数据格式异质性,是制约空间组学分析流程可重复性与临床转化的4大核心瓶颈。

  • 整合了数据模态、空间分辨率、组织架构、注释可用性与临床目标的5轴决策框架,可为各类空间组学应用场景中规范化的机器学习/深度学习模型选择,提供可落地的实操指导。

详细总结

图片

思维导图(mindmap脑图)

经典机器学习方法

图片

新兴前沿跨学科方法

图片

6大核心决策规则

图片

参考

Brief Bioinform. 2026 Mar 1;27(2):bbag131. doi: 10.1093/bib/bbag131.

Toward next-generation machine learning and deep learning for spatial omics

260328ML_DL_Spa.pdf

注:AI辅助创作,如有错误欢迎指出。内容仅供参考,不构成任何建议。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐