scSurvival:单个细胞级别的预后风险神经网络模型,又是一篇 33+ 纯生信!
生信碱移
scSurvival单细胞预后
scSurvival:单个细胞级别的预后风险预测与下游功能分析。
传统癌症生存分析通常基于 bulk RNA-seq,比如来自 TCGA 等数据库的大规模队列数据。对应的数据格式是很清晰的,每个样本的基因表达以及生存事件,在此基础上可以用 Cox 模型预测患者级别的预后风险。
单细胞层面,能够更加明确的看到肿瘤微环境中的异质性细胞群体,数据层面也扩展到一个样本对应数万个细胞。逻辑上,患者的预后不是由所有细胞平均决定的,而是由某些关键细胞亚群决定的。所以预测单个细胞级别的预后风险还是很有必要的。
之前小编分享了 scSurv 等工具能够整合 bulk 数据预测单个细胞水平的预后分享(点击此处阅读推文),这两天又看到一个模型 scSurvival 也是刚刚见刊 Cancer Discovery [IF 33.3],并且还算是妥妥的纯生信:

DOI: 10.1158/2159-8290.cd-25-0965
scSurvival 原理层面多少还是有些差异的,主要体现在直接建模样本级别的 scRNA-seq 队列和生存结局。具体来说,scSurvival 输入患者单细胞表达矩阵,结合生存时间和事件状态进行训练。模型先用 ZIG-VAE 对表达数据进行特征提取,获得细胞低维特征;随后把每个患者看作由多个细胞组成的 bag,用多头注意力机制判断哪些细胞对患者预后贡献最大,并加权汇总为患者级特征。这个提取好的样本级别特征再通过 Cox 建模,预测患者的风险得分。
输出的结果还是比较好理解的:
-
• 患者预后预测:模型输出风险评分,在此基础上可以区分为高低风险组走常规的预后分析流程
-
• 细胞预后预测:单个细胞级别的风险得分,以及可以进一步鉴定预后高风险的细胞亚群
-
• 功能分析:主要还是比较高低风险组的差异基因、KEGG 功能这种

图:scSurvival 模型框架 (A-H) 与具体下游的应用(I-K),其实模型还是相对简单的,并且框架还是比较清晰的。
性能层面小编就不具体介绍,主要带大家看看作者正文分析的示例。首先是黑色素瘤免疫治疗队列的高低风险免疫细胞状态鉴定。可以看到 B cells 和 plasma cells 整体偏低风险,monocytes/macrophages 整体偏高风险:

图:黑色素瘤单个细胞级别的风险分析。
随后就是差异的基因以及富集分析,并且还有患者级别的预后分析。在单核/巨噬细胞中,高风险细胞表现为 SPP1 高、CXCL9 低,更接近促肿瘤 TAM 状态;低风险细胞表现为 CXCL9 高、SPP1 低,并富集抗原呈递、IFN-γ 反应、T 细胞激活等免疫激活通路::

图:高低风险细胞的差异基因与富集,以及样本级别的预后风险。
作者在另外的癌症队列中也进行了分析,逻辑也差不多,不过还结合了常规的拟时序分析:

图:肝癌的单细胞预后分析。
scSurvival 支持 R 与 python 两种语言环境,github 仓如下:
-
• https://github.com/cliffren/scSurvival
-
• R语言教程:https://cliffren.github.io/scSurvival/examples/scSurvival_Tutorial_in_R.html
-
• python教程:https://github.com/cliffren/scSurvival/blob/main/examples/scSurvival_Tutorial_in_Python.ipynb
主要还是配置与读入的过程麻烦些,运行层面 python 可以通过 scSurvivalRun 函数进行:
adata, surv, model = scSurvivalRun(
adata,
sample_column='sample',
surv=surv,
covariates=covariates,
feature_flavor='AE',
entropy_threshold=0.7,
pretrain_epochs=200,
epochs=500,
patience=100,
fitnetune_strategy='alternating'
)
参数比较清晰,小编不具体讲解。adata 是 scanpy 的对象,surv 则是样本级别的生存信息表,模型层面可选 AE/VAE 以及具体的训练参数。
R 语言运行则是在 R Markdown 里用 Python chunk 调用同一个函数,所以区别不大,各位佬铁可以自行学习。
又是单个细胞的预后建模
好好想想其它映射到单个细胞的表型吧
欢迎各位佬铁关注一手
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)