在RNA甲基化修饰研究的火热浪潮中,Writers(书写器)、Erasers(擦除器)和 Readers(阅读器)——合称WER蛋白,无疑是主导调控机制的“三剑客”。

然而,搞清楚这些蛋白到底靶向了哪些基因?在特定细胞系中发挥了什么作用?与哪些疾病相关?往往需要耗费大量时间去浩如烟海的文献和高通量测序数据中“大浪淘沙”。

今天,我们介绍一个新的科研工具——RM2Target v2.0(中山大学研究团队开发)[1],它是一个RNA修饰调控蛋白的靶基因数据库。如果你正在进行RNA表观调控相关的课题,寻找下游靶基因、探索疾病分子机制,或者需要高质量的组学整合数据,RM2Target v2.0绝对值得关注和收藏。

图片

01 数据库研究的主角

在RNA修饰领域,有三类最核心的蛋白(统称为WER蛋白):

  • Writers(书写器):负责给RNA加上修饰(比如METTL3)。

  • Erasers(擦除器):负责把RNA上的修饰擦掉(比如FTO)。

  • Readers(阅读器):负责识别这些修饰并执行具体功能(比如YTHDF系列)。

这个数据库就是专门研究这三类蛋白究竟作用于哪些靶基因的。

02 数据库基本信息

RM2Target是一个全面收录18种RNA修饰的书写器、擦除器和阅读器(WERs)靶标的数据库。研究团队收集了具有以下不同证据类型的靶基因:

  • 已验证:通过3,388篇已发表文献中的WER扰动实验,验证了11,173个WER-靶标关联

  • 结合:从CLIP-seq、RIP-seq、ChIP-seq和质谱等高通量测序数据中预测出1,785,670个具有结合证据的WER-靶标关联。

  • 扰动:通过WER扰动后进行的RNA-seq、MeRIP-seq和Ribo-seq等高通量测序,推断出3,218,835个WER-靶标关联。总之,RM2Target收录了4,400,616个WER-靶标关联,涵盖20种生物(人、小鼠、拟南芥、线虫、斑马鱼、水稻等)中973种不同细胞系/组织的18种RNA修饰的273个WERs。

图片

在RM2Target中,我们可以获取以下信息:

  • WER和靶基因的基本信息,如基因ID、基因符号、基因类型、别名和功能描述。

  • WER-靶基因关联的详细信息,如结合信息、检测方法、细胞系注释、扰动方向,以及在表达、翻译、可变剪接、稳定性或修饰水平上的下游效应。

  • 靶基因的丰富注释,包括RNA修饰、RNA相关相互作用及相关疾病信息。

图片

该数据近期升级到v2.0版本,此次数据库有几个升级亮点:

A. 数据量“狂飙”,涵盖20个物种的440万+互作

图片

B. 大模型赋能,让数据整合更精准

这次升级最引人注目的技术亮点,在于团队创新性地采用了大语言模型(Large Language Models)来辅助人工审阅(Curation)。

C. 全方位深度注释,直击临床疾病与调控机制

对于科研人员来说,只知道“谁靶向谁”是不够的。RM2Target v2.0提供了极致丰富的多维注释信息:

  • 修饰图谱 (Modification profiles):直观展示靶基因上的修饰位点分布。

  • 分子互作网络 (RNA interactions):帮助你构建更庞大的分子调控网络。

  • 临床疾病关联 (Disease links):数据库将靶基因与各类疾病进行了深度关联注释。

03 如何使用数据库?

网址:http://rm2target.canceromics.org/

图片

RM2Target网站界面

首页可以直接输入信息,进行检索。

图片

菜单栏有“Browse浏览”、“Search搜索”、“Download下载”、“Help帮助”等。其中,帮助部分有详细的数据库使用教程供用户使用。今天,我们重点关注“浏览”部分。

图片

点击菜单栏Browse,弹出如下窗口信息:

  1.  Browser

  2.  WER Information

  3.  Top Target Gene of METTL16

  4.  Top Motifs Found in Target Genes

  5.  Distribution

  6.  Browse Result

图片

【1】Browser

第一栏有“Organism(选择物种,比如人、小鼠、拟南芥等)”、“Modification(选择修饰类型,比如m6A)”、“WER type(WER类型,比如Writer/Reader/Eraser)”、“WER(比如METTL16)”可供重新筛选。

图片

【2】WER信息

然后,可以看到WER的详细信息。其涉及WER符号、修饰、WER类型、靶RNA类型、详细功能描述等信息。

图片

【3】靶基因词云

这里我们可以看到METTL16的靶基因词云,也可以选择可视化的数量。还可以点击靶基因的名字,查看具体的信息。

图片

【4】靶基因motif

将来自Clip-seq或MeRIP-seq的相关峰作为输入,使用HOMER进行motif富集分析。

图片

【5】靶基因分布

不同来源的靶基因分布。

图片

【6】筛选出来的查询结果

筛选出来的查询结果,可以重新筛选。此外,还添加了细胞系/组织类型、靶基因名和证据类型进一步筛选。

图片

点击ID、Validated、Binding等来查看细节信息。

图片

跳转的细节信息,我们可以看到如下信息:

① WER-靶标关联

概括性信息,包括RM2Target ID、WER类型、修饰、生物体、细胞系/组织信息及相关证据类型。

图片

② WER-靶标关联信息

这部分内容包括“已验证的证据Validated Evidence”、“结合证据Binding Evidence”、“扰动证据Perturbation Evidence”。

图片

图片

③ 靶基因信息

除了靶基因的基本信息外,这部分还提供了靶基因的注释,包括RNA修饰、疾病注释信息。

图片

图片

图片

④ TCGA分析

这部分可以用于研究WERs表达与其靶点在癌症类型中的关联性。

图片

今天的介绍就到这里了,更多关于数据库的使用欢迎自己摸索。如需做RNA修饰相关的技术服务,欢迎咨询~

  • 参考文献

[1] Bao X, Jiang Q, Chen W, et al. RM2Target v2. 0: an updated database for the target genes of writers, erasers, and readers of RNA modifications[J]. Nucleic Acids Research, 2026, 54(D1): D279-D290.

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐