NAR:世界上首个基于荧光图像数据的单细胞多组学数据库——iSMOD
时间:2023-07-16 15:16:37 热度:37.1℃ 作者:网络
随着多组学数据的增加,如何将已有的数据进行整合供后续研究者使用成为一个关键的问题。不同于基于测序的多组学技术,基于成像的多组学技术显得更为直观,以merFISH与seqFISH为代表的基于成像的空间多组学技术大大丰富了相关数据,然而如何合理地运用这些数据仍然是一个问题。另一方面,在临床上,荧光原位杂交技术(FISH)是癌症诊断的金标准,在我国很多省份纳入医保。尽管FISH技术已经发明了半个世纪,世界上仍然还没有一个与已普遍应用多年的技术相关的数据库。
2023年7月14日,清华大学戴琼海院士索津莉课题组与张奇伟教授、高军涛副研究员合作,在领域内顶级期刊Nucleic Acids Research在线发表了题为“iSMOD: an integrative browser for image-based single-cell multi-omics data”的研究论文,提供了一种统一多组学数据和技术的先进研究方法,开发了世界上首个基于图像的单细胞多组学数据库的综合浏览器——iSMOD。
文章发表在Nucleic Acids Research
通过网站https: //i-smod.com,数据库同时整合了NCBI、ensembl、ATCC、 CellMarker、CCLE和The Molecular Probes Handbook等数据库中的基因、物种、蛋白、细胞种类与细胞Marker以及探针的相关信息,收集了PubMed中23,288篇(持续增长中)以DNA FISH和RNA FISH为代表的空间基因组和空间转录组图像数据,以及细胞核内、特别是与核蛋白相关的蛋白质组学数据。
该数据库包含目前为止已发表的所有荧光原位杂交相关技术,一共记录了8,509个物种、16,586个基因,122种蛋白以及598种细胞类型的数据信息。从多个角度提取相关图形和关键信息,并提供搜索、浏览和统计三个主要功能模块,以及三种突出作者与实体之间联系的知识图谱。
同时,iSMOD进一步构建关键词库,系统地组织了数据库的信息,提供用户友好的界面GUI,方便使用者查询。iSMOD支持用户来搜索、浏览和分析包含在数据库中的论文,以帮助阐明与染色质、信使RNA和关键蛋白的空间位置相关的基因调控。
iSMOD结合了包含的所有文章的交互信息生成的多组实体交互图的相关知识,为发现新机制提供了类似的高级过滤能力。在搜索结果页面中嵌入的一个实时交互图,可用于描述当前查询中可能包含的多组学主题之间的联系,然后生成细胞类型过滤器,用于探索细胞特异性交互。随后,该文章还用几个示例,展示了iSMOD的广泛应用,其中包括通过多组学研究揭示疾病的分子靶点;探索生物现象背后的工作机制;以及将3D多组学数据整合到虚拟细胞核中。
上图是通过iSMOD对疾病的分子机制进行研究的例子——基于多篇文献整合的FISH数据的基因或等位基因分布在同一个给定的染色质区域。(A,B)iSMOD数据库中研究的人类(A)和小鼠(B)染色体的基因分布。(C)从检索到的研究Chr11:5225464-5269945区HBB基因的文章中推断出的作用机制。(D,E)通过FISH成像的等位基因在人类(D)和小鼠(E)染色体上的分布。(F)将iSMOD对贝克德曼-维德曼-银综合征和罗素综合征的结果进行整合,这些结果与11p15.5区域的等位基因密切相关。红框代表母系表达的基因,而蓝框代表父系表达的基因。(G,H)癌症细胞系(图G按器官分类)和癌症(图H按一般癌症类型分类)的堆叠条形图。
随着多组学技术的不断发展和发展,相关的学术论文层出不穷,对相关研究进行系统回顾和整合的需求日益迫切。相应地,越来越多的基于图像的多组学数据将被发表,将相关数据进行整合,以帮助用户更好地理解染色质组织、基因调控、转录和翻译之间的关系,同时,方便研究者做进一步查询、数据挖掘,将会成为一个非常有意义的工作。