NGDC Dec 27, 2021
近日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的单细胞全基因组甲基化数据库(scMethBank)正式上线。该研究成果以“scMethBank: a database for single-cell whole genome DNA methylation maps”为题在国际学术期刊Nucleic Acid Research 在线发表。
作为表观基因组学的重要组成部分,DNA甲基化为研究基因组印迹、早期胚胎发育和癌症进展等生物学过程提供了重要视角。随着单细胞测序技术的不断发展,在单细胞分辨度研究DNA甲基化成为可能,也极大地促进了细胞表观遗传异质性的探索。然而,由于缺乏完善的标准化数据分析技术及流程及相应的单细胞甲基化数据资源平台,对于不同实验来源的海量的单细胞甲基化样本数据的整合和再利用面临着巨大的挑战。针对这些问题,国家基因组科学数据中心研究团队开发了scMethBank数据库。
scMethBank 是一个开放访问和综合性的全基因组单细胞DNA甲基化数据库,收集基于重亚硫酸氢盐转换的单细胞原始测序数据,以标准化的工作流程在单碱基分辨率下检测甲基化状态并构建多种状态下的单细胞甲基化图谱。数据库目前收录了来自于15个公开的单细胞数据集的8328个单细胞全基因组重亚硫酸氢盐测序数据和人工审编的元数据,涉及人和小鼠两个物种、29种细胞类型和两种疾病状态。
scMethBank提供友好的用户界面,以支持交互式的单细胞甲基化数据的查询、浏览和使用。同时,数据库还提供一系列为单细胞甲基化数据设计的在线分析和可视化工具,包括差异甲基化区域(DMR)注释、富集分析、差异甲基化区域绘图等,通过网络服务器帮助用户分析、解释和应用单细胞甲基化数据。scMethBank是目前第一个较全面的单细胞甲基化数据库,并有望成为单细胞表观遗传研究的重要数据资源和分析平台。
北京基因组研究所(国家生物信息中心)博士研究生宗文婷及亢红恩为本文共同第一作者,李茹姣高级工程师与鲍一明研究员为共同通讯作者。该研究得到了中科院战略性先导科技专项、国家重点研发计划、中科院关键人才计划等项目资助。
scMethBank数据处理流程与主要内容