NGDC Apr 12, 2023
近日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的人类癌症代谢物关联知识库(MACdb)正式上线。该研究成果以“MACdb: A curated knowledgebase for metabolic associations across human cancers”为题在Molecular Cancer Research 期刊在线发表。
癌症代谢组通过对小分子代谢物的全局分析反映癌症类型、基因组异常、药物治疗方案等癌症状态的关键信息,鉴定的差异代谢物作为生物标志物被广泛应用于肿瘤诊断和治疗反应评估。随着代谢组学研究的发展,针对不同癌症类型、基因组异常、药物反应评估的代谢物关联关系已被广泛报道。癌症-代谢物的关联关系分散在不同的研究且存在命名不统一的问题,这为综合评估代谢产物在癌症中的作用、寻找可用于癌症早期诊断的标志物带来了巨大的挑战。
MACdb建立了癌症-代谢物关联关系的收集标准,通过使用一系列本体(Ontology)对癌症类型、特征、代谢物标准化,将收录信息存储于代谢物(Metabolite)、特征(Trait)、研究(Study)和出版物(Publication)四类浏览页面,实现分散数据的整合与无缝关联。目前,基于对17类高发病率或高死亡率癌症代谢组学文献的人工审编,MACdb共收录了462篇文献中的40,710个癌症-代谢物关联关系,涵盖269个癌症特征。
MACdb提供了一系列友好的用户界面,以支持研究人员交互式浏览、检索、可视化以及富集癌症-代谢物关联关系。MACdb支持从癌症类型、特征、代谢物名称、文献ID等层面快速检索和筛选信息,提供癌症、特征、代谢物三个层面关联的可视化知识图谱(Knowledge Graph),配备代谢物标准化(NameToCid)工具,实现代谢物名称与PubChem Cid的映射。此外,基于40,710个癌症-代谢物关联关系构建的富集工具(Enrichment),提供代谢物和癌症类型、特征的富集分析。MACdb是当前最全面的人类癌症-代谢物关联知识库,为全方位研究不同癌症类型、特征中的代谢物关联关系,识别癌症中的关键代谢标记物提供支撑。随着越来越多的代谢物在癌症中的作用被揭示,MACdb将为人类癌症研究提供更多增值服务。
北京基因组研究所(国家生物信息中心)工程师孙艳玲及郑欣畅,博士研究生王国梁及硕士研究生王钇博为本文共同第一作者,赵文明正高级工程师和鲍一明研究员为共同通讯作者。本工作得到中科院战略性先导科技专项及中国科学院基因组科学数据中心项目的资助。