北京基因组所(国家生物信息中心)发布原核生物泛基因组数据库ProPan

NGDC  Oct 27, 2022


  相比于传统的比较基因组学分析,泛基因组学为开展物种基因组动力学、分类及鉴定、致病性和环境适应等研究提供了新的视角。

  近日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的原核生物泛基因组数据库(ProPan)正式上线,旨在提供多物种的基因组动力学特征,为物种关键抗性和代谢相关基因鉴定及其演化规律研究提供重要的数据资源。该研究成果以“ProPan: a comprehensive database for profiling prokaryotic pan-genome dynamics”为题在国际学术期刊Nucleic Acid Research 在线发表。

  ProPan不仅剖析了多个原核生物物种的基因组动力学特征,还进行了基因簇核苷酸多样性计算、COG功能富集分析、31个关键代谢循环过程及图谱构建、126种物质(包括杀菌剂、抗菌药物和金属)抗性基因预测和基因存在/缺失变异分析等。目前,ProPan共收集了432个属的1504个物种(23个古细菌物种,1481个细菌物种)的51,882个基因组(295个古细菌基因组,51587个细菌基因组)和182867222个基因簇。用户可以以物种作为基本单元,进行数据的浏览、搜索和下载。

  中国科学院北京基因组研究所(国家生物信息中心)特别研究助理张亚东及博士研究生张好为本文共同第一作者,张哲文助理研究员和肖景发研究员为共同通讯作者。本工作得到中国科学院战略性先导研究计划、国家自然科学基金、国家重点研发计划等项目资助。

论文链接