NGDC Oct 28, 2022
基因组序列变异与表型关联知识,主要是通过全基因组关联分析(GWAS),在全基因组范围内鉴定与特定疾病或表型性状等相关联的遗传变异位点,是挖掘和揭示生物复杂性状分子遗传机制的重要资源。
近日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心正式发布更新版动植物基因组变异与表型关联知识库GWAS Atlas v2.0,以“GWAS Atlas: an updated knowledgebase integrating more curated associations in plants and animals”为题在国际学术期刊 Nucleic Acids Research 在线发表。
GWAS Atlas研究团队每年持续审编公开发表的GWAS研究文章,按照统一的审编模型系统整理基因组变异与表型的关联知识。GWAS Atlas v2.0基于830篇科研文献,提供了15个物种(包括10种植物和5种动物)及与其1444个性状相关联的278109条基因型与表型关联知识。为进一步精细定位与复杂生物性状相关联的候选遗传位点,研究团队通过对所有关联知识进行连锁不平衡分析,鉴定到与439个性状相关的6084个独立变异位点(Lead SNPs);并通过生物审编,新收录157个性状的486个经实验验证的因果变异(Casual variants)。这些遗传位点的系统分析和整合可以帮助我们更好地理解复杂性状的遗传结构,为进一步高效定向育种提供更加精确的数据知识,进而提高种质资源利用率。
为更好服务用户数据的汇交和分析,GWAS Atlas v2.0还建立了GWAS关联知识的在线汇交功能,以方便用户在线批量递交研究结果,并为每一个递交数据分配唯一可识别的标识符,根据递交用户设定的数据公开时间进行可控管理;同时新研发上线了LeadSNPFinder、GeneFinder、MHPlotter和QQPlotter四个在线分析和画图工具,方便用户开展数据的挖掘应用分析和可视化分析结果。总之,GWAS Atlas 2.0为未来重要农艺性状的模块化遗传研究和育种应用提供了重要数据管理和分析平台。
北京基因组所(国家生物信息中心)博士研究生刘晓楠、工程师田东梅和李翠萍为本文共同第一作者,宋述慧研究员与章张研究员为共同通讯作者。该研究得到了中科院战略性先导科技专项、国家重点研发计划、国家自然科学基金、中科院青促会等项目资助。