国家基因组科学数据中心肿瘤基因诊断数据分中心

国家基因组科学数据中心肿瘤基因诊断数据分中心于2024年4月成立,依托单位为浙江大学医学院附属第一医院。

建设目标

推动肿瘤基因诊断数据汇交、共享;建设肿瘤基因诊断等方面的数据库;开发肿瘤基因诊断相关算法、软件、系统;开展肿瘤基因诊断相关科普、成果推广。在此基础上,围绕肿瘤基因测序大数据、医学信息学、临床诊疗服务技术和生物信息学等领域,开展创新研究和成果转化相关工作,挖掘多学科交叉在肿瘤基因诊断领域的无限可能性,培养学科交叉型肿瘤基因诊断高端人才。

特色资源

目前已产生肿瘤基因诊断数据约160TB,肿瘤基因研究相关测序数据约1PB。

基础设施

1.科研测序平台:现有Illumina NovaSeq 6000、Illumina NextSeq 2000、Illumina NextSeq 550Dx等多台测序仪,并将按实际需求继续扩充,可满足大批量临床样本测序数据产生; 2.高性能超算平台:配备约6000核计算能力和约10PB存储的高性能计算硬件,可支持多方向的医学大数据与人工智能科研工作,面向全院提供数据存储和计算服务、数据科研服务、数据资源服务;生物医学大数据高性能计算中心是由CPU+GPU组成的异构高性能计算集群系统,持续为院内高水平科研提供高质量计算算力及高性能的数据存储,理论峰值性能为259660.8 GFLOPS,拥有60台双路普通计算节点、9台大内存计算节点、2台GPU计算节点,并配以Mellanox 100 Gbps Infiniband EDR 高速网络互连,以及10PB高性能BeeGFS并行文件存储系统,体现了强大的计算存储能力和先进的设计理念; 3.数据分析平台:具备快速分析全基因组、全转录组、单细胞、质谱流式和微生物等分析条件。

人员队伍

目前由10人组成,包括1名研究员,1名特聘副研究员,8名技术员。

负责人: 黄金艳

黄金艳,博士,研究员,浙江大学医学院附属第一医院生物医学大数据中心负责人。担任中国医药生物技术协会基因检测技术分会委员、中国病理生理学会实验血液学青年委员会委员和中-法应用科学会(FFCSA)俱乐部主席。主要从事组学数据的分析与挖掘、恶性肿瘤分子分型和发病机制研究。研发了一系列医疗卫生软件系统,在Cancer Cell、Genome Biology、PNAS和Bioinformatics等学术刊物以第一或通讯作者发表SCI论文50余篇,总影响因子超过500,共同主编《R语言在生物医学领域的应用》一书。取得软件著作权2项,申请专利6项。