该工具使用最小树形图(minimum-cost arborescences)算法来构建单倍型网络和谱系分类。需要上传SARS-CoV-2序列变异文件 (采用 GF格式) 和对应的 元信息文件,或者从我们的 2019新冠病毒资源库(2019nCoVR)选择已有样本。你可以从我们的信息库中通过设置起止采样时间,采样国家或地区来过滤已有样本,或者随机方式选择样本。 我们基于构建单倍型网络图和谱系分类,采用Newman方法和特征值来反应出新冠病毒演化过程, 并且计算了平均最短路径长度(average shorted path length ASPL),节点度(degree), 地理信息熵(geographic information entropy GIE)等特征值。
a) 构建单倍型网络图和计算谱系信息,需要上传元信息文件和变异信息文件;
b) 在变异信息文件中,每行需要包含病毒名称,Accession编号,变异信息(GF格式)三列,以tab键分割;
c) 在元信息文件中,每行信息需要包含Accession编号,采样时间(yyyy-MM-dd或者yyyy-MM),采样国家或地区三列,以tab键分割。
Name | Accession | Mutations |
---|---|---|
hCoV-19/human/USA/TX-DSHS-000508/2020 | EPI_ISL_2264424 | 490(SNP:T->A);3177(SNP:C->T);6040(SNP:C->T);6843(SNP:C->T);8782(SNP:C->T);8950(SNP:C->T);12478(SNP:G->A);18736(SNP:T->C);24034(SNP:C->T);26729(SNP:T->C);26801(SNP:C->T);28077(SNP:G->C);28144(SNP:T->C);28896(SNP:C->G);29451(SNP:C->T);29700(SNP:A->G) |
hCoV-19/human/USA/TX-DSHS-000511/2020 | EPI_ISL_2264432 | 3003(SNP:A->T);8782(SNP:C->T);10811(SNP:C->T);10813(SNP:T->A);17747(SNP:C->T);17858(SNP:A->G);18060(SNP:C->T);24694(SNP:A->T);28144(SNP:T->C) |
hCoV-19/human/USA/TX-DSHS-000513/2020 | EPI_ISL_2264434 | 3003(SNP:A->T);8782(SNP:C->T);10811(SNP:C->T);10813(SNP:T->A);17747(SNP:C->T);17858(SNP:A->G);18060(SNP:C->T);24694(SNP:A->T);28144(SNP:T->C) |
hCoV-19/human/USA/TX-DSHS-000515/2020 | EPI_ISL_2264437 | 241(SNP:C->T);3037(SNP:C->T);8664(SNP:C->T);14408(SNP:C->T);15026(SNP:C->T);15264(SNP:T->C);23403(SNP:A->G);27575(SNP:C->T) |
hCoV-19/human/USA/TX-DSHS-000502/2020 | EPI_ISL_2264410 | 241(SNP:C->T);1059(SNP:C->T);3037(SNP:C->T);3068(SNP:G->A);9169(SNP:C->T);14408(SNP:C->T);23403(SNP:A->G);25563(SNP:G->T) |
Accession | Sampling Date | Sampling Location |
---|---|---|
EPI_ISL_2249479 | 2020-04-13 | United States |
EPI_ISL_2254726 | 2020-04-24 | Slovakia |
EPI_ISL_2270090 | 2020-05-11 | Switzerland |
EPI_ISL_2274027 | 2020-05-14 | Haiti |
EPI_ISL_2278820 | 2020-04-27 | Sweden |