单体型分析        

功能描述

该工具使用最小树形图(minimum-cost arborescences)算法来构建单倍型网络和谱系分类。需要上传SARS-CoV-2序列变异文件 (采用 GF格式) 和对应的 元信息文件,或者从我们的 2019新冠病毒资源库(2019nCoVR)选择已有样本。你可以从我们的信息库中通过设置起止采样时间,采样国家或地区来过滤已有样本,或者随机方式选择样本。 我们基于构建单倍型网络图和谱系分类,采用Newman方法和特征值来反应出新冠病毒演化过程, 并且计算了平均最短路径长度(average shorted path length ASPL),等级degree, 地理信息熵(geographic information entropy GIE)等特征值。

变异文件    变异文件示例
上传变异文件
元信息文件    元信息示例
上传元信息文件
从选择特定数据集   
构建单倍型网络图参数设置   
邮件地址(当计算时间较长时,通过邮件通知计算结果
邮箱
 
邮件主题
运行
提示:目前队列运行的任务有个,排队任务有个。
帮助文档
1. 输入文件格式说明

a) 构建单倍型网络图和计算谱系信息,需要上传元信息文件和变异信息文件;
b) 在变异信息文件中,每行需要包含病毒名称,Accession编号,变异信息(GF格式)三列,以tab键分割;
c) 在元信息文件中,每行信息需要包含Accession编号,采样时间(yyyy-MM-dd或者yyyy-MM),采样国家或地区三列,以tab键分割。

2. 变异文件示例
NameAccessionMutations
hCoV-19/human/USA/TX-DSHS-000508/2020EPI_ISL_2264424490(SNP:T->A);3177(SNP:C->T);6040(SNP:C->T);6843(SNP:C->T);8782(SNP:C->T);8950(SNP:C->T);12478(SNP:G->A);18736(SNP:T->C);24034(SNP:C->T);26729(SNP:T->C);26801(SNP:C->T);28077(SNP:G->C);28144(SNP:T->C);28896(SNP:C->G);29451(SNP:C->T);29700(SNP:A->G)
hCoV-19/human/USA/TX-DSHS-000511/2020EPI_ISL_22644323003(SNP:A->T);8782(SNP:C->T);10811(SNP:C->T);10813(SNP:T->A);17747(SNP:C->T);17858(SNP:A->G);18060(SNP:C->T);24694(SNP:A->T);28144(SNP:T->C)
hCoV-19/human/USA/TX-DSHS-000513/2020EPI_ISL_22644343003(SNP:A->T);8782(SNP:C->T);10811(SNP:C->T);10813(SNP:T->A);17747(SNP:C->T);17858(SNP:A->G);18060(SNP:C->T);24694(SNP:A->T);28144(SNP:T->C)
hCoV-19/human/USA/TX-DSHS-000515/2020EPI_ISL_2264437241(SNP:C->T);3037(SNP:C->T);8664(SNP:C->T);14408(SNP:C->T);15026(SNP:C->T);15264(SNP:T->C);23403(SNP:A->G);27575(SNP:C->T)
hCoV-19/human/USA/TX-DSHS-000502/2020EPI_ISL_2264410241(SNP:C->T);1059(SNP:C->T);3037(SNP:C->T);3068(SNP:G->A);9169(SNP:C->T);14408(SNP:C->T);23403(SNP:A->G);25563(SNP:G->T)
3. 元信息示例
AccessionSampling DateSampling Location
EPI_ISL_22494792020-04-13United States
EPI_ISL_22547262020-04-24 Slovakia
EPI_ISL_22700902020-05-11Switzerland
EPI_ISL_22740272020-05-14Haiti
EPI_ISL_22788202020-04-27Sweden