GenBase - Submit

提交类型

受控序列提交准备

注意：受控序列提交用于人类遗传资源管理，只有人的数据才能使用该提交模块进行受控数据提交

根据人类遗传资源数据管理办法，中国人类遗传资源数据如果需要对外公开或向外提供数据链接(比如向杂志社编辑共享数据链接)，均需要完成人遗数据备份和事先报告。GenBase将依据用户反馈的备案号和事先报告号，对数据进行公开或受控管理。

人遗数据备份和事先报告流程:
（1）在 GenBase 数据库中递交数据(https://ngdc.cncb.ac.cn/genbase)，审核通过获得分配编号;
（2）在人类遗传资源信息管理备份平台(https:/ngdc.cncb.ac.cn/hgrip/login)通过GenBase编号完成数据备份，获得备份号;
（3）在人类遗传资源服务管理系统(https://apply.hgrg.net/login)通过备份号进行事先报告，获得事先报告编号;
（4）将备份编号和事先报告编号通过邮件返回给GenBase工作邮箱genbase@big.ac.cn。请同时在邮件中注明数据是否公开释放，以及计划释放的日期(释放日期可通过用户账号自行修改)

1.概述

请准备以下信息:

基本信息: 您的联系方式，作者，出版物，数据发布日期
提交类型:
- 原始组装/注释
- 同一基因座的多个序列集合(如果适用)
- 分子类型
FASTA格式的核酸序列
物种名
元信息, 例如: isolate, strain, collection date, country
特征注释, 例如: CDS (coding region), tRNA, ncRNA, gene

2.序列

您可以按以下格式提交序列:

FASTA，可包含一条或多条序列。请使用FASTA格式，以定义行开始，然后是序列行。最简单的定义行需要“>”符号和一个序列标识符（Sequence ID）。

例如:

>Seq1 [organism=Homo sapiens]
CCTTTAT...
>Seq2 [organism=Homo sapiens]
GGTAGGT...

所有序列文件必须是纯文本，仅使用ASCII字符。序列使用IUPAC代码。

我们提供了独立的GenBaseTools(gbt)程序给有大批量序列提交需求的用户来使用。用户可以将此程序下载到本地运行序列校验并根据提示修改直到通过，无需将大量序列多次上传到GenBase网站。本工具目前支持通用序列和新冠肺炎序列的校验，并且支持在所有常见的linux发行版中运行。查看帮助。

3.元信息

元信息将被要求作为提交的一部分，并使用受控词汇表来描述您如何、何时以及在何处获得样品。您可以使用元信息(如isolate, clone, strain or specimen voucher)唯一地识别来自同一生物体的样品。

您将被要求根据您的物种信息提供某些元信息的值。额外的元信息将可添加。

元信息可通过以下Excel表提供。

模板文件: GenBase_Modifiers.xlsx

4.特征

请准备序列对应的特征注释:（参考特征注释文件规范）

对于简单的注释(例如，所有序列都具有相同的特征)，请准备Excel表格上传;

对于复杂的注释，请准备一个由制表符分隔的五列特征表（TBL格式文件）来上传;

根据你提交的序列提供特征间隔。对于蛋白质编码序列，请对您序列上的编码区域(CDS)进行特征注释，无论是部分的还是完整的。

不提供完整的特征注释将延迟审批号的分配和处理。

模板文件: GenBase_Features.xlsx