高级检索

标准

元信息

元信息表的设计参考了NCBI的GenBank数据库的元信息表我们从GenBank继承元信息规范并添加Genbase定制的修饰符。Microsoft xlsx格式的模板已在提交页面提供给用户,同时附有提示和控制词汇。
用户应在模板文件的 "Source Modifiers" 表格中填写信息。如果修饰符的值受控制,您可以在名为 "control word" 的工作表中找到该值的受控词汇。
元信息表可以分为三个部分,

必填项

     GenBase具有一些强制性的项目,例如Sequence_ID和Collection_date。这种设计允许用户尽可能灵活地填写源修饰符表。请注意,Sequence_ID必须与FASTA文件中的SeqID相对应,且不能小于或大于。

非必填,但推荐填写

     这些修饰符是GenBase推荐的,通过它们您可以在相同生物体中唯一识别您的样本。

可选项

     这些修饰符是可选的。
描述
类型 修饰符 说明
必填Sequence_ID每个序列的 Seqid
必填项Collection_date标本采集日期
可选但建议Clone获取序列的克隆名称,通常是字母数字ID。
可选但建议Country/Region序列的生物体所在的国家。也可以是海洋或主要海域。附加的地区或位置信息必须在国家名称后,用冒号分隔。例如:USA: Riverview Park, Ripkentown, MD。验证过的值可在控制词汇表中找到。
可选但建议Host如果序列提交来自与第二个生物体存在共生、寄生或其他特殊关系的生物体,可以使用 'host' 修饰符来标识寄主物种的名称。
可选但建议Host_sex寄主的性别
可选但建议Host_age寄主的年龄
可选但建议Isolate获取序列的个体分离物,通常是字母数字样本ID。
可选但建议Isolation_source描述生物样本的物理、环境和/或地理来源,从中获取序列。
可选但建议Specimen_voucher源生物体及其当前存储位置的标识符,通常是一个机构。应使用以下格式提供:'institution-code:collection-code:specimen-id'。specimen-id是必需的,collection-code是可选的;如果提供了collection-code,则institution-code是必需的。例如:99-SRNP或UAM:Mamm:52179或个人收藏:Joe Smith:99-SRNP
可选但建议Strain从中获取序列的生物体菌株。对于微生物记录,菌株是一个可以以任何方式指定的字母数字标识符,例如,它可以基于个体或地点的名称。例如,对于大肠杆菌K12,"K12"是菌株名称/标识符。
可选项Organelle/Location所有序列的默认位置是'Genomic'。如果序列不是基因组的,请从控制词汇表中选择替代的细胞器/位置。详情请参阅 这里.
可选项Altitude样本收集地点距离海平面的海拔高度(以米为单位)。
可选项Authority从中获取序列的生物体名称的作者或作者。
可选项Bio_material获取核酸序列的生物材料的标识符,包括其当前存储地点的可选机构代码和收集代码。应使用以下格式提供:'institution-code:collection-code:material_id'。material_id是必需的,institution-code和collection-code是可选的;如果collection-code存在,则institution-code是必需的。此修饰符应用于注释生物收藏中的材料标识符,其中包括动物园、水族馆、种子库、种质库和DNA库。
可选项Biotype一种物种(通常是真菌、细菌或病毒)的特定生物属性(通常是地理、生态或生理方面)的变体。与生物型相同。
可选项Biovar见 biotype
可选项Breed从中获取序列的已命名品种(通常应用于驯化的哺乳动物)。
可选项Cell_line从中获取序列的细胞系。
可选项Cell_type从中获取序列的细胞类型。
可选项Chemovar一种物种(通常是真菌、细菌或病毒)的特定生化性质变体。
可选项Collected_by采集样本的人的姓名。
可选项Cultivar从中获取序列的栽培植物品种。
可选项Culture_collection获取核酸序列的培养物的机构代码和标识符,包括可选的收集代码。应使用以下格式提供:'institution-code:collection-code:culture-id'。culture-id和institution-code是必需的。此修饰符应用于已存储在策划的培养物集合中的活体微生物和病毒培养物,以及已存储的细胞系。
可选项Dev_stage生物体的发育阶段。
可选项Ecotype从中获取序列的已命名生态型(适应于当地栖息地的种群,通常应用于拟南芥的种群)。
可选项Forma从中获取序列的生物体的格式(由命名规则规定的最低分类单位)。此术语通常应用于植物和真菌。
可选项Forma_specialis从中获取序列的生物体的生理上不同的形式(通常限于某些寄生真菌)。
可选项Fwd_primer_name正向PCR引物的名称
可选项Fwd_primer_seq正向PCR引物的核苷酸序列
可选项Genotype生物体的基因型。
可选项Haplogroup具有一些序列变异的相似单倍型组的名称。
可选项Haplotype生物体的单倍型。
可选项Identified_by通过分类学名称鉴定从中获取序列的生物体的人的姓名。
可选项Lab_host用于扩增从中获取序列的生物体的实验室宿主。
可选项Lat_Lon样本收集地点的纬度和经度,以小数度表示。
可选项Note关于每个序列的任何附加信息。
可选项Pathovar一种物种(通常是真菌、细菌或病毒)的生物致病目标的变体。例如:Pseudomonas syringae pathovar tomato和Pseudomonas syringae pathovar tabaci。
可选项Pop_variant从中获取序列的种群变体的名称
可选项Rev_primer_name反向PCR引物的名称
可选项Rev_primer_seq反向PCR引物的核苷酸序列
可选项Segment测序的病毒或噬菌体片段的名称
可选项Serogroup一种物种(通常是真菌、细菌或病毒)的抗原性质变体。与 serogroup 和 serovar 相同。
可选项Serotype见 Serogroup
可选项Serovar见 Serogroup
可选项Sex从中获取序列的生物体的性别。
可选项Sub_species从中获取序列的生物体的亚种。
可选项Subclone从中获取序列的亚克隆的名称。
可选项Subtype从中获取序列的生物体的亚型。
可选项Substrain从中获取序列的生物体的亚菌株。
可选项Tissue_lib从中获取序列的组织库。
可选项Tissue_type从中获取序列的组织类型。
可选项Type从中获取序列的生物体的类型。
可选项Variety从中获取序列的生物体的变种。
可选项Comments序列的额外说明/注释
下载
下载 元信息标准说明。