2020年2月1日,园艺领域TOP期刊Horticulture Research在线发表了西南大学柑桔研究所(中国农业科学院柑桔研究所)国家柑橘品种改良中心的题为‘CitGVD: a comprehensive database of citrus genomic variations’的研究论文。该研究报道了柑橘的全基因组变异数据库CitGVD,这也是世界范围内的第一个园艺类全基因变异数据库。
柑橘是全世界最重要的商业水果作物之一。利用当前可用于柑橘类水果的大量基因组数据,可以开发分子标记和评估种质遗传关系,服务于分子育种和全基因组选择辅助育种。在这项研究中,为方便访问、利用和分享这些数据,该团队开发了一个基于Web的数据库,即柑橘基因组变异数据库(CitGVD,http://citgvd.cric.cn),这是第一个针对柑橘且专用于全基因组变异数据和分析的综合数据库,包括单核苷酸多态性(SNP)和插入/缺失(INDEL)。CitGVD的当前版本(V1.0.0)是一种开放获取资源,其资源是从内部项目和公共资源中挑选出来的346个种质的1,493,258,964个高质量基因组变异和84个表型。CitGVD集成了有关基因组变异注释,相关基因注释以及有关种质的详细信息,并集成了多种内置工具来进行数据访问和分析。例如,CitGWAS可用于具有SNP和表型数据的全基因组关联研究(GWAS),而CitEVOL可用于遗传结构分析。本数据库是一个数据与工具的集成分析平台,为柑橘的分子标记挖掘,分子标记辅助育种和分子设计育种提供数据支持。这些功能使CitGVD成为用于柑橘相关研究的综合Web门户和生物信息学平台。它还为构建其他农作物的全基因组变异数据平台提供了范例。
Fig. 1Workflow highlighting the development of CitGVD. a Data sources and pipelines to construct CitGVD. b Data processing procedures. This process included NGS data quality control, SNP calling and filtering.
本数据库除了包含HOME(主页),GENERAL(总述)和HELP(帮助)的信息板块提供用户该网站的简介和使用帮助之外,还有三个功能板块,他们分别是包含BROWSE(浏览),SEARCH(检索),DOWNLOAD(下载)的数据板块,包括TOOLS(工具)和全局检索的工具板块,包括注册和登陆的认证与管理板块。通过数据板块可以对数据库中海量的分子标记数据,表型数据,基因数据,品种数据等进行浏览获取,多种检索类型和参数检索,迅速比对并获取需要的信息,数据下载;工具板块提供了诸多的分析工具,可以对表型数据进行分析,挖掘功能位点和基因,设计分子辅助育种引物等。
Fig. 4 Built-in pipelines. a Parameters of CitTRAIT. b Output of CitTRAIT. Min minimum value, Max maximum value, Mean mean value, SD standard deviation, Med median, CV coefficient of variation. c Parameters of CitEVOL. CitEVOL processes with built-in SNP data. In the calculation, the reference genome was first determined, and then the population structure, principal component analysis (PCA) results and phylogenetic trees can be analyzed. d Phylogenetic tree data were assessed with CitEVOL and visualized with MEGA V7.2. e Parameters of CitGWAS. Mmixed linear model (MLM) and general linear model (GLM) can be used for GWASs. f Manhattan plot output from CitGWAS. g QQ plot output from CitGWAS.
西南大学柑桔研究所年轻教师李强博士为该数据库的创建者,也是本论文的第一作者,柑桔研究所陈善春研究员和何永睿副研究员为共同通讯作者。该研究得到了国家重点研发计划(2018YFD1000306)和现代农业(柑橘)产业技术体系支持。本数据库已申请软件著作权登记(登记号:2020SR0040718)。
点击这里访问:http://citgvd.cric.cn
重要参考文献:
Xu, Q. et al. The draft genome of sweet orange (Citrus sinensis). Nat. Genet 45, 59–66 (2013).
Wang, J. et al. Citrus sinensis annotation project (CAP): a comprehensive database for sweet orange genome. PLoS ONE 9, e87723 (2014).
Bai, B. et al. DoGSD: the dog and wolf genome SNP database. Nucleic Acids Res. 43, D777–D783 (2015).
Luo, H. et al. Erratum to: SorGSD: a sorghum genome SNP database. Biotechnol. Biofuels 9, 37 (2016).
Zhao, H. et al. RiceVarMap: a comprehensive database of rice genomic variations. Nucleic Acids Res. 43, D1018–D1022 (2015).