专业咨询
致力推进中国医疗卫生信息化

应对基因组大数据时代:第三届华大基因生物信息软件及数据发布会成功举行

GigaDB和Galaxy——数据发布、组织和分析的革新

GigaDB是《GigaScience》期刊的数据库,它是一个拥有可公开获取的大规模数据集的数据库,并用数字对象标示符(DOI)进行标示,从而便于检索和引用。《GigaScience》由华大基因和BioMed Central共同创办,是一个在线的、公开访问和公开数据的开放式期刊,主要发布一些涉及生命科学和生物医学领域的大规模数据的研究。大数据期刊提供了一种新的科学出版模式——文章与数据相结合出版。

在这次会议上,来自《GigaScience》杂志的Peter Li给大家介绍了最新版本的GigaDB数据库。该数据库为数据的查询和下载提供了更友好的界面。目前包含有35个以上的数据集,很多之前华大基因未发布的数据,包括基因组学、质谱分析、转录组、表观组和元基因组学数据。

除GigaDB外,Peter还向大家分享了他们与香港中文大学-华大基因跨组学创新研究所(CBIIT)共同开发的基于Galaxy流程系统的数据分析平台,通过这个分析平台,可以使《GigaScience》期刊中报道的那些软件和数据处理流程应用于实际研究中。作为一个试点项目,他们将华大基因的新一代测序数据分析工具SOAP软件包整合到Galaxy流程中,从而为研究人员提供自动的程序化的流程。

Peter表示,“在不久的将来,我们希望能够使《GigaScience》这种在线存储科研流程得以推广应用。GigaDB最终将和基于数据分析的Galaxy平台进行整合,以便使文章中的数据和结果能够以可重复、可利用的方式在分析和评价中得到最大化的使用。”(华大基因通讯员 张钫、刘佳)

1 2 3
赞(0)

评论 抢沙发

评论前必须登录!

 


未经允许不得转载:HIT专家网 » 应对基因组大数据时代:第三届华大基因生物信息软件及数据发布会成功举行
分享到: 更多 (0)