国家基因组科学数据中心建设三周年
2019年6月5日科技部、财务部团结宣布了国家科技资源共享效劳平台名单,其中依托GA黄金甲(国家生物信息中心)建设国家基因组科学数据中心(National Genomics Data Center,NGDC)。NGDC运行三年来,在主管部分、专家照料的指导以及依托单位、共建单位与相助同伴的支持下,面向我国生齿康健和社会可一连生长的重大战略需求,取得系列主要希望和效果,为国家基因组科学数据的归档共享、清静治理和挖掘使用提供了主要支持,入选国家“十三五”科技立异成绩,荣获“天下科技系统抗击新冠肺炎疫情先进整体”。
建成多组学数据资源系统,跻身全球生物数据中心
生命康健大数据是关系到国家生齿康健和生物清静的主要基础资源。针对我国组学数据存、管、用的现实需求,NGDC一连升级更新数据资源,从2019年头的15个数据?槔┱沟较衷诘9大数据类型63个数据库,建成具有自主知识产权、清静可控、涵盖国家人类遗传资源和主要战略生物资源的多组学数据汇交、存储和共享系统,形成“数据—信息—知识”一体化资源系统。
2019年6月至今,NGDC在国际权威期刊《核酸研究》揭晓论文19篇,被该刊称为与美国国家生物手艺信息中心(NCBI)、欧洲生物信息学研究所(EBI)并列的全球主要生物数据中心。
NGDC建成多组学数据资源系统
建设组学数据治理系统,包管数据清静
在生命科学研究领域,研究者获得的组学数据,均需上传到学界及学术期刊认可的专业数据库。由于海内缺乏生命康健大数据治理公共平台,我国学者大部分的组学数据都递交到国际核酸序列数据库同盟(INSDC)的三大数据库。为此,NGDC开发了海内首个组学原始数据汇交、存储、治理与共享平台——组学原始数据归档库(GSA),以及人类遗传资源组学原始数据归档库(GSA-Human)和多元数据归档库(OMIX),形成了组学原始数据治理系统(GSA Family),被Springer Nature、Elsevier、Wiley、Taylor & Francis及Cell等国际著名出书机构推荐为核酸数据存储和共享系统,获得了生命医学领域内主流期刊认可。现在GSA数据库系统已累计支持科技职员在300种期刊揭晓研究论文1018篇,为解决恒久以来我国生物组学数据汇交共享严重依赖国际数据库施展了主要作用。
阻止2022年6月5日,GSA数据库系统已吸收国家重点研发妄想、国家自然科学基金、中科院战略先导专项等资助的5423个科技项目数据汇交,来自563家单位2605个用户,汇交数据量从2019年同期的1.37 PB增添到13.99 PB。同时,GSA已完成与美国NCBI序列片断归档库(SRA)的元数据整合,实现了相关数据资源在NGDC网站的一站式检索与会见,极大提升了海内科研职员盘问和获取数据的效率。
GSA数据库系统已汇交数据量达14PB
建设新冠病毒信息库,效劳全球新冠防控
NGDC于2020年1月22日率先宣布“2019新冠病毒信息库”(RCoV19)并一连更新,同时依托NGDC的基因组数据库(GWH)与NCBI起源建设了新冠基因组序列交流共享机制。阻止2022年6月5日,RCoV19已收录新冠病毒序列1100多万条,为全球181个国家和地区178万余名访客提供数据效劳,累计数据下载超54亿条,为中国—世卫组织新冠病毒团结溯源研究提供基因组及其变异数据剖析支持,在病毒溯源、监测、变异演化剖析等方面施展了主要作用,入选2020年度中国生物信息学十大希望、2021年度中科院科技立异亮点效果。2021年12月NGDC被科技部授予“天下科技系统抗击新冠肺炎疫情先进整体”称呼。
NGDC荣获“天下科技系统抗击新冠肺炎疫情先进整体”称呼
开爆发物信息剖析平台,效劳用户需求
凭证生命科学领域用户需求,NGDC近期开发了生物信息在线剖析平台(BIT),由数据可视化、序列比对、基因表达、表观遗传、基因组组成和新冠序列剖析六个专题组成,安排了生物信息领域使用最多的BLAST在线工具。BIT将一连网络研究职员的剖析需求和建议,集成更多专业化数据剖析工具,一直优化剖析流程和运行参数,为用户提供一连稳固、利便易用的在线数据剖析、挖掘效劳。
NGDC宣布生物信息剖析平台
拓展海内外相助交流,增进开放共享
NGDC起劲开展与INSDC的相助交流,多次应邀加入INSDC年会并做报告,推进生物大数据国际相助共享,提升我国在该领域的影响力。通过跨库搜索引擎BIG Search,实现了NCBI、EBI和海内10余家相助同伴的数十个相关数据资源在NGDC网站的一站式检索与会见。现在针对数据交流和存储机制正在进一步推进与INSDC的相助。
2022年5月在线加入INSDC年会
为增进全球生物多样性与康健大数据开放共享,NGDC在国际生物科学团结会(IUBS)和“一带一起”国际科学组织同盟(ANSO)的支持下,团结巴基斯坦、俄罗斯、沙特、泰国4家学术机构提倡建设了国际生物多样性与康健大数据同盟(BHBD)。现在BHBD成员单位抵达28个,来自亚洲、欧洲、南美和非洲的12个国家,已相助揭晓论文10余篇,培训外洋科技职员200多人次。NGDC与巴基斯坦NIH/真纳大学配合开展新冠病毒基因组测序及演化剖析,并与巴西、俄罗斯、印度、南非相关科研机构团结申报获得金砖国家新冠病毒相助研究项目。
2019年7月在巴基斯坦举行国际生物多样性与康健大数据钻研会
增强团队建设,助力人才生长
在做好科研事情的同时,NGDC还一直增强人才步队建设,通过聚会交流、手艺培训、实践磨炼等多种形式为青年人才生长提供辽阔舞台。近三年来,NGDC作育提升研究员1名、高级工程师3名、外洋引进研究员1名,1人入选国家万人妄想青年拔尖人才,3人入选中科院要害手艺人才,1人荣获中科院青促会优异会员,2人入选中科院青促会会员,1人入选北京市科技新星,研究生获国家奖学金9人次、北京市高校优异结业生2人次。NGDC人才团队建设取得丰富效果,体现了“国家队、国家人”的优异风貌,为肩负“国家事、国家责”涤讪了坚实基础。
2021年度NGDC人才声誉榜
作为国家生物信息中心(CNCB)的主要组成,NGDC一连贯彻落实国家科技生长战略和重大使命需求,提升数据清静、数据处置惩罚、存储和检索等焦点手艺,研爆发物信息大数据要害焦点算法和软件,增强效劳能力和国际影响力,存好、管好、用好科学数据资源,建设支持我国生命科学生长、国际着名的基因组科学数据中心。