浪潮高性能计算助力臻和科技告别基因研究的“小”困扰

臻和(北京)科技有限公司正在构建从基因测序数据生产,到样本数据挖掘分析,再到备份保存和群体复查的信息流全生命周期管理,浪潮天梭TS10000高性能集群解决方案采用了TStor3000并行存储系统,有力支撑了肿瘤个体化精准诊疗和伴随诊断的科学研究与商业运营,实现了对存储资源的最大化利用,帮助臻和科技提升生产效率,个体基因测序数据运行时间缩短了50%。

美国癌症学会官方期刊发表的《2018年全球癌症统计数据》报告显示,中国已成为癌症发病率、死亡率最高的国家,全球每新增100个癌症患者中就有21个中国人。在中国,平均每分钟有7个人确诊癌症,每分钟有将近5人死于癌症,肿瘤精准诊疗已成为迫切而必要的趋势。

作为改善肿瘤患者生命质量的引领者,臻和(北京)科技有限公司(以下简称臻和科技)借助浪潮TStor3000并行存储系统,得以高效的开展针对主要癌症的基因病理特征、个体化精准诊疗和伴随诊断等医学研究与医疗服务。浪潮TStor3000是基于目前欧洲非常流行的BeeGFS商业版并行文件系统开发和优化版本,专门针对高性能用户需求设计的并行存储系统。

基因研究的“小”困扰

臻和科技创立于2014年,以二代测序技术和生物信息学为核心,从事无创为主的肿瘤个体化精准诊疗和伴随诊断。目前,臻和科技已建立优化的游离DNA提取及定量检测技术平台,具备国内首创的基于游离DNA检测的多个实体肿瘤的伴随诊断、预后评估、用药指导的技术平台。

信息流的全生命周期管理是臻和科技研发、生产与医学检测等各项业务的基础所在,它涵盖了大量测序数据的产生、挖掘分析、备份保存以及群体复查等环节。在信息流的全生命周期管理过程,臻和科技面临的一大挑战在于小文件的并行处理与高扩展性的分布式存储,HPC系统在这方面的性能表现,将直接影响到科研进度与相应医疗服务的开展。

臻和科技早期癌症诊断类的基因序列数据通常由千万到亿万条的基因片段组成,需要通过大量的比对和纠错才能拼接成完整的基因序列,随后再经过大量病例样本数据的对比,找到诱发肿瘤病变的基因变异特征。在这一过程中,拼接结果的准确程度、拼接的速度都与HPC提供的计算力息息相关。当数据从高速的计算设备中被完整记录和备份,进入归档程序后,还需要进入群体数据的回顾挖掘,积累出中国人群特有的癌症基因数据库,对存储的高扩展性有着较高要求。

周期缩短50%,浪潮基于BeeGFS的并行存储系统来帮忙

此前,用于生命科学领域的HPC平台多采用基于Lusture文件系统,但在实际使用中效果并不理想。针对于此,浪潮为臻和科技设计了基于BeeGFS并行集群文件系统的高性能集群解决方案,率先实现了BeeGFS在国内生命科学领域的部署。

浪潮天梭TS10000高性能计算集群系统能够提供超过500个计算核心,计算峰值速度达到50TFlops/s(万亿次),可在4小时内完成一个人的全基因序列拼接、比对;存储方面,TStor3000内置的BeeGFS并行文件系统可提供极高的IO性能,充分发挥每块硬盘的读写速度,满足二代基因测序大文件带宽需求,在处理三代基因测序场景下小文件并发的时候,BeeGFS也能发挥不错的效果。带宽可以达到写7GB/s读5GB/s。

浪潮高性能计算助力臻和科技告别基因研究的“小”困扰

BeeGFS具备高性能、高可靠性、存取读取方便等特点,可以大大满足用户对数据安全可靠性、存取和维护的需求。其可为元数据和对象数据提供镜像功能,使系统在半数服务器失效的情况下,业务不中断,数据不丢失。BeeGFS还有一项非常有代表性的功能——BeeOND,用以满足高性能用户计算过程数据的读写需求,轻松达到高带宽高IOPS的效果,并且可以通过作业调度系统快速地启动和关闭文件系统,并将其中的重要数据快速地可以转移到后端存储中,既保证计算,又不影响数据存放。

浪潮高性能计算助力臻和科技告别基因研究的“小”困扰

浪潮高性能计算助力臻和科技告别基因研究的“小”困扰

在部署了浪潮天梭TS10000高性能集群系统后,臻和科技在系统易用性、生产效率提升、存储成本降低上均获得显著改进。臻和科技相关负责人表示:“通过BeeGFS的分布式存储功能,我们实现了对存储资源的最大化利用,有效降低了存储开销,并且满足了对存储安全性及数据全生命周期追溯的需求。同时,系统易用性的提升极大的降低了使用门槛,从而提升了生产效率,个体基因测序时间缩短了50%。”

作为中国最早涉足生命科学领域的HPC解决方案提供商,浪潮对基因研究的应用特点拥有深厚积累和深刻洞察,始终致力于以先进计算技术及解决方案,推动精准医疗的发展。目前,浪潮高性能计算系统已经在中科院北京基因组所、苏州大学医学部、上海儿童医院等众多医学研究与医疗服务机构部署,为解决人类面临的重要医学问题提供领先的计算力支撑。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2019-03-19
浪潮高性能计算助力臻和科技告别基因研究的“小”困扰
臻和(北京)科技有限公司正在构建从基因测序数据生产,到样本数据挖掘分析,再到备份保存和群体复查的信息流全生命周期管理,浪潮天梭TS10000高性能集群解决方案采

长按扫码 阅读全文