2020年10月27日,国家基因库生命大数据平台(CNGBdb)在第十五届国际基因组学大会(ICG-15)上重磅发布一项全新功能——生命大数据可信计算平台CODEPLOT。
CODEPLOT是一个集可信计算环境和多元化在线分析工具于一体的生命大数据分析平台,是国内首个将数据加密、区块链、安全多方计算、基因安全容器虚拟化等最新安全策略应用于生命大数据分析利用和合作共享的平台。其正式发布将生命大数据的安全共享和利用转化带上了一个新台阶。
上图:国家基因库副研究员丁远彤博士现场介绍CODEPLOT
CODEPLOT是一个灵活、可信的计算平台,用户无需任何编程背景,也可使用该平台的计算工具进行自动化的生物信息学分析。同时,它采用区块链和多方安全计算等前沿技术,确保用户的数据安全。
数据孤岛、数据安全、数据分析门槛……
生命大数据研究面临新挑战
大数据时代下,生命科学的研究模式已经转化为数据驱动的科学发现模式,高效利用多组学、多层次的大数据可有效促进各领域的基础研究及科研成果转化。然而,以下痛点仍然有待解决:
当前,生命大数据多分散在科研工作者手中或研究单位内部,数据孤岛化问题严重,如何打破这一局面?
数据共享有助科学发展,可是信息安全问题日益突出,如何在保障数据安全的情况下进行数据共享?
在数据驱动的科学发现模式中,数据分析必不可少,但需要交叉学科背景,非专业人员如何突破高门槛?
……
为了解决生命大数据研究中的上述新挑战,CNGBdb打造了集可信计算环境和多元化在线分析工具于一体的生命大数据分析平台CODEPLOT。
打破孤岛/门槛的数据安全共享新模式
可信计算平台CODEPLOT
CNGBdb可信计算平台CODEPLOT基于区块链和安全多方计算等技术,以数据汇交模块存储的海量数据为支撑,以灵活工作空间管理模式为核心,同时提供多元化分析工具,全面打通各科研机构之间的数据孤岛,突破数据分析门槛,提升数据利用率,促进重大科研项目合作共享及成果转化。
上图:生命大数据可信计算平台CODEPLOT
CODEPLOT为用户提供:
一、可信计算环境
基于多级权限控制,利用数据存储加密、传输加密和安全多方计算等技术,使得用户能够在不公布己方数据的前提下,完成自有数据分析;以“虽彼此不可见,但可共享使用”(即“可用不可见”)的方式,完成协同分析。同时结合区块链技术,保证所有数据和计算过程均可回溯且不可篡改,为平台用户提供可信的计算环境。
二、多元化工具集
提供常用的生物信息分析流程,包括单细胞聚类scanpy分析、转录组差异分析edgeR分析、HMMER基因家族分析、新冠病毒数据BLAST检索等16种分析流程。同时,支持用户使用流程管理工具WDL搭建自定义的分析流程。
三、个性化工作空间
采用工作空间构建计算沙箱,用户可在自己的工作空间内选择分析工具、数据集和计算模式。采用单方计算模式时,用户可单独针对自有数据进行分析,或者与平台现有的公开数据合并分析;采用多方计算模式时,用户通过共享空间方式与不同地域研究者/研究团队进行协作分析。
四、开放式数据资源
用户可以利用三种不同的数据集进行分析:1.公开数据集,即平台基于CNGBdb及其他公共数据库(如NCBI、Pfam等)的数据资源建成的公共数据集,涵盖植物、动物、微生物、疾病等多个研究领域。2.私有数据集,即用户自行上传的自有数据集。3.授权数据集。合作伙伴可以授权对方使用自己的私有数据集,以进行联合分析。
不论你是否有生信背景,即使你与合作伙伴相隔千里,CODEPLOT都可以帮你完成数据分析并实现安全共享!
注:CODEPLOT由CNGBdb团队设计开发,由华大磐石提供安全相关的技术支持。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )