隐私计算“软硬兼施”护航医疗数据共享

从算法到芯片的平台级保障

隐私计算“软硬兼施”护航医疗数据共享

今年全国两会上,医疗作为重点民生领域再度受到关切。一是政府总支出更多向民生领域倾斜,特别是义务教育和基本医疗,二是各级政府要把义务教育和基本医疗任务扛在肩上。

简言之,医疗是政府要重点花钱和出力的领域。而作为重要抓手,智慧医疗是平衡医疗资源的有效手段。但美中不足的是,智慧医疗距离真正落地实现普惠仍有距离,问题的症结就在于医疗数据的特殊性。

根据统计,发生数据泄露事件最多的十大行业中,医疗行业居首,未经授权的泄密已经成为医疗行业数据安全的首要风险。多位两会委员都提到,目前智慧医疗面对的最大问题之一就是数据标准不统一,不兼容,数据无法互通共享,数据安全保护不足。

全国政协委员、浙江省政协副主席、民进浙江省委会主委、浙江大学医学院附属邵逸夫医院院长蔡秀军指出,我国拥有庞大的患者群体和丰富的临床病例,但是目前临床数据的整合、利用尚存在诸多不足和障碍,不利于智慧医疗的建设与发展。造成这一尴尬局面的原因在于:首先,医疗数据缺乏统一标准。其次,医疗数据系统不兼容。最后,医疗数据安全保障与隐私保护不足。

全国人大代表、江苏省人民医院党委书唐金海在谈到建立智慧医疗联合体时认为,针对不同类型、级别医疗机构的实际情况,形成一个既有统一规范,又能分层指导的行业标准。实现不同医疗机构之间的信息互通、数据共享,形成区域协同、机构协同、上下联动,构建一个集合人才培养、数据共享、远程会诊、双向转诊、医保支付结算等为一体的智慧医疗联合体。

问题明确后,解决之道便豁然开朗——有委员直接指出了隐私计算的重要作用和应用前景。全国政协委员、启明星辰集团首席执行官严望佳建议,加强人工智能应用相关的数据安全及隐私保护技术研究,在推进数据安全相关法律完善的同时,还应加强隐私计算、安全多方计算等前沿技术研究,在不泄露隐私与敏感信息的前提下,保留数据价值并支持人工智能应用构建所需的高效计算。

简言之,隐私计算就是借助科技让数据可用不可见。隐私计算并非单一技术,而是多种技术路径的综合使用,不仅包含软件算法,也包括硬件环境。其中软件方面主要指多方安全计算(MPC)、同态加密(HE)、差分隐私(DP)等算法,而硬件环境则主要指基于芯片的可信执行环境(TEE)。

TEE支撑数据共享“三位一体”:安全、开放、高效

尽管初看隐私计算给人感觉十分前沿和复杂,但隐私计算的一些技术路径已经相当成熟而接地气了。以TEE为例,其实早就广泛应用于几乎每个人的生活中——手机可以指纹识别和面部识别,这些个人生物信息之所以能被安全使用,正是由于手机芯片中有一个TEE区域。

TEE从硬件层面保护数据安全,涉及敏感数据的计算都在TEE中进行,仅输出计算结果。拿手机来说,要解锁手机或支付时,TEE输出的结果只是此人是否为机主本人,而不会泄露具体的生物信息。

由于TEE与芯片的原生关系,TEE的技术标准和市场现状与芯片一脉相承,如X86架构芯片的TEE方案以英特尔的SGX为主要代表。早在2017年,阿里云就与英特尔联合发布了基于芯片级的SGX 加密计算技术,为云上客户提供了系统运行时的可信能力,云上开发者可以利用SGX技术提供的可信执行环境,将内存中的关键代码和数据保护起来,通过云上的可信执行环境,防止数据被窃取或被篡改。

具体来看,英特尔SGX 是一组能够提高应用程序的代码和数据安全性的指令,可以提供针对信息泄露和篡改的更多保护。编程人员可以把敏感信息放置到称为“飞地”(Enclave) 的一块内存区域里,以获得更高级别的安全防护。

作为一项成熟技术,TEE无疑为生物信息的更大范围安全共享与利用提供了绝佳思路,也让隐私计算行业持续挖掘其潜能。近日,国内隐私计算“四小龙”之一的翼方健数联手英特尔,基于英特尔SGX推出的面向生物医学研究的多方多模态隐私保护平台XDP,有力地加速了数据在生物医学科研领域的价值释放,推动了精准医疗的加速到来。

隐私计算“软硬兼施”护航医疗数据共享

基于英特尔SGX的可信执行环境(TEE),翼方健数XDP平台以提供面向具体商业场景的跨节点数据协作能力为目标,赋能终端用户TEE技术能力,解决数据协作下的数据安全问题,为多种业务场景提供通用能力,并致力于服务于数据联盟,动态撮合不同节点间的数据协同。

XDP 平台通过三个自主研发的核心模块:XFS (XDP File System)、XEE (XDP Execution Engine) 以及DaaS (Data as a Service),兼顾“安全”与“开放”,实现了数据的隐私保护与安全共享。

对此,翼方健数联合创始人兼首席技术官赵玺表示,安全是XDP的首要特点,数据必须在授权之后才可以在平台内使用,原始数据不离开平台。开放则是平台对第三方开放,包括建立数据追溯机制,提供全面的数据安全和授权保障机制。另外还要高效,即平台能够快速适配多样化业务场景。

此外,作为一个通用的隐私计算数据平台,XDP通过平台内的不同应用,可以同时实现包括多方安全计算(MPC)、可信计算环境(TEE)、联邦学习(Federated Learning, FL)和差分隐私 (DP) 等在内的隐私安全计算技术,以满足平台用户在不同场景下的安全计算需求。

隐私计算“软硬兼施”护航医疗数据共享

通用隐私计算数据平台释放医疗数据价值

赵玺指出,随着临床诊疗模式的变化、生信科技发展的突破以及计算机科学的进步,多方参与的医学科研协作在数据、安全、伦理、隐私及科研成果保护等方面面临着新挑战。翼方健数XDP平台的开发落地恰逢其时,实现了在一个独立的平台内解决多用户之间在数据授权使用下安全数据协作的问题。

事实上,不少医疗科研平台已经深刻认识到了数据保护的重要性和迫切性,并积极采用专业隐私计算平台作为解决方案。以翼方健数XDP平台为例,其已在国内多地被多家机构使用,包括政府机构、医疗机构、产业园区等。

比如,南京江北新区生物医药公共服务平台旗下质谱检测与分析中心是亚洲规模最大的质谱产业服务平台,生物样本中心更是国内领先的千万级生物样本库。南京江北新区生物医药公共服务平台还汇聚江苏省8,000万人的健康档案及电子病历,涉及全省三级医院、二级医院和基层医疗机构全量数据。

隐私计算“软硬兼施”护航医疗数据共享

这些高维度、多模态的数据的解读和依据这些数据的决策是临床科学研究的前沿和热点。临床科研转化和药物研发的工作往往需要临床医学专家、生物统计专家、生物信息专家、计算机科学家在内的多学科专家参与,多部门跨地域的科研协作成为了常态。医学科研协作过程中的挑战除了科研工作本身,数据安全、伦理、隐私以及科研成果保护也是决定科研成败的关键。

今年初,南京江北新区生物医药公共服务平台与翼方健数达成战略合作,联合打造多模态多组学数据的一站式分析协作平台。为此,翼方健数XDP平台建立了遵循隐私计算理念的数据存储、计算、协作环境,在数据安全、授权使用和隐私保护下提供了数据采集、清洗、分析、应用的数据全生命周期管理。翼方健数XDP平台通过丰富的功能和优良的生态设计,为多模态多组学数据分析协作提供了一站式服务,大大地提高了科研和临床转化的效率。

在商业领域,翼方健数也于今年初助力某科技园区推出了该地区首个供商业及学术机构进行生物科技研发的生物样本库和生物医学信息平台。

该生物医学信息平台旨在共享生物医药数据,促成企业和学术界交流协作。该平台提供数据目录供研究人员搜索资料及开展机构内部或机构之间的合作项目。他们无需从平台下载数据集,即可视化开发和分析平台上的数据。

数据安全方面,该平台具备严谨的授权和身份验证机制,数据拥有者可完全掌控其数据集的存取权限,还设有数据血缘追溯功能。在翼方健数的技术支持下,该平台已顺利承载了几十个研究项目。

值得一提的是,隐私计算不仅能助推医疗“大数据”服务于更多“大众”,还能让一部分“小数据”更有效服务于“小众”——典型场景就是罕见病诊疗。

罕见病数据具有显著特殊性:一是数据量远小于常规医疗数据——80%以上为非结构化数据,且多个机构之间没有统一的数据标准,造成现有临床数据难以直接用于罕见病研究。二是罕见病数据属于高度隐私敏感数据,涉及的临床和基因数据一旦泄露将造成广泛而严重的影响。

这样的特殊性恰为隐私计算提供了绝佳发挥空间,可以在确保安全的前提下把这类小数据聚沙成塔,放大数据价值为科研与临床所用,最终造福病患。以翼方健数的相关解决方案为例,可以进行临床及生物信息数据的采集、存储、治理、计算与分析。不仅实现罕见病数据的一次采集多次利用,还支持国际常见罕见病相关数据库的整合与支持。

隐私计算“软硬兼施”护航医疗数据共享

知易行难,笃定前行

至此,隐私计算的靓丽“首秀”似乎已为许多场景下的数据难题开辟了新思路。然而隐私计算的发展毕竟尚处早期,要在各行业真正大规模落地依然知易行难,尤其对于医疗这类数据敏感度极高的行业更是如此。

这里的难点主要有两大方面。一方面是技术融合不易,即传统行业对隐私计算技术的认识较为初步,隐私计算技术企业对传统行业的认识也不够深刻,而隐私计算的真正落地却需要双方的深入理解与配合。另一方面是合规不易,即对于不同类型、不同敏感度的数据,不同国家都有不同的保护规范,加之不同行业数据基础设施水平不尽相同,都给隐私计算的大规模落地带来了难度。

目前来看,以隐私计算通用平台为技术底座,再基于这样的隐私计算基础设施为不同行业开发应用,是一条务实高效的路径。从上述翼方健数XDP平台可以得到的启迪是,隐私计算不仅是技术,更应是解决方案。

无论是TEE的硬件路径,还是算法的软件路径,亦或是“软硬兼施”的综合路径,隐私计算企业最终输出给终端行业的并非技术或产品,而是要帮助客户找到实现数据协同,以更安全可靠的方式挖掘更大数据价值的场景。

翼方健数董事长陈恂就曾在采访中提到:“不是翼方健数选择了医疗,而是翼方健数的隐私计算被迫切需要数据协同的医疗行业选中。”相信随着立法的完善与公众意识的增强,未来各行各业对数据安全协同的需求将持续增长,也必然大有隐私计算用武之地。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )