孙立林,矩阵元创始人兼CEO。Chinaledger创始成员及技术委员会副主任、中国证券基金业协会金融科技委员会委员、第三届上海金融青联委员。历任中国银联战略发展部高级研究员、市场发展部资深高级主管及银联子公司常务副总经理。
长期从事支付清算金融基础设施的战略规划、产品创新、行业拓展及第三方支付机构管理。2013年进入区块链领域,2014年创办矩阵元技术有限公司,专注于区块链技术基础设施与隐私计算网络的研发与商用实践,是零知识证明、安全多方计算、全同态加密、算法博弈论等计算复杂性理论在中国乃至全球的布道者及赞助者。
9 月 25 日,「GMIC在线Pro」圆满落幕,在为期一天两晚的活动期间,有来自全球多个国家和地区的100+位演讲嘉宾、142家企业参与其中。通过多场主题演讲和圆桌论坛,围绕科技、商业、科学、全球化、人类命运共同体等话题,展开了多形式、多维度、高标准的分享与跨界对谈。
在全球营销增长大会「逆势生长」板块,矩阵元技术创始人兼CEO孙立林带来了「隐私计算与数据融合基础设施」主题演讲。
以下为孙立林演讲精彩内容:
1.“为什么是隐私计算”
谢谢主持人,谢谢各位朋友们。今天给大家介绍的主题是「隐私计算和数据融合基础设施」。
昨天活动以太坊创始人和其他朋友们给大家介绍了怎么看待下一代的金融基础设施,这也是我们一直在做努力的方向。
这是一个基本的问题,就是我们为之努力的区块链技术或者隐私计算密码学到底是为了解决什么问题?为什么非它们不可?
我们想应该是从数据本身来谈起。数据作为一个基本生产要素,如此巨量的涌现,也导致了非常复杂的数据的所有权以及相应的如何保护数据产权的问题。
从最近几年开始,全球的互联网巨头都在这方面遭到法律的阻击,尤其是Facebook、谷歌被罚了非常多的钱,Facebook将近50亿美金,最近苹果也宣布所有的用户隐私将得到非常严格的保护,在国内去年也抓了很多相关公司的创始人因为数据的原因,所以引发了相当多的问题,这些问题是怎么来的呢?我们是从这三个方面来理解。
分布式或者日益趋向于分布式的世界是由三个要素来刻画,一个是节点数量,一个是每个节点产生数据量,还有一个就是节点之间的连接数量。
节点数量变化代表着参与计算或者参与全球数字公共治理的人数或者是机构数量的增长。而相应数据的增长代表着处理事物的复杂性的增长,而连接的增长代表着相应处理的范式甚至经济体的经济模型的增长或者变化。
正是因为这些原因所以我们选择了区块链来作为数据治理的金融基础设施,并且选择了隐私计算来作为数据所有权确认的一个基本方法和定价的工具。
2.“数据的交换与共享基础”
我们理解在数据要素里有这么多的基本点是需要考虑的,就包括从数据的全生命周期来处理所有问题,而不是孤立看待它,因为真正有价值的资源并不是全量的数据,而是数据的可计算价值,也就是说数据可以被计算的部分才是真正可以被用于定价估值和交换、共享的部分,才是要素。并不是所有数据都可以被计算,也不是相应的有价值。
我们看到的问题是,从资产的数据化到数据的资产化,乃至于数据最终的货币化,这里面需要对很多问题进行梳理。
特别想跟大家分享的就是数据的公共性,绝大多数参与的计算节点本身,不论是个人还是机构,不具有相应的保全和处理能力,需要把使用权和部分所有权让渡给相应的数据处理方,比如今天的云计算公司或者互联网公司,实际上就做了这一点,它不仅拿了部分所有权,事实上是几乎拿了所有全部的所有权,这也是今天的矛盾根源所在。
大家可以看到在传统的数据领域里边被分成了这么多的机构,实际上都是比较割裂、分散和孤立的,数据的力量并没有真的被整合起来,每一个片段的机构和个人参与的都只是小数据,而不是大数据。所以我们提到要呼唤数据融合基础设施,把这些都整合起来。
我们刚才提到数据的全生命周期,依次是数据的生产和采集,它对应的基础是IOT。
第二部分是过去十年习惯的计算和存储,就是大家开始用云计算来控制成本,来大规模的产生集约化效应。
今天大家关注区块链隐私计算其实是数据的交换和共享这部分,只有隐私计算这个技术的引入才可以构造新的范式或者方法,让大家能够把数据共享起来。
它基本就是运营商架构,最早的数据交换网络或者信息交换就是中国电信为代表的电信运营商,是垂直领域里边有银联等来处理金融信息的交换和共享。再往上随着帐户往前置,大家习惯使用微信支付等等这样的支付工具,实际上它把信息的处理或者数据处理前置了。但是只有到了区块链这个时代真正实现了全网的数据交换,有了隐私计算密码学的加持,可以实现全网的共享。
在这个基础上,才能把分散在不同政府部门、金融机构、各个互联网公司之间的数据从小数据变成大数据,使得最后一部分才有AI和大数据公司进入这个战场,基于构造的基础设施来处理这个问题。所以我们才说区块链和隐私计算共同面向的是数据融合基础设施,只有有了这个基础设施,过去的AI和大数据才能真正在人类社会里面被广泛使用起来。
3.“数据要素的金融化”
我们把它叫「采、存、算、管、用」,就是数据这几方面来处理,但是更核心更像一个金融业务。所以我们提到它更像数据资产或者数据资产化服务,把数据做成资产或者数据
计算部分来当成传统的金融业务,做存、贷、汇相关的服务。
我们最近跟国内多家商业银行合作探索的面向数据资产的银行服务,大家可以看到数据的总量产生千亿以后,实际上我们产生了非常多的应用场景。
从银行来说需要基于用户数字身份和银行证明以后对数据进行签名,确认它的权属关系,并且提供相应的存储托管服务,利用银行的技术能力来提供计算。这样的话,我们看到最简单的场景就是合格投资人或者是联合建模等等。
在开放架构下隐私保护的需求是不一样的,目前传统的解决方案我们认为已经不能满足现在的需求,所以引入很多新的计算方法。一个是我们把它叫做广义的隐私计算条件下的,可以结合不同的密码算法,从数据源头来入手解决数字的身份标识,来解决数字的所有权问题。
大家可以看到,我们做的最多的一个算法叫安全多方计算,为不同种类算法逻辑,比如数量的统计,量化模型,机器学习等等,不同开放银行的API提供本地数据密文处理之后的多方计算能力。它并不是传统的明文交换,而是变成全过程都是在密文。
传统技术是怎么做的呢?传统技术是加密以后一定要解密,针对解密后的明文来算。而新的隐私计算是整个过程都在密态情况下来计算,它导致的变化就是到最后整个消费模型变了。只有在相关的隐私计算的加持下面才能实现真正的所有权的确立,把数据价值向使用权的交割,而所有权没有被动摇,这样才能真正把它金融化。
刚才简单介绍过的开放银行下到底能够做哪些工作?我们提到数字化生态银行。传统的开放银行它的API调用多数都是直接两家机构来调,这个数据也局限在这两家。就会出现一个问题,两家的帐户和ID都不愿意向彼此直接开放,当然了,也取决于相应的成本。
可是今天我们能够做到的是,第一如果用户对这些信息敏感,可以对算法数字做完全的身份变化。第二如果用户对数据内容敏感,可以通过算法加密手段进行不可逆转的保护和计算过程。第三我们还可以实现对算法本身也进行加密和保护,因为有大量的算子或者建模方法,尤其是银行的风控也是不可以暴露出来的。可以用的地方非常广泛,许多银行做联合营销、征信和增值服务或者是风控,都可以基于这个方法来处理。
4.“数据需要新的治理结构”
数据要素必须要有一个新的治理架构,实际上机会是来自于在隐私计算条件下可以先做分布式的身份认证,然后在这个基础上形成分布式的用户画像,到最后构造出分布式的信用体系。
今天我们的数据是完全由互联网垄断的。大家注册一个APP的时候需要提交你的身份信息、手机号码或者微信号码,登记信息就是你的访问记录。比如你今天买了一个包还是买了一瓶酒,还是买了一本书,这些流水都在他这里,到最后整个物流信息都被拿走了。
在未来合理数据治理架构下面,应该是三权分立的。是由政府或者是持牌机构来拥有用户的身份信息,所有的登记信息孤立管理开来,只有相应的机构可以做相应的数据交易。这样分拆以后才能真正保证我们数字权益不被侵犯。
尤其是机构间业务这件事情势在必行,特别是各地政府多少面临着跟互联网公司的数字博弈,特别是健康码。通过这种方法才能固化本地数据财政的根本利益和人民的数据权益。
但是这件事情很不容易,我们也列了很多它的成功的关键要素。
最内层主要是技术上的。因为引入了隐私计算和区块链以后它的性能和效率有所损失,这是一个经典的博弈或者取舍。
在中间这一层里面,从应用来说它的流程再造和经济模型也很重要。因为如果没有适当的经济激励的话,大家不知道为什么一定要通过这种方式来买数据。很多数据就被锁死了。
最后一层,今天实际上在上位法没有完全明确之前,行业监管和相关的技术标准、治理模型并没有非常清晰。比如我们个人信息保护法,网络安全法,密码法可能大概有4-5个上位法都会对数据所有权做相应的约定。大家看到欧盟的GDPR做了相对来说偏严苛的约定在中国是否可以这样处理,一下子把今天格局全部打翻,这个也难,最终用户授权如何获取,这也是一个法律问题。
只有在若干重要要素都解决的情况下,才能真正实现国家目前提出的数据共享基础设施或者数据融合基础设施。
5.“数据要素的「超级清算方」”
数据要素的「超级清算方」是我们提的一个理念。
真正的含义在于在今天的条件下,每个行业都有各自的信息交换中心或者是数据中心来孤立的处理各自数据,实际上限制了数据的流动性。
它本质上就是提供了跨行业、跨帐户、跨云、跨应用、跨资产的基于数据要素的公共基础设施,非常类似于今天大家打电话用的或者是上网用的电信运营商。这个架构下才能把端侧的数据来源和分布式应用在这个基础上能够使用起来。
所以我们需要提供的是可验证的安全性和可持续的经济模型,以及可度量的制度性的交易成本。这个可度量的交易性成本的本质就是大家通常说的区块链解决的信任问题。信任我们是这样翻译,就是可度量的制度性交易成本,但它并不完备,还需要可验证的安全性,大家才能放心把数据拿出来。
我们对这个事情做了一个分解,分成四类。满足这四类条件的基础设施才可以被认定是下一代的数据融合基础设施。
第一就是可管控。能够包含不管你用区块链技术还是联邦学习,还是密码学,还是其他的技术硬件架构都必须做到全程全网客观可控。
第二就是它的治理策略做到安全性可验证。从ID到链上数据确权,到合约的自动执行,到最后数据本体被加密,都是要做到可验证,这个在算法上有很高的要求。
第三就是可计算。刚才说并不是所有数据都有价值,只有数据的可计算部分或者是可计算的数据资源才是能够被基础设施所承载,而可以说未来绝大多数的数据某种程度上会被当做「次品」来处理。
第四是就是要可度量、可衡量。只有在这个条件下才能实现全程全网的计费、健全、认证,让大家真正放心能够把自己的数据拿出来交易。
6.“终极的价值交换网络”
我们为此构造一个价值交换网络,有不同的数据源。
比如保险公司想拿医疗数据、教育数据,想拿你在银行合格投资人的数据,甚至他定险的时候还想看你的交通行为、驾驶行为和其他的消费行为数据等等,这些都必须进入到一个融合的协同平台里面。
在这个平台里面我们会通过软硬一体方式把它的所有权、使用权、收益权完全分开,最终通过计算和建模,就可以用各自不同AI算法来处理这些基本的数据。
只有在这个架构下面,这个网络条件下面,才能把小数据变成可计算的资源,进一步的资产化,到最终的货币化。我想这是一个非常终极的愿景,也是可以在三到五年内就可以支持的。
从最底层硬件,到密码学,到上层区块链,以及在中间产品层我们需要分布式的身份系统和多方的密钥管理系统,可信的计算外包系统,才能支撑如上的这么多行业应用。
今天用的最多的还是金融,因为金融数据格式化、标准化做的最好,还有政务数据、广告营销。大量的大数据公司在银行要调它的数据的时候,实际上都有非常严格的合规性管理,今天都提出了非常高的需求。
也包括工业互联网,因为设备间的数据调用也是非常敏感的,这会导致整个工业互联网格局做不大,只有在隐私计算条件下大家才能解决这个问题。
最后是我们公司的小小的介绍,这是我和其他团队成员共同发起的公司,肖总支持我们一起创立的机构,我们长期把自己的主要战场放在学术上面,我们跟众多老师、学术团队建立了非常紧密的合作,在融合基础设施里面能够走在全球的前列。谢谢,我就介绍到这里。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )