近日,2020年第八届CCF大数据与计算智能大赛决赛暨中国大数据技术大会在长沙举行。本届大赛共设置4大赛道,共计20道赛题,吸引了来自全球25个国家、1247所高校、1873家企业的43795人,37994支队伍参赛,提交作品83361次。其中,算法赛道的《非结构化商业文本信息中隐私信息识别》赛题出自企业级数据分析和组织智能服务平台商明略科技。
随着社交网络、移动通讯等技术的迅速发展,网络中存在大量包含隐私数据的文本信息。如何在非结构化的本文信息中,精准识别隐私数据,并对其进行保护,是亟需解决的隐私保护领域的问题。
在商业领域中,在保证双方隐私信息(公司及其客户的技术数据等)不被非相关人员或企业泄漏的情况下,收集客户需求并进行挖掘通常需要对本文中的隐私数据提取后,做进一步匿名化等隐私保护操作。而现有的隐私保护方法,如K-匿名、差分隐私等技术较为成熟,但缺少对隐私信息识别的关键技术。
明略科技作为出题单位,将此次赛题的关注点集中在隐私属性的识别问题,针对非结构化的本文信息进行分析,精准提取所涉及的隐私信息,为后续隐私保护操作提供支撑。
目前,明略科技面向隐私数据的全生命周期均有相应的安全技术支撑,在整个过程中,除常规隐私信息外,还考虑到准标志符对于隐私泄漏的影响。在数据存储阶段,采用密码学(MD5、SHA256、AES、DES)、访问控制(RBAC)等手段保障数据安全性;在数据传输过程中,采用多源数据融合的差分隐私、加密(DH、RSA、Paillier)、数字水印等手段保障数据的安全性和完整性;在安全计算阶段,采用多方安全计算(SS、OT、GC、PIR、PPDM)、联邦学习(HFL、VFL、FTL)等手段保障隐私数据的安全性。
据悉,CCF大数据与计算智能大赛,由中国计算机学会于2013年创办,是大数据与人工智能领域的算法、应用、系统、创业大型挑战赛事,目前已成为中国大数据与人工智能领域最具影响力的活动之一,是大数据综合赛事第一品牌。大赛面向重点行业和应用领域征集需求,以前沿技术与行业应用问题为导向,以促进行业发展及产业升级为目标,以众智、众包的方式,汇聚海内外产学研用多方智慧,为社会发现和培养大量高质量数据人才。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )