复旦大学郑磊:公共数据开放存在四大问题,建议面向场景开放

5月27日消息(南山)在昨日举办的“2022中国国际大数据产业博览会”之场景大数据论坛上,复旦大学数字与移动治理实验室主任、国际关系与公共事务学院教授、博导郑磊发表演讲,畅谈了公共数据开放面临的主要问题,并提出了“面向场景开放”的建议。

郑磊指出,加快数字化发展、建设数字中国,需要激活数据要素潜能,加快三个方面建设,即:数字经济、数字社会、数字政府。公共数据开放是其中的关键一环,根据复旦大学数字与移动治理实验室的报告研究,我国2012年仅有3个地方政府上线了政府数据开放平台,到2021年提升至193个,其中省级20个,发展速度很快。

但是,报告中仍然发现了一些问题,主要体现在以下四个方面:

第一,不充分。目前全国地级、副省级和省级开放平台仍然只占全国覆盖率一半,还有一半的地级、副省级和省加一起没有上线数据开放平台。在已经上线这些平台,开放的数据在数量上还相对比较少,容量比较低。也就是说数据级打开了以后,里面字段和条数低,俗称容量低,颗粒度比较粗,开放的质量也较差。政府数据以外的公共数据开放不充分,现在更多看到的是政府数据,但是还有高价值的数据,比如国有企事业单位,特别是水电煤公共设施、交通、气象机构开放的数据,也在公共数据的范畴里面,但是这一类数据开放不充分。

第二,不平衡。开放数据数量、开放数据级的数量、平台数量还有数据的容量在各个地区之间分布不平衡。有一些地区做比较好,还有地区相对比较弱,开放方式也不平衡,现在以普遍性的无条件开放数据比较多。但是无条件开放在平台上谁都可以下载数据,相对来说价值不高,颗粒度不细。真正高价值数据也是相对敏感数据,这一类数据现在一般通过有条件开放或者授权运营的方式开放给社会,但是这一类开放方式目前还比较少见或者没有真正的开展这方面工作,更多是普遍开放或者无条件开放。开放数据的主体领域,如:交通、气象、卫生主体领域之间分布不均衡,有一些领域全国开放相对好,有一些领域开放弱。参与开放的委办局部门分布不平衡,有一些部门参与程度比较深,开放数据多。但是也有一些地方某一些类型部门,或者总体上在全国有一些条件部门开放数据不多,所以在部门之间分布仍然不平衡。地区之间的利用水平也不平衡,有一些地方对于数据的利用程度相对高,开发出了各种应用。但是有一些地方比较弱,基本上没有看到真正基于数据开放以后所产生的利用成果。利用主体和利用成果分布不平衡,利用主体主要体现在企业上,但是其他的社会组织对于数据的利用不充分。包括成果本身也集聚在某一些领域,但是其他的领域相对成果少,这个主要是不平衡的问题。

第三,不协同。开放数据平台无论是横向的跨地域平台,还是纵向跨层级平台,包括省和地市之间关系,这些平台没有联通,更多看到是碎片化的孤立平台。有一些地方省级平台包括下属的地市,这些地方整合度高。但是仍然有很多地方省级平台或者地市级平台,或者地市平台之间都没有互相联通。即使有一些平台联通了之后,可以发现在这些平台上开放数据内容,它的主题、数据集的名称以及开放的数据集即使名称一样,开放字段标准、颗粒度的标准都不一样。如果到两个地方看他们数据集,会发现数据集开放上有A省开放数据,B省没有开放;或者B省开放的数据,A省没有开放;或者A和B省都开放这类数据,但是开放的数据标准不同。比如有的地方以日为单位开放,有的地方以月为单位开放;有的地方开放这个字段,有的地方没有开放这个字段。即使发现两个地方的数据级内容是一样,标准对不上,就没有办法把这个数据放在一起融合利用,特别是跨层级和跨地域上问题表现非常明显。利用成果也是跨地域之间不协同,我们看到基于某一个城市开发了一个应用,但是这个应用只用了这个城市数据,到另外一个城市没有这样的应用。这个应用只是基于本地数据开发,为什么这个应用没有用其他地方数据?主要的原因并不是应用时没有想到要去用其他地方数据,而是同样的数据在这个地方开放了,在另外一个地方没有开放。所以这个应用不可能成为跨地区应用,因为其他地区同样的数据没有开放出来。这也是数据利用成果的跨地区不协同。

第四,不可持续。主要体现在:平台运营服务不稳定。把平台作为建设项目,把平台建设开发完后上线,后面并没有稳定的团队运营平台。有一些企业或者团队、社会组织向平台提出数据需求,说需要这样的数据或者提出建议,或者有一些纠错,发现这个数据有错误,想反馈给平台,发现平台完全没有回应。就是说平台只是一个建设项目,不是常态化服务的运营平台,后面没有团队长期提供服务,可能有团队做技术运维,但是并没有团队在做服务运营,所以这方面不稳定。这样的话,老百姓或者企业在平台上进行各种互动没有得到回应的话,这个平台就不可持续。另外平台上虽然有一些数据开放出来了,但是数据更新不及时,有一些是几年前的数据,真正有价值的数据应该是实时动态更新的,如果这一点做不到,也是不可持续的平台。还有就是数据利用促进活动没有实现常态化。可能各地都组织了大赛,看到很多地方都组织大赛,但是大赛有的时候一年搞一次,有时候搞一次后来没有了。就算一年搞一次,比赛完了以后,日常利用促进活动就没有了,并没有实现常态化。

整体而言,开放一侧的政府机构和利用方包括企业和团队、科研机构,在供需之间没有形成价值的共创闭环,需方找不到供方,供方只管放上自己认为大家需要的数据,没有思考过需方需要什么数据;或者需方提出需求,供方完全不知道,或者根本没有回应,没有运维平台。供需双方没有形成对接,这边开放了很多数据,但是大家真正要的数据没有开放;这边不断提出需求,但是找不到门路拿到他想要的公共数据。

怎么解决上述问题?

郑磊介绍,数据开放早期存在一个“默认开放原则”,凡是不可以开放,涉及到安全、个人信息保护、商业机密的数据不能开放,其他数据可以开放。这个模式听起来理想,但真正推进的时候效果并不理想。开放的数据不是别人要的,别人要的数据没有开放。全球渐渐都在思考这个问题:有目标地开放数据。

郑磊探讨了面向场景的开放。回到更具体更加接地气、更可操作目标,比如交通场景、气象场景、普惠金融场景等,释放高价值数据的潜力。郑磊进一步认为,数字经济、数字社会、数字政府,就是三大场景,然后在三大场景下细分具体的小场景。

例如数字社会,十四五规划关于数字社会这一章的话:“要聚焦教育、医疗、养老、妇幼、就业、文体、助残等重点领域,推动数字化服务普惠应用”,那么这些就是具体的应用场景。郑磊建议,政府一方面可以自己开发普惠类应用,另一方面可以开放给市场,结合企业和社会已有数据,创造更好的普惠应用。数字社会服务模式和产品创新提供,需要社会力量参与,地方政府需要在保证安全和隐私的情况下,赋能相应的公共数据。

三个场景之间也有多向循环关系:互相之间相辅相成、互相支撑,任何一方都向另外两方赋能,另外两方反过来反哺或者重塑、促进这方建设。这样形成一个面向场景的公共数据开放利用的体系。在这个过程中,地方政府一是要有利用公共数据向经济社会赋能的能力;二是要有包容和众创能力,让整个社会参与利用公共数据过程当中,享受数字经济带来的红利;三是加强公共数据统筹治理能力,参与打造各类应用场景,构建整个数字生态,最终目标是推动数字化发展。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2022-05-27
复旦大学郑磊:公共数据开放存在四大问题,建议面向场景开放
复旦大学郑磊:公共数据开放存在四大问题,建议面向场景开放,C114讯 5月27日消息(南山)在昨日举办的2022中国国际大数据产业博览会之场景大数据论坛上,复

长按扫码 阅读全文