陕西大数据集团路琨:四点因素导致数据供给和需求不相匹配_通信世界网
日期:2023-12-19 03:54:52   来源:媒体公告

  随着大数据战略的全方面推进,政务大数据已被列入政府管理改革范畴,其开放与共享对于促进政府自身转型以及产业经济转型的重要意义,受到各方的积极关注。陕西省大数据集团时代远景研究院常务副院长路琨在大会期间,介绍了政务数据在陕西的实践。

  路琨称,政务数据开放的价值很大,但是现在政府推动的一些政务数据平台开放应用的效果不是很好,数据供给和数据需求存在着不相匹配的问题。造成这类问题的问题大多有四点:

  路琨:各位领导、各位嘉宾,今天和大家交流的这个题目是“政务数据的可信共享和多云开放”,从两个方面对主要是在陕西的实践和大家做一个汇报和交流。

  先给大家粗略地介绍一下来我来自什么地方?我来自陕西省大数据集团,这个集团是在政府主导下成立了的一个国有、专门用于运营政务数据的一个企业,政府对它的定位是盘活政府数据,带动社会数据,引导产业发展。

  陕数集团成立之后,可能从一开始做,所以在很短的时间内,把省内做电子政务、做大数据相关的企业也做了一个整合,目前是已并购了未来国际,也已经和清华紫光专门成立了做气象大数据的公司等,做了这样一系列的省内资源的整合。

  那么已有的业务基础比较有特点的是,我们现在已经建立起全省省级两级同构的平台,在这样的平台的基础之上,实现了全省的云、数、用等等,这样和政府相关的主要的资源一体化服务,包括全省的政府部门对于云的这样一些需求,包括对于数据应用的支撑等等这样一些方面,应该说绝大部分已经在全省统一的政务云的基础之上实现了。

  那么在这个基础之上呢,对于政务数据也实现了绝大部分的汇聚以及初步的共享和开放,在汇聚这方面,像基础的信息,包括人口的基础数据、法人的基础数据和宏观经济的基础数据,都已经汇聚在这个政府平台之上。现在也已经建成了整个陕西省政务数据交换的平台和陕西省的公共数据开放的平台,当然这两个平台也是建成没有多长时间,所以说在政务数据的交换和共享方面,我们也是在做实践和探索。

  在这个实践探索过程中,我们有一个我们自己创新的产品,我们把它叫做智链立交桥,我们大家都希望通过一些数据,在共享和交换,包括开放的一些难点,通过技术的手段予以解决。所以我们从技术的这个角度,我们研发了一个产品,我们叫智链立交桥,这个产品也是入选了今年在福建举办的首次数字中国峰会上面最佳实践案例。后面也会结合我们的这个产品做一个具体的介绍。

  下面结合政务数据的共享和交换两个方面,给大家做一个交流,首先在政务数据的共享方面,当然政务数据的共享刚才汪教授也提到,存在着很多难题和瓶颈。前一段时间,我们和汪教授还做过交流,他认为可能最大的问题是在体制机制这个方面,当然那个是非常大的话题,所以我主要是结合实践路线这个方面做了一些实践。

  在政务数据共享这个方面,如果是我们和政府去做交流,包括去实现这个事情,其实存在一个很大的问题,就是大家对于政务数据共享的这个规则是有很多疑问的。比方说它会关注我和你共享之后,我的这个数据是被拿到哪里去了?包括是被谁用了?你拿走之后,你用之外,是不是还有别的部门会使用?包括我的这个数据会不会被篡改?包括我花钱费时费力来收集的数据,为什么别人会免费的来使用?包括数据使用之后的结果是谁负责?包括会对我带来哪些益处?我觉得这个都是在政务数据共享过程当中,政府部门很自然的就会有这样的一些顾虑和考虑。

  所以说,这些顾虑和考虑就会产生一些结果,就会在政务数据共享的过程当中,它就会找理由不提供,包括摆困难、不更新,包括一些安全的借口,不担责等等,这些都是阻碍了政务数据的交换共享。因为没有解决这些问题,所以我们虽然出了很多文件,发明了很多规则,但实际上效果还非常不好的,还是没有完全实现可信的政务数据共享交换。

  基于这样的一些顾虑和考虑,包括遇到的一些难题,我们就考虑怎么样实现,从技术的角度,怎么样实现政府部门之间可信、安全,没有顾虑的政务数据交换?我们结合了区块链的技术,因为我们发现区块链的很多特征,实际上是解决政务数据共享当中大家互相不信任的非常有用的一个工具和技术。因为我们是希望能够通过区块链的技术能够把政务数据共享当中之间的权责问题,包括数据的不可篡改性的问题,包括数据什么时候用?什么时候能让你看?什么时候能让你用?什么时候用完以后就要销毁等等,这样的一些需求,实际上是跟区块链的技术比较契合在一起的。所以我们尝试在共享当中应用区块链的技术,包括通过这个技术实现你的数你作主,授权使用不带走,以及数据的可监和可用,和可用不可取等等这样一些目标。

  那么在智链立交桥应用过程中,有三个主要的利用场景是我们主要探索的一个方向:

  1、数据的可用不可见。就是你可以用我的共享数据,但是你不一定能够看见我这个数据,包括特别是不一定能看到我这个原始数据,这是非常重要的应用场景。

  2、通过数据的交换,实现数据的共享,但是数据并不落地。这个也是为了消除各个部门在数据交换过程中的顾虑,有一个集中的数据中心,但是在这个数据中心的数据交换过程当中,数据并不会沉淀到这个平台上来。

  3、实现数据的沉淀,也就是数据在数据中心的落地。这个应该说是在数据共享交换当中一个更进一步的方式,就是对于大家不是特别担心的一个数据,不仅是实现数据交换,而且实现数据在数据中心的一个沉淀。也就是实现了一个数据积累的过程。

  在实践当中,我们也是将智链立交桥应用这种区块链技术的数据交换这种方式,应用了一些实践当中。这举的是我们咸阳的一个例子,刚才汪教授提到了我们咸阳的医疗数据,医疗数据是我们一个领域的应用。现在我们还在精准扶贫方面来应用这个智链立交桥。因为精准扶贫大家都知道,关于农户、农民,或者贫困人口的数据,也是分散在各个部门当中的,你要实现一个精准的扶贫,包括识别,包括去帮扶,实际上也是需要把各个部门的数据汇聚在一起,来进行比对的。

  在这个过程当中,我们把民政、人社、银行、工商等等这些数据,汇聚在一起,对于贫困人口的精准定位,精准筛选,包括精准资金的使用,在这些方面应用这个智链立交桥来提供一个技术的支撑。

  下面,讲数据开放的一些实践。首先我们看到,刚才汪教授也提到,政府部门掌握了整个社会数据的80%,我们也看到,随着政府数据的开放,它的价值也是在不断的显现。这里举的是国家信用的数据公示系统,国家把一些相关的数据开放出来以后,我们看到和很多企业相关的应用出现了,包括现在这些数据慢慢应用到,甚至在找工作当中都找到了,就是你找工作当中查查这个企业,看看它有没有不良的记录,包括诉讼的案件等等。现在用的人数也越来越多,包括我们看到这些应用和APP也都完成了很多融资,也看到了这个数据开放的价值。

  一方面是价值在体现,但是一方面我们也看到,现在很多政务数据开放的平台,实际上效果并不是特别好,我在这儿举了三个省级政务平台开放的例子,一个是广东,我们看到很多它列的数据都没有,或者我们下载的次数很少,几乎是零次下载。

  这是贵州的例子,上面不到十个基于政务数据开放的应用。这是上海的例子,有很多数据的下载量最多也就是400、500。所以我们看到集中式的数据平台开放效果,还非常不好。

  这样实际上体现出来一个问题,就是我们一方面看到政务数据开放的价值很大,但是另一方面又看到我们现在政府推动的一些政务数据平台开放应用的效果不是很好,我们认为是一个数据供给和数据需求不相匹配的问题,就是你给我的数不是我需要的,我需要的数你还给不了,这样一个供需错位的问题。

  基于这样一个问题的认识,我们认为政务数据的开放应该是在政务数据分级分类的一个基础之上的一个多元开放模式,就是我们要把政务数据有一个分级分类,你搞清楚哪些数据它的类型是不一样的,在这个基础之上,有一个多元化的,而不是一个比较单一的开放模式。政务数据分级分类的方法有很多,我们可以从很多角度去做这个政务数据,在这些因素当中我们认为有两个最重要的因素:

  所以我们认为在因素里面,可能最主要的是这两个因素,基于这两个因素,我们构建了这样两个象限开发的模式。对于需求高但是风险高的,我们认为应当是采用这种定向开放的模式,比方说像医疗健康的这个数据,它可能和我们每个人的隐私非常相关了,对于这类数据,它的价值有多大?它的风险又比较高,所以我们认为应该是采用定向开放的模式。

  对于需求高但是风险又比较低的数据,比如像一些交通的数据,比如说像一些地理位置的数据等等,像这些数据,大家需求又很多,实际上开放出来之后,风险也不是特别大,就可以采用普遍开放的模式。

  对于这个需求低但是风险比较高的可以采取择机开放,就是现阶段不开放,等风险有了一个比较好的解决方式的时候,那么再选择择机开放。对于这种需求低风险也比较低的,可以采用按需开放,我对于申请这类数据开放需求来做开放。所以我们基于两方面的因素,可能对于政务数据开放的模式做了一个划分。

  首先来说普遍开放,这个大家了解比较多,通过我们现在比较多的政务数据开放平台来做开放,这些平台基本上你只要注册了,就可以看到这些数据,当然数据质量是另外一回事。

  定向开放,因为时间关系,我在这里没办法把每个细节都讲的很清楚。重点说一下定向开放的方式:

  这就是我们认为政务数据定向开放最重要的两种方式。在这个定向开放过程当中,我们也看到一些地方实际上已经在做实践了,这里面举的福建的例子,我们看到福建省发布的这个《政务数据管理办法》里面,就明确提到,它要把政务数据作为一个政府的资产来管理,和土地一样。这个里面,它会把政务数据授权给特定的企业来做开发。包括福州的健康医疗大数据,也是授权给在它这个大学企业远里面做开发。包括我们在陕西也在做实践,我们把政务数据作为政府的一个资产来做管理,包括它的管理,包括它的流通,包括它的收益等等,都做了相关的一些探索。

  当然对于政务数据的定向开放,在这里有一点说明,必须要有一个政务数据的目录来做支撑,因为有了这个定向开放,刚才提了定向开放都是价值比较大的,怎么样规避政府把价值大的数据都归为定向开放?因为在定向开放当中政府是可以有收益的,怎么样规避这个风险?我们认为应该有一个政务数据定向开放的目录,向社会公示哪些是普遍开放,哪些是定向开放?有这样一个公示过程,保证尽量多的数据面向社会做一个普遍开放。

  3、按需开放。我们根据大家开放需求的程度,来决定开放的方式,可能有的政府认为价值不大,但是特定群体认为价值大的,这个过程当中根据申请数量做一个开放模式重新的调整。

  最后一张图,我们认为不同的开放模式最终都是要通过技术,或者是政策不断的演进来走向普遍开放这个模式,因为现在普遍开放应该是我们国家最终的方向,但是这个过程当中,因我们现在数据管理水平的问题,包括技术的问题,包括政策的问题等等方面的原因导致我们还没办法一步走到普遍开放,所以我们认为在这个过程中,一个很好的路径,就是把这些开放模式要做一个分类,最终通过各方面问题解决之后,择机开放、按需开放等等都能够走向普遍开放,最大实现政务数据开放的价值。

  以上就是和大家分享交流的内容,也是我们在探索中的一些实践,可能有的不是非常成熟,希望给大家提供一个借鉴和参考。