一种数据流通的新方式
日期:2024-01-10 23:04:55   来源:产品展示

  数据正成为推动社会持续健康发展的新生产要素。以合规的、可审计的方式使数据在多方之间流通对于数据价值的形成至关重要。然而,由于当前已发布的隐私保护法律和法规,以及许多机构之间有商业竞争,都导致了数据流通受限。基于此,复旦大学计算机科学技术学院阮雯强等博士在《数据租赁——数据流通的新方式》一文,从隐私保护以及数据利用的角度,提出了一种新的数据流通方式:数据租赁。

  数据正在与资本、土地、劳动力、技术等传统生产要素并列,成为一种新型的生产要素。在数据价值的形成过程中,数据流通扮演着很重要的角色。当前数据流通的方式最重要的包含政府部门或企业公开数据、数据交易等。然而,随着最近《网络安全法》、《数据安全法》、《个人隐私信息保护法》的发布,涉及用户隐私的数据难以直接在各个机构之间流通。

  此外,许多机构出于商业竞争的目的,可能并不愿意直接将原始数据传输给其他机构。目前得到较多关注的场景是如何使得多个机构以隐私保护的方式对数据来进行联合利用,即每个机构均贡献数据并且得到数据分析的结果,而如何使得某个机构通过“租赁”的方式挖掘其他机构数据中蕴含的价值尚且缺乏相应的研究。因此,为促进数据价值的充分形成,本文提出了一种数据流通的新方式:数据租赁。

  数据租赁使得对数据有需要的机构可以通过付费的、隐私保护的以及可审计的方式利用其他机构的数据完成预先约定好的计算任务(如机器学习模型训练)并获得计算结果,即通过“租赁”数据获得价值。本文根据最近提出的隐私保护法律和法规,讨论了数据租赁提出的动机及其定义,并明确了数据租赁需要满足的五项需求。

  我国的数据交易机构最早于2014年出现,各地先后设立了40多家数据交易所(或称数据交易中心、数据交易平台),然而发展形态趋势不一。同时,一大批商业机构也在陆续进入数据流通与数据服务市场。然而,这个趋势一方面存在跟风之嫌,另一方面也始终未能解决“确权难、定价难、入场难、互信难、监管难”的五难困境,导致数据产品“不能流通、不可流通、不易流通”的现实问题一直存在。

  当前国内数据流通的主要方式是通过不同机构之间的数据交易,即数据买家通过支付一定的费用从数据卖家的手中获得数据。向数据卖家支付一定费用后,数据买家可以直接得到数据并对其开展任意的分析操作。目前国内已经产生了许多数据交易的平台,如私人成立的数据堂、数多多,政府主导的贵阳大数据交易中心、上海市数据交易所等。尽管数据交易对于促进数据流通发挥着重大的作用,它任旧存在两个限制,使得数据在一些场景中无法充分地流通,具体如下。

  ● 需要流通的数据可能包含着用户的隐私信息,随着《网络安全法》、《数据安全法》以及《个人隐私信息保护法》的陆续出台,直接转让或传输这一些数据可能会对售卖数据的机构带来严重的法律风险。

  ● 数据所有者出于商业竞争等目的,可能并不希望直接将数据发送给其他机构,但可以允许其他机构对其所有的数据做部分特定的,敏感程度较低的计算操作。

  而当数据较为敏感,无法直接在机构之间进行流通时,数据租赁能够最终靠一种隐私保护的、 可审计的方式使得对数据有需求的机构能利用其他机构的数据完成特定的计算任务,从而促进数据价值充分的形成。

  参考传统的资产租赁的定义,并考虑数据资产特有的形态以及当前已经发布的各项隐私保护法律,本文对数据租赁的定义如下:数据租赁是指在约定的时间内,数据的所有者使用其持有的数据资产完成数据的租赁者所要求的特定计算任务,最终数据的租赁者只获得计算结果,数据的所有者获取租金的行为。

  相较于传统资产的租赁行为,由于数据的复制成本几乎为零,并且涉及用户的隐私信息,受到法律的保护,当使用其作为租赁标的时,数据的所有者无法像传统的资产租赁一样在一段时间内将数据资产直接转让给数据的租赁者,而只可以通过完成租赁者指定的计算任务这种方式,使得数据的租赁者获得租赁数据带来的收益。

  此外,相较于定义为“让在不同地方使用不相同计算机、不同软件的用户能读取他人数据并进行各种操作、运算和分析”的数据共享,数据租赁有以下三点不同:

  ● 数据所有者的数据无法被数据租赁者直接读取,数据租赁者仅能获取计算任务的输出结果;

  ● 数据的所有者和租赁者均要对计算过程做监督,确保数据租赁交易按照事先约定的流程进行。

  根据前文所述,数据租赁相较于数据共享带来了更多的要求,这些要求为实现数据租赁带来了更多更大的技术挑战。依据数据租赁的定义,设计一项数据租赁框架时,应当使其能够很好的满足以下五项需求。

  根据使用目标计算任务的复杂程度以及使用数据的次数等,应当能够计算租赁数据的机构应当支付给数据所有者的租赁费用的数额。

  数据的所有者不直接将明文数据传输给其他机构。为了规避潜在的法律风险,数据所有者的数据应当保留在其本地,防止用户的隐私信息发生泄露。

  租赁数据的机构能利用数据所有者的数据与数据所有者共同完成双方事先约定好的计算任务,并且得到计算结果。在数据租赁的计算过程中,租赁数据的机构自身的数据也可能参与计算。有必要注意一下的是,可能会出现多个数据所有者同时向一个机构租赁数据完成其目标计算任务。

  数据的所有者与租赁数据的机构应当都能对计算操作做监督,即数据的所有者和租赁数据的机构都应该能保证对方对数据执行预先约定好的计算操作。通过确保计算过程的可监督性,数据的所有者可以依据计算操作的类型和数量收取相应的租赁费用,而租赁数据的机构能保证其能利用其他机构的数据完成特定的计算任务。

  数据的所有者与租赁数据的机构对数据所做的计算操作应当能够被第三方审计,从而避免计算任务完成后,双方对于已完成的计算操作的类型和数量无法达成一致意见,导致支付租金时双方发生纠纷。

  基于秘密共享的数据租赁技术,如图所示,共有三类角色,即数据租赁方、数据出租方以及租赁平台方,具体如下。

  数据租赁方可能自身拥有一部分数据,并希望可以通过支付一笔费用租赁数据出租方的数据,从而通过联合多方的数据挖掘得到更多的有效信息。数据租赁方需要向数据出租方和租赁平台方说明其目标计算任务,并通过基于秘密共享的安全多方学习完成该计算任务。

  数据出租方对数据租赁方出租其所需要的数据,并依据数据租赁方利用其数据所完成的计算任务的复杂程度和使用数据的次数收取相应的费用。在一次数据租赁中,可能会出现多个数据出租方参与。数据出租方通过与数据租赁方共同参与一个基于秘密共享的安全多方学习过程完成数据租赁方的目标计算任务以及监督数据租赁方对其数据所做的计算操作。

  租赁平台方负责提供数据租赁的资讯平台并审计数据租赁交易。租赁平台方接收并发布来自数据出租方的数据信息,同时响应数据租赁方的数据信息查询请求,促使数据租赁交易的形成。

  在数据租赁方和数据出租方对于租赁的数据类型与数量、目标计算任务以及租赁费用达成共识后,数据租赁方、数据出租方共同参与一个基于秘密共享的安全多方学习过程,以完成数据租赁交易,具体过程如图所示。在所示的计算过程中,各方先将其持有的数据通过秘密共享技术产生秘密份额后,将秘密份额分发给其他参与方作为输入,随后各方通过一个基于秘密共享的安全多方学习过程完成目标计算任务,最后将计算结果返回给数据租赁方。

  原文来源:阮雯强,徐铭辛,涂新宇,宋鲁杉,韩伟力.数据租赁——数据流通的新方式[J/OL].大数据.

  数联产服隶属于BBD数联铭品集团,是数字化的经济智库和产业大数据服务商。作为国内最早探索和实践大数据技术及数字化的经济产业高质量发展的高新技术企业之一,BBD推出了中国数字化的经济指数(Digital Economy Index,DEI)在内的系列宏观经济指数,旗下拥有有中国数字化的经济智慧云平台等系列大数据产品。数联产服具有全流程大数据治理-分析-决策支撑服务能力,面向政府和产业运营机构提供产业指数、产业云图(产业大脑)、产业咨询和客户服务。返回搜狐,查看更加多