从技术上拆解数据要素价值的生成路径,企业数据要素与资产运营的建设路径可分为三个典型的阶段:数据资源化、数据资产化和数据资本化。第一阶段是做好数据治理和安全,使企业有数据产品用还可以管理起来;第二阶段进入流通阶段,基础设施组成部分包括:隐私计算、沙箱、数据资产登记以及数据流通之后,跨境数据的统一安全管控;最后一个阶段比较新,星环科技也在帮企业做资产目标的试点,包含从资产识别到价值评估到合格审计、持续性盘点等一系列工作。
随着大模型技术的快速发展和成熟,企业对数据资源整合的动力更强大。一个成功的实践经验是利用大模型的语义理解能力将知识库外置,而大模型只负责意图识别和上下文理解。目前,这种架构在企业中取得了显著的效果,已经逐渐接近企业端的精度要求。然而,仅仅拥有数据是不够的,还需要对数据来进行管理,确保其可控、可用。
将汇聚的数据转化为知识至关重要。传统的数据治理主要从技术层面进行描述,例如对表字段要有质量、规则和标准等要求。而基于大模型的核心思想是直接将数据应用于业务中。以某种账号为例,涉及到接收方、贷款方、贷出方还是收入方,需要具备业务语义,并将其抽象为基于数据实体模型的内容。因此,其描述对象不再是基本的源数据,而是业务术语。一旦建立了完善的业务术语体系,企业就能够围绕这些术语打通技术部分,使数据能够作为知识注入到企业应用或模型智能化的应用中。
将数据转化为知识后,可通过算力能力构建全球性资产。然而,要实现数据流通,第一步是要建立核心敏感资产的脉络。构建这个脉络的方式有很多种。以星环科技推出的一款数据安全管理平台Defensor为例,公司能够利用Defensor完成数据分类和合规检查的工作,实现自查自纠并向监管单位提供合规检查报告。
同时,Defensor将大模型引入数据安全、合规和分类分级中,提供了一种辅助性的智能化手段。Defensor能够给大家提供特定行业的预训练模型,并将一些领域的知识库作为知识汇装进去。因此,企业在进行数据治理时不再是从零开始,而是直接基于预训练模型进行数据安全和质量贯标。同时,通过与企业共建的方式,引入企业知识库并沉淀为本地的模型或本地的知识库。
在一个股份制银行的实践案例中,原本需要数月完成的任务现在可以在两周内完成,并且准确度也很高。
在数据流通阶段,主要是采用的技术是隐私计算。星环科学技术拥有自己的隐私计算平台,并协助各个数据交易所进行数据运营体系建设工作,包括数据安全合规和通过大数据平台提供数据加工挖掘等能力。
在跨境数据管控领域,星环科技推出了一款数据流通一体机,解决了许多实际问题。以银行客户为例,银行不仅需要核验接口API,还需要探索性接口来进行预测性分析。星环希望数据提供方能够将数据存储在一个密态数据库中,并放在一个隔离的沙箱中,然后将整个数据库交付给银行作为前置机使用。前置机接入到银行侧后,所有的探查和安全策略管控都由提供方来负责。换句话说,提供方以某种服务的方式提供了使用权。
例如,银行想在风控系统上探索某一类型的数据,公司能够通过前置机提供一定的端口来开通服务,并实时开通白名单以获取不同安全等级的数据数据。同时,每天的合规使用报告也可以实时获取。这样一来,即使在异构环境中,提供方和接收方也能够保持相同的管理上的水准。星环科技在北京、广西和江苏等地已经成功落地了这种一体机方案。
资产入表的方式不仅限于存货,还包括非货币性资产。重点是对资产进行识别、持续盘点和价值评估。大概能分为以下六个步骤:
前三个步骤主要涉及技术问题,主要难点在于需要用财务语言进行表述,包括资产的形成过程、资产的位置和加工方式等。在明确了前三个段的定义之后,有必要进行资产登记,然后再进行资产评定估计。目前,有专门从事资产评估的企业,主要是采用成本法进行评估。
最后一点在技术端很重要,一旦资产入表后,有必要进行审计和持续的价值残留评估。因此,它需要满足财务审计上的隔离性、可审计性等有关要求,并且成本必须是可量化的。核心关键词有三个:数据合规、成本可计量和能够创造业务价值。