5月27日,2023中国国际大数据产业博览会“数据要素流通与价值化”论坛举行。华为公司数据总架构师马运作题为《华为数据要素流通探索与实践》的主题发言。
数据流通最简单的模式就是系统跟系统集成对接,是数据IT的一部分。第二个比较流行的方式是数据汇聚,数据汇聚到中台然后再共享出去,这在企业内部是非常流行的。第三个是随着数据成为生产要素是有价值的,这时候就不能随便共享了,就走到了数据交换,数据交换一定是有合约的。这是三个大的阶段。
(资料图)
从华为整个数据工作的历程来讲也跟这个相匹配。华为第一个阶段是数据清洁,关键是要建一套体系,能够保证你的数据从定义到使用都是按照一定的规则进行的。我们公司有总纲,有架构标准、有组织、有流程、有IT。
第二个阶段,在业务数字化的基础上,数据散落在各个交易系统中,华为有3000多个系统,这时候把重要的业务数据入到数据湖里,然后再加工做个服务开放出去,这是我们做的第二阶段,做了五年,这里面有数据湖,有T+N的。在华为的数据之道这本书里面有介绍。
第三阶段,范围扩大了,不光是企业内部的共享,要跟供应商、客户、其他组织进行交换。华为这么大的一个企业全球经营,我们内部也有各种数据交换,也有主体,一定要解决数据清算和交换的问题。怎么解决呢?我们认为数据流通、数据交换最关键的一个问题就是要解决数据的两个特征,一个是非排他性,其他生产要素都是可以排他的,你可以用,他也可以用,第二是数据的复制是零成本的,你不解决非排他性和零成本复制的问题,数据流通做不起来,我不愿意把数据给出去,给出去了数据价值一下就没了。我们在可信可控可证的基础上建立企业数据空间EDS的生态。
华为有几个关键设计,第一个是使用控制。要做到谁在什么时间,用什么APP,在什么地点,使用几次,做什么事情都能够控制,而且在程序上控制,不是在签约上控制,这是第一个非常关键的,做不到这个数据流通会受到限制。
第二个是在整个数据交换过程中,它跟一般的集成不一样,首先有数据交换的资源。资源对数据进行切片,然后分装,按照一定的格式转换,变成数据交换的单元。交换单元是传输、验收、清算的最小单元,几个交换单元合起来,再加上使用控制,比如你的数据可以使用一个月,这时候再加上我的定价。然后再是合约,合约就是两方,咱们商定好这个数据,然后用什么交付方式,怎么验收,怎么支付,这是一个完整的过程。
第三个是清算,清算是清算方一定要注册,然后我在不同的数据流通方式,我都要上报,上报了以后就可以对它进行统计核对,这时候每个主体都能够清楚知道,我持有什么数据,获得什么数据,加工了什么数据,我给了别人什么数据,这是一个清算。
第四个是查证追溯,所有的交易过程都有探针。
第五个是安全可信连接器设计,这个使用控制,我是通过一个壳控制的,通过数据连接器,有不同的安全等级,最简单的我是在应用层控制。第二个环境级的,Trust的连接器,我还能对环境进行控制。第三个是硬件级的,我的使用控制不光在应用层,我可以在系统操作层,在存储层可以删掉,这个数据不出集群,我在存储层控制,它出不去。不同的业务需求可以有不同的安全连接器。
第六个是消费APP可控接入设计,针对不同类型的数据增值APP,提供三种差异化的APP接入能力。本身一个APP是带存储的,我们也有方法做一些改造,让它受我的控制策略的影响,最难的就是SaaS这种APP,它本身是一个平台,这时候我们要用虚拟内存的方式进行对接,这样我们就能够控制数据的使用。
我们设计的这一套是去中心化的数据空间,一定要有一个标准的框架。你清算的标准、使用控制的标准、资源的描述、接入认证等等需要互认、互操作,这时候我们积极参与。信通院也非常有研究的,信通院组织的国家标准的制定,还有欧盟的IDS、GAIA-X这些标准制定,我们争取做到在底层是能够互认互通的。
记者 杨阿敏/文 数据观/图