4月6日,由厦门大学数据库实验室主办的大数据百家讲坛第118期成功举办,赛智产业研究院院长赵刚博士担任本次报告专家,与大家分享了《数据要素开发利用的主要路径和策略》的主题报告,分析了数据要素开发利用的意义、问题和数据资源化、要素化、产品化、资产化和资本化的路径和策略,为政府和企业的数据要素开发利用提供指南。赵刚院长的精彩演讲吸引了线w人参加,并受到广大听众的一致好评。
数据要素的开发利用是一个分阶段的、循序渐进的推进过程,而且每个阶段有每个阶段的不同特点。不同阶段的工作不能提前做,有些工作不可逾越,必须在本阶段遵循本阶段的特点,不能用下一个阶段的想法来解决上个阶段的问题。所以,数据要素的开发利用有它特定的的路径和策略。有效推进数据要素开发利用分为五个阶段。
第一个阶段是数据资源化。首先,数据要素开发利用要实现数据资源化。就是把数据能够积累下来,形成资源。它的前提是数字化,可以通过企业数字化转型、政府数字化建设,实现数据资源的汇聚,形成数据资源。
第二个阶段是数据要素化。数据要素化的前提是数据资源能够持续的规模化投入生产。所以,这个阶段的工作是要做数据加工和治理,做高质量数据集或数据API建设,形成数据集市场。
第三个阶段是数据产品化。数据产品化实际上就是把数据要素投入到生产后,形成数据产品和服务,也就是信息、知识和智能。数据产品化的前提是加工治理后的数据要素要有使用价值,能够变成商品。那么,这个阶段要做的工作就是数据产品和服务、数据产品平台建设、数据服务平台建设以及数据产品市场建设。实际上,数据要素开发利用前三个阶段已经形成一个闭环,循环起来,已经能够实现数据经济和社会价值了。这也是我主要讲的数据要素开发利用的阶段,就是资源化、要素化、产品化这样的阶段。
第四个阶段是数据资产化。也是财政部提到的数据资产管理。那么,数据资产化的前提是数据产品或数据资源能够被持有人合法控制,且具有持续收益。所以,这个阶段要做的工作有数据资产登记、数据资产入表、数据资产评估、数据资产开发、数据资产管理等工作。
第五个阶段是数据资本化。前提是数据资产可以入表。所以,这个阶段要做的工作是拿这些数据资产做融资、做数据银行、做数据质押、做数据资产证券化等操作,从而实现数据资产能够为经济活动进行融资的目标,这些融到的资金又进一步反馈回到数据资源化、数据要素化、数据产品化和数据资产化的过程,所以这是一个大闭环。
没有企业数字化就没有企业数据资源。在数据要素开发利用过程中,一定要突出强调推进企业数字化转型过程,没有这个过程,就积累不下数据资源。企业数字化能实现企业数据的采集、传输、存储、计算和分析,汇聚形成企业数据资源。例如在一家小企业,在生产线上安装一个数据传感器或摄像头,能够采集整个终端包括各种APP终端、销售端、供应链端等各种数据,通过数据采集汇总到业务执行系统中。数字化做得不好的企业,也很难实现数据的资源。只有那些数字化水平高的企业,数据资源也更丰富。
企业要建立ERP或MIS系统、仓储管理系统、质量管理系统、销售系统、采购系统、供应链等,在这个基础上再进一步的做数字化的提升,从而能够在企业业务的各个环节,从设计、制造、采购、供应链,仓储物流、销售到客户服务完整的数字化过程。数字化转型要覆盖到企业中和企业内之间的数据采集、传输、存储、计算、分析的过程。
我们必须尊重这样的事实,数据要素化开发利用,一定是在数字化好的企业中先开展起来的,数字化好的平台上先推动起来的,数据资产入表也是围绕这些企业数字化转型比较成功的企业优先去推进的。所以,数字化水平高的企业,数据资源也更丰盛。
数据资源化不能脱离数字化,最终目标当然是数智化。在数字化的过程中,随着数据要素开发利用,逐步构建起自己企业的数智化能力。要构建企业的数据中台,要构建企业的智能化转型整套应用体系,把数字化从感知数据、处理数据、分析数据、利用数据,形成一条智能化的神经网络系统,构建起数字化敏捷企业,这是一个非常重要的基础性工作。
没有政务数字化,也就没有政务数据资源。政务数字化能实现政务数据的采集、传输、存储和计算分析,在这个过程中才有数据资源开放、共享、流通应用、授权运营等开发利用。数字化做的不好的政府部门,很难实现数据资源化。数字化水平高的政府部门,数据资源也更丰富。所以,在数据要素“X”领域里,一定是那些数字化程度比较高、数据比较密集的领域优先推进,这些部门之间能够实现数据有效共享和协同应用,产生更好的政务服务水平。政务数据资源化也不能脱离数字化,目标还是数智化,建立数据驱动的政务智能化转型。
数据资源要投入到生产中,我们需要考虑哪些问题?数据要素化不是一句空话,数据要成为生产要素,有几个条件是必须的,如数据资源丰富、能够持续提供、能够持续为经济增长做出持续的收益贡献、持有者能够获得相关的收益分配等条件。满足这些条件,才能够激发整个数据要素市场化配置的内在逻辑形成。所以,数据资源转化成数据要素,也有一个过程,需要具备以下条件。
一是数据要素是能够持续产生和投入的数据资源,而且是在线的,不是线下一次性的。所以,要构建起来让数据资源能够持续产生、持续投入、持续产生收益的机制。数据要素的开发利用很大程度上就是在数据基础设施上去做的,如果数据资源被拿出来,离线去做很多工作,可能并不满足数据资源持续开发利用的基础条件。所以,这是很重要的一个方面。所以,数据要素开发利用的流水线一定是建立在互联网上、建立在数字基础设施上、建立在数据基础设施上、建立在各种数字平台上、建立在各种APP应用上,才能够很好的推进数据资源持续供给,实现数据要素的在线化、实时化和高效化投入,这是很重要的一个前提。
二是数据要素是通过数据治理实现的标准化、高质量、可规模化的数据资源。一定要把现有的原始数据资源加工成标准化、高质量和规模化的数据资源,这一步就是靠数据加工和数据治理的工作。如图3,描述的就是企业数据资源加工和治理的基本过程。政府部门也一样,我之前给北京去做咨询的时候,政府部门也要有这样一个数据加工治理的过程。
编,就是说要知道自己的底数,要编个目录,要把数据分类,形成数据分类目录,知道数据从哪来?数据谁供给?数据到哪去?形成职级目录、数据目录、 技术库表目录以及共享目录、开放目录等等,形编目录,摸清底账。
聚,就是要不断的去采集和聚集数据,以数据报送,数据交换、数据接口、数据探针、数据爬取等方式,能够形成不同管道上的数据以统一标准方式,汇聚到数据中心来。
存,就是要建立原始库、标准库、基础库、主题库、备份库等各种数据库,建好后还要进行数据各个库的分类汇总,最后形成大的数据仓库。
洗,就是这些数据来了以后,要进行加工清洗,保证好的质量,把那些脏数据、重复数据、错误数据等问题消除掉,做一致性处理,就形成了标准化和高质量的数据源。
通,就是让一份数据能够在各个部门之间去做数据共享、数据开放,包括在数据层、特征层、决策层的融合处理。
标,就是给每个数据做建模、打标签、做分析,可能做分析、标签分析、指标分析,算法模型等,能够为将来的应用奠定基础。
服,就是将数据可以用到哪些场合提供相应的标准服务,数据要建立数据的API服务,同时也要对数据产品做服务,形成的产品可能有些是查询类,有些是报告类,有些是分析类,有些是预测类等一些服务。
营,就是从不同渠道上去丰富数据资源,这涉及到向社会数据采购、社会数据融合以及政府数据要素供给等工作。
三是数据要素是有使用价值的数据资源,一般以数据服务API或数据集提供。在明确要求原始数据不出域的情况下,更多场合下是以数据API的方式来提供给使用者去使用,而不是直接电脑拷贝一个数据库给对方,所以数据API这个方式可能是目前的主流模式。
四是数据要素可以进行市场化流通和配置。数据要素一旦形成高质量、标准化、可规模化持续投入的数据集,那么它就可以以市场化的方式进行流通和配置。
五是数据资源的持有者可以从数据要素投入生产获得持续收益。这个收入一定是要持续收益的,在线上通过数据API的方式,可能是更好的数据要素流通的方式。数据要素化,最重要的工作就是完成数据的加工和数据的治理,实现资源转化成要素。
按市场评价贡献,根据贡献来分配收益,这是要素市场化配置的机制,以往所有的要素都遵循这一规律。
土地是生产要素,土地能为经济增长作出贡献,可建立土地要素市场,优化要素配置,要素提供者能通过地租来参与收入分配;
劳动是生产要素,劳动能为经济增长作出贡献,可建立劳动力要素市场,优化要素配置,要素提供者能通过工资来参与收入分配;
资本是生产要素,资本能为经济增长作出贡献,可建立资本市场,优化要素配置,要素提供者能通过利息等来参与收入分配;
技术是生产要素,技术可为经济增长作出贡献,可建立技术市场,优化要素配置,要素提供者能通过技术专利费等参与收入分配;
数据是生产要素,数据可为经济增长作出贡献,可建立数据要素市场,优化要素配置,要素提供者能通过数据使用费等参与收入分配。
但是,数据要素市场化配置的前提是什么?我们刚才分析,数据要素市场可能是在线的,这个市场需要通过数据API这种服务方式来参与,市场贡献者通过数据API使用服务费的方式来获得收益,使用的越多,收益就越多,用这样的方式来进行数据要素市场化配置,未必是拿一个数据集到市场上去卖的这种方式。
一是发挥数据要素协同优化作用。数据要素转化成产品,前提是要有使用价值,才能够变成商品,能够为用户和消费者所购买和使用。数据有它的基本价值,就是不确定性的世界需要信息和知识,通过数据能够还原信息,实现对事实的洞察,能够预测未来,能够指导生产活动。数据要素有乘数效。