数据库 频道

新“石油”的蜕变——数据要素市场化萌芽待发

  经过千万年的沉淀与孕育,古老的生物化身石油,而经过提炼的原油变成气体、塑料、化学品等实体,创造着价值,推动工业文明的发展。在信息时代或者数字化时代,数据成为公认的新石油,但正如石油没有经过提炼便不能展现价值一样,数据原油也需要被分解、分析、治理以及与产业结合,才能创造价值。

  通过数据采集、存储、治理、建模、分析、挖掘和流通,这一新“石油”在创造价值的路上不断发生蜕变。如今数据已经成为与土地并列的生产要素,其重要性进一步凸显。如何挖掘数据的价值?怎样让数据在合规下流通交易市场化发展?成为新时代的新命题,而以上海数据交易所为代表的数据交易所揭牌成立为破解数据交易过程中的各种难题带来了新思考。

数据成为新的生产要素

  在数字经济时代,得数据者得天下。每个国家也是铆足了劲,生怕落下。全球范围来看,从德国2011年提出工业4.0到美国通用电器2012年提出工业互联网,再到英国2017年提出数字经济战略,2018年提出数字宪章,截止到2021年10月份,超过170个国家发布了数字化的战略。

  中国在《“十四五”规划和2035年远景目标纲要》中将“加快数字化发展 建设数字中国”单独成篇,在国家顶层战略上为数字化发展提供了政策引导。2020年4月9日,中共中央国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,明确各要素市场的重点改革任务,将数据作为新的生产要素参与市场配置。

  中国信息通信研究院云计算与大数据研究所副所长魏凯在一次大会上谈到数据要素化、市场化配置目标,通过市场化竞争的方式,将这些要素视作“商品”,让其在市场中充分流动、自由竞价,最终使得每个要素都流向其可以产生最大价值的地方。他认为这涉及两个方面,数据首先要素化,变成生产要素,同时要参与市场化价值创造和分配。

  数据要素化需要一场技术上的革命,以前很多大数据相关技术都侧重于让用户在组织内部能够方便、低成本地存储数据管理数据。现在,还要更快,由于市场竞争加剧,业务复杂多变,现代大数据堆栈追求低成本高效率,对数据实时性有了更高的要求。

  光速创投合伙人Nnamdi Iregbulem在一篇文章中指出,如今企业对传统的数据基础设施越来越厌烦,旧的“批处理”模式(每天一次大的更新,查询速度慢)正在让位于更细化、更高频率的实时更新(每秒多次更新,查询速度快),从而带来更新鲜的数据和更快的洞察力。在现代数据栈中,实时基础设施和工具可以采取多种形式:

  ·以高频率和高容量将小数据包从A处流向B处(例如:Apache Kafka、Redpanda、Apache Pulsar)。

  ·通过流处理工具过滤和转换流数据(例如:Apache Flink、Apache Samza、Decodable)。

  ·实时分析,让分析师在低延迟的情况下获得对业务查询的最新反馈(例如:Materialize、ClickHouse、Tinybird)。

  ·实时或在线机器学习模型,不断适应和学习数据,并实时生成预测(例如:Tecton)。

  当前热门的HTAP数据库也是为了处理对实时性要求较高的混合负载场景而出现,目前,将这些不同的系统组合起来仍然是是一件棘手的事情,但这也成为数据技术创业者的新机遇。

  数据市场化意味着数据不再限于组织内部发挥作用,数据要跟很多外部数据融合。对数据治理和数据资产管理提出了更高的要求,特别是数据隐私、数据保护、合规等方面的挑战。在数据市场化流通融合环节,数据市场和交易平台发挥了重要的作用。

国内数据要素市场化萌芽待发

  美国圣地亚哥州立大学拉文创业中心主任Bernhard Schroeder曾撰文称,数据市场和交易平台将迎来新的机遇。随着苹果、Facebook、谷歌等科技巨头宣布可能限制第一方数据(需要获得许可)的使用,这给广告商带来了问题,但也为数据市场和交易平台的崛起提供了机会。

  Gartner在2020年7月发布的《2020年数据与分析领域的十大技术趋势》中提到,到2022年,35%的大型企业机构将通过正式的在线数据市场参与数据交易,而这一比例在2020年为25%。数据市场和交易平台为整合第三方数据产品和降低第三方数据成本提供了统一平台。

  2021年11月25日,上海数据交易所揭牌成立,重点是破解数据交易的确权难、定价难、互信难、入场难、监管难等关键共性难题。当天完成挂牌数据产品20个,涉及金融、交通、通信等八大类。11月26日,华南(广东)国际数据交易有限公司成立,聚焦建成中国南部数据要素流通流转的枢纽平台,将在促进粤港澳大湾区数据要素流通、跨区域的机构合作和数据互联、政府数据与商业数据融合应用等方面发挥作用。

  在上海交易所首发数商体系,全新构建了 “数商” 新业态,涵盖了数据交易主体、数据合规咨询、质量评估、资产评估、交付等多领域,培育和规范新主体,构筑更加繁荣的流通交易生态。比如,作为首批签约数商,星环科技在大数据、隐私计算、数据安全流通领域有着多年积累,研发了数据要素流通全过程的一系列工具,在各方数据不出域的前提下,为数据资源方和数据消费方提供数据交付服务。

  数据交易所的成立引发了业内关注,慧辰股份CEO赵龙指出,一方面,上海数据交易所成立以后,会促进数据的确权、定义、交易等方面合法合规有序推进,这样会加快数据交易环节前期的数据基础确认。二是,随着数据确权的基础制度、法规不断完善,隐藏在各行各业的数据可以被释放,利于产业数据的积累,夯实产业数据基础。三是,因为有基础的数据,在数据基础上的实践会带来更多企业增值、行业增值等方面的应用,这将有助于整个中国数据产业基础制度、基础环节等数据基础的完善。四是,随着数据基础的提高,数据量变大,数据维度变多,法规等也更健全规范,像慧辰这样的数据挖掘、分析公司就有更多的发挥空间,从而让数据可以跨行业、跨产业、跨领域的应用起来,数据的价值会得到进一步释放。

  总体来看,赵龙认为国内数据要素市场化会经历四个阶段:

  第一个阶段,数据的意识与价值认可阶段。过去五年第一阶段应该基本完成,大家觉得数据是很有价值的要素。

  第二个阶段,数据的准备阶段。目前各个行业的差距比较大,可能还需要三到五年,各个行业基础数据的准备才能完成,即数据有合适的字段、存储,用于可供分析的标准的一些数据库的建立等。

  第三个阶段,基于数据的本行业实践阶段。实践是来自于行业自身的应用,比如钢筋行业自身的数据应用来提升行业的效率,降本增效,在各个行业都会存在这样一个周期。

  第四个阶段,整个数据的规范、流通、基础制度都已经建好,数据跨行业交流,甚至跨行业应用。比如钢铁行业的数据可以应用到金融行业、能源行业、消费类行业,通过数据带动的其他行业效率的提升。

  “(数据要素市场化)是一个漫长的路,时间还需要十到二十年。因为光有数据意识,基础数据还是不够的,在每个行业的实践,跨行业的实践的周期可能会更长。”赵龙强调,目前国内数据要素市场化还在萌芽起步阶段,先要企业和政府把数据治理好,行业数据应用和实践多参与,数据准备就绪后,可以外放流通,参与市场化价值创造和分配。每个行业都在做,但是不同行业的发展参差不齐。

  比如在气象行业,墨迹天气副总裁黄耀海指出,由于欧美相关气象法立法较早,很早就开始将气象数据在国家范围内进行公开和共享,中国气象数据市场进程与欧美相比还有距离,包括数据质量、标准化等还有差距。“我们也在推一些标准,希望能把国内的数据标准化,标准化后大家用起来会更方便,欧美的标准化已经比较成熟了。”黄耀海介绍,在气象数据交易方面,欧美直接融入到标准的数据交易体系中采购这些数据,或者对数据交易市场输出相应的结果。现在国内气象数据市场还处于起步阶段,没有完全成熟,气象数据交易还处在类似个案交易环节,他希望能通过国家相关立法推动气象数据交易发展。

  赵龙认为,当前,数据要素市场化的机遇和挑战并存,机遇方面,首先数据意识都有了,现在各行各业都在从采集到规范、标准制度的建立来积累基础数据,一旦有了这样的意识,离爆发也不会太远。挑战其实也更大,比如数据伦理、数据向善,数据的基础、制度、法制、规则、运营其实都还没有建立起来,要政府、产业、企业运营者等达成共识,还有很多的工作要做,只能是各产业链条的人,齐心协力,慢慢推动。

0
相关文章