2014年,在国家新闻出版广电总局数字出版司的指导下,新闻出版业启动了以“出版物在线信息交换国家标准”为抓手的CNONIX应用示范与推广工作,主要目的是为了整合出版业全产业链上各环节的信息数据,消除数据壁垒,促进信息流通更加顺畅,实现出版全产业链的信息共享。
目前,CNONIX应用示范工作已经取得很大进展。22家示范单位和7家技术服务商均按照CNONIX标准全面部署和推进有关应用工作,包括出版发行端的系统改造、工具和插件的部署、数据交换平台的搭建与运营、CNONIX标准化的数据的清洗等。示范工作得到了国家、总局及财政部相关领导的认可和表扬,行业越来越多的单位开始关注并积极参与CNONIX应用工作来。2015年,国家新闻出版广电总局数字出版司趁势而为,提出了“构建新闻出版业数据体系”的总体建设目标,决定由总署信息中心牵头组建应用示范工作的数据交换实验平台,中国出版集团牵头组建行业应用联盟,标志着新闻出版业拉开了在行业数据应用领域的工作帷幕。
伴随着CNONIX应用示范工作的不断推进,出版业如何构建一个适合的管理体系,使数据采集与管理、数据标准与清洗、数据挖掘与应用顺畅实现,从而提升数据价值,创造利益,是很多单位必须要面对和解决的难题。因此,出版业必须要进行前瞻性的思考,以数据即资产的角度重新审视工作、数据,应该清醒地认识到,信息系统建设发展到一定阶段,数据资源将成为战略资产,而有效的数据治理才是数据资产形成的必要条件。
数据治理就是对数据资产化的管理和控制的活动集合,做好数据治理工作,意义体现在4个方面:首先,有利于行业数据统一,这对行业而言非常重要,所有工作的最终目的就是为了行业的数据统一;第二,促进行业标准化发展,降低数据交换成本;第三,便于通过数据特征发现市场异动,有效助力监管的决策;第四,推动市场业务功能的发挥。
出版业各单位应进一步提高数据作为战略资产重要性认识,建立基于本单位的数据治理体系;加强数据标准建设,统一数据规范;加强数据全生命周期管理,提高数据质量;优化数据架构,推动信息数据的逻辑整合。
总体来讲,行业数据治理工作对行业而言意义重大,就出版业而言,可能大数据的应用现在还为时过早,因为目前出版业收集的数据主要是结构化数据,而大量非结构化数据的收集、整理和分析还不够。因此,数据的治理工作非常关键,将是一个持久的工作,对行业以及每个单位都相当重要,企业自己的内容数据、用户数据、经营数据如何更好地保存和应用,都是未来发展的非常重要的抓手。