古籍社成为古籍数学化后起之秀?

与其他类型出版物相比,出于传承和保护中华民族宝贵文化遗产的目的,古籍数字化开始得相对较早。从按照古籍原貌原样扫描或影印的原样数字化,到将古籍全文录入整理成可检索的数据库文本式数字化,再到对古籍数据库进行标引等深度加工的知识服务型数字化,可以看到,古籍数字化的方式越发多元,成果更加丰富。与之相对应,国内古籍数据库的可供产品数、需求数都在不断增长,有求大求全的古籍数据总库,有专供精专市场的专题库、专书库,古籍数据库已经成为大多数高等院校、科研机构、图书馆的标配。作为在古籍研究领域颇有影响的高校,据南京大学图书馆副馆长史梅介绍,南京大学图书馆先后购置了《中国历代石刻史料汇编》《中国基本古籍库》《雕龙——中国日本古籍全文检索数据库》等古籍库,目前正在试用的古籍库有《爱如生系列古籍数据库》《中华经典古籍库》《鼎秀古籍全文检索平台》等,为南大学术研究与教学研究提供了较为完备的资源支持。

9月29日,为了更好地实现开发者、采购者与使用者的供需互通,推进古籍数字化的良性发展,南京大学图书馆、南京大学文学院、中华书局、中华书局子公司古联数字传媒科技有限公司(以下简称“古联公司”)联合主办了“古籍整理与数字化论坛”,南京大学图书馆馆长程章灿、副馆长史梅,中华书局总编辑顾青,古联公司副总经理洪涛以及来自全国40余所图书馆、高校相关负责人和学者参会。与会专家学者就古籍数字化的现状、面临的问题及今后的开发方向进行了交流。洪涛在会上透露,预计到2017年年底,中华书局于2014年正式上线的重点古籍库——《中华经典古籍库》可供上线资源可以达到1800种,累计约10亿字。更为值得关注的是,在古籍库之外,古联公司有望在2018年上线古籍交流生态圈——籍合网,该网将设置古籍整理图书、文史工具书、学术著作、古籍书目等资源的检索阅读入口,并为作者、读者提供在线古籍编辑整理、出版等服务。这也意味着中华书局古籍数字化正在逐步从产品提供商向平台服务商转变。

三方力量竞逐古籍数据库市场

从当前使用较为广泛古籍库所归属的主体来看,古籍库研发的主体主要有三类,分别是数字技术公司、高校及图书馆等公共服务机构以及出版社。其中,数字技术公司的商业化运作可以说是最为成功,目前广泛使用的产品也大多为其开发。如北京爱如生数字化技术研究中心开发的《中国基本古籍库》、北京书同文数字化技术有限公司与香港迪志文化出版有限公司合作研发的《文渊阁四库全书》、时代瀚堂科技有限公司推出“龙语翰堂典籍数据库”等。得益于灵活的机制、技术优势以及大量资金的投入,这些数字公司在10余年前就通过与专业古籍整理机构和人员的合作,成为古籍库开发和市场营销的先行军,凭借先发优势成功打入高校及图书馆市场。

高校科研单位及公共图书馆也是古籍库开发的重要力量,进行古籍保护、让读者便捷获得机构资源是这些公共服务机构开发古籍库的出发点。如北京大学图书馆建设有“秘籍琳琅——北京大学数字图书馆古文献资源库”,是完整展示北京大学图书馆藏古籍的网络平台,读者可以在其上检索北大图书馆藏各种类型古文献元数据,查看和浏览古籍书影、电子图书,以及拓片、舆图图像。中国国家图书馆利用自身丰富的古籍馆藏资源,开发了“中华古籍资源库”“中文拓片资源库”等。据了解,自2002年开始,国家图书馆及国家图书馆出版社就承办了中华再造善本工程,“中华再造善本数据库”就是将“中华再造善本工程”中影印出版的珍贵古籍善本进行图像数字化。相对来说,这类古籍库都集中在特定领域,市场化程度不高,由于缺乏长期的资金支持,这类古籍库在后期的拓展和维护上存在不少难题。

目前由专业古籍社开发的古籍库数量并不少,但是产生影响的不多。尽管手握大量纸质古籍资源,古籍社在古籍库开发上依然受制度、技术、资金等因素的掣肘,加之出于版权保护的考虑,大部分出版社在古籍库开发上有所保留。此外,对于单体出版社来说,单个古籍社的古籍整理作品相对有限,无法提供满足市场需求的大型数据库资源,很难产生效益。

专业古籍社后发优势提升数字化后劲

在大型古籍库开发上,作为古籍社的“领头羊”,中华书局尽管起步晚,但却有迎头赶上之势。洪涛在会上介绍,早在2003年,在数字出版概念尚未被出版业广泛接受时,中华书局就成立了“古籍资源开发部”,古籍资源开发部最主要的工作是数字化编辑加工,即将中华书局铅排古籍整理图书通过OCR采集等手段数字化。经过6年的积累,中华书局完成了约3亿字整理本古籍的数字化工作,梳理整理本古籍的特殊体例和要求,建立相关的数据加工规范。2009年~2012年,中华书局开始了《资治通鉴》和“二十四史”分析系统建设。尽管最终没有进行产品化,但是这些前期积累为2012年开始着手开发的“中华经典古籍库”产品提供了重要的思路。

作为专业古籍出版社,洪涛坦言,中华书局的古籍数字化“起步还是晚了”,“当《中华经典古籍库》进入市场时,大量的古籍数据库已经占据了市场,销售推广工作因此遇到很大的困难。”中华书局观望的原因,跟其他出版社迟迟不敢迈入古籍数字出版类似:出版社与生俱来的技术软肋、尚未成熟的古籍库使用市场,当然更为重要的是,国内尚待完善的数字版权保护。对于古籍社来说,最为核心的资源就是古籍图书出版,数字化在某种程度上会降低侵权的门槛,对原有出版板块带来消极影响。但是,“随着社会上古籍数字化产品越来越多,特别是中华书局与数字公司之间不断的知识产权诉讼,我们逐渐认识到研发自有知识产权的产品也许是保护数字版权的一种更好的方式,即通过高质量的产品占据市场。”

一段时间的“蛰伏”,让中华书局在进行数据库产品设计时有了更为清晰的思路,即以庞大的古籍整理成果和规范的海量合法数据为依托,开发符合用户需求和学术规范、符合中文古籍特点的产品。在已有资源的基础上,2014年,《中华经典古籍库》第一期镜像版正式上线,其数据质量与纸书持平甚至超越纸书,并且能实现文本数据与原书图像对照、自动生成引文格式等功能。2015年古联公司的成立更是让中华书局的数字化进入快速发展阶段。之后,《中华经典古籍库》在线版、微信版陆续推出。其中,微信版的尝试可以说是业内首次。在洪涛看来,微信版数据库让古联公司第一次真正地面向读者:通过后台的统计分析功能,可以了解到用户检索和阅读哪些内容、什么时间使用数据库、哪些地方的用户最多、操作方式是什么等等。而这些用户数据对于明确产品的发展方向和提升营销的针对性都起到了关键作用。在此后的推广中,古联公司与多家高校开展合作,将微信版账号赠送给在校学生使用,培养潜在用户群体。

中华书局总编辑顾青清楚地知道,要整合国内外优质的、海量的、有版权的古籍整理本资源并非易事。对于古籍整理出版这样的专业出版形态,资源的横向聚合显得更为重要,古联公司的数字化业务应该如“古联”二字的含义一样,整合出版机构的古籍资源形成有效合力,最终搭建出版机构共同的数字未来。目前《中华经典古籍库》已经收入了华东师范大学出版社、凤凰出版社、巴蜀书社、天津古籍出版社等社的古籍资源,2017年年底,《中华经典古籍库》的资源可达1800种。然而,对于使用者来说,近2000种的资源容量仍远远不够。

责任编辑:袁思源

分享到:

主办单位:中国出版集团公司 网站维护:中版集团数字传媒有限公司   京公网安备 11010102002203号 中国出版集团公司 2009,All Rights Reserved 京ICP备12053001号-1