古籍库先行者如何“抢滩”?

古籍数据库是既“冷”又“热”的存在,“冷”是因为古籍学习与研究的专业性高,并不为大众所应用,“热”则是指当前古籍学习研究对古籍库的依赖逐渐增强,几乎成为大型图书馆和古籍研究机构的“标配”。国家也在积极推进国家级古籍整理出版数字平台建设,推进跨出版社、跨集团、跨地区的古籍数字化资源合作。众所周知,在古籍数据库开发上,被认为是拥有先天资源的出版机构并不具备优势,北京书同文数字化技术有限公司、北京爱如生数字化技术研究中心等商业公司凭借先发优势成为了佼佼者。在出版转型升级的推动下,近年来,出版机构在古籍数据库开发上已经有了不小的成果,在古籍数字化领域成为不容忽视的一股力量。目前,这些数据库都在稳步地升级及推广中。寻着这些市场“拓荒者”的步伐,不难看到古籍数据库开发的可行路径。

资源导向各有所长

从目前的产品来看,古籍数据库的开发有4种主要方式,一是按照古籍的原貌原样扫描或影印的原样数字化,对应的数据库是原样型数据库,二是对古籍进行全文录入并进行整理的文本式数字化,对应的是整理型数据库,三是按照特定需求开发的知识服务型数据库,四是书目型数据库,注重对现有古籍馆藏、版本等材料的基本数据的整理。相对来说,前两种数据库的开发对出版社本身古籍资源的积累要求较高,后两种数据库则更体现出版社的策划及专家号召力。但是,无论是哪种数据库的开发都离不开对出版社自身拥有资源的审视。

以中华书局于2014年开始上线的《中华经典古籍库》为例,中华书局独一无二且数量可观的点校本古籍就是其最大的优势。从2003年至今,中华书局的古籍数字化经历了从文本数字化处理、数字化用字规范、知识服务探索到资源产品的运营4个阶段。据悉,预计到2017年年底,《中华经典古籍库》可供上线资源可以达到1800种,累计约10亿字。尽管在数量上尚处劣势,但是权威整理版本、可直接征引成为其最大优势。今年,中华书局加快落地推广,试用机构和使用机构有较大幅度的增长。

与中华书局主要依托自身资源进行开发的模式类似,国家图书馆出版社的核心出版业务是影印出版历史文献专题丛书,除此之外,书目文献和珍稀仿真文献亦属出版特色,这也决定了国家图书馆出版社古籍数据库开发以善本、古籍影印图书数字为主。2012年,国家图书馆出版社设立“数字出版部”并申请到了文化产业发展专项资金经费,这成为这该社第一个数据库产品“中华再造善本数据库”的建设经费。“中华再造善本数据库”为珍贵古籍善本的图像版,囊括《中华再造善本》唐宋编、金元编758种珍稀古籍原本的数字资源。同时提供印章识别和版本对照等功能,支持摘要和图书信息搜索,主要以版本展示为基础。该库既可配合纸书销售,又可弥补纸书覆盖之不足。

尽管没有古籍纸质出版资源,但是陕西师范大学出版总社数字出版中心从2008年就开始了古籍数字化的工作。陕西师范大学出版总社数字出版中心副主任李强辉知道,与中华书局等古籍大社相比,陕西师大社可资利用的原版资源非常有限,资金匮乏,依托陕西师范大学历史文化学院教授的研究,陕西师大社将自身的数据库开发方向定位于版本目录数据库,对现有古籍文献目录信息、图版文件、馆藏信息等进行系统化整理,形成了《汉籍数字图书馆》并于2010年推出上线。2016年9月,《汉籍数字图书馆》2.0版全新上线,目前推出的有“传世文献库”“敦煌文献库”和“中医药文献库”。

借助上海交通大学历史系和地方文献中心抢救性保护的民间一手研究资源,上海交通大学出版社选择开发对藏于民间的地方历史文献进行整理的《中国地方历史文献数据库》。与许多文献数据库资料来源于馆藏典籍文献不同,该库收录的文献或来源于上海交通大学地方文献中心专家的田野调查,或来源于市场收购,从各地的文物市场中抢救、搜集村落、家户中流出的文献,可以说,数据库中每一份史料都具有其独特性与不可复制性。这使得该数据库在2016年销售第一年时,销售收入就突破百万元。

可以看出,古籍数据库的开发资源来源多处,既有对现有古籍的整理,也有对民间资源的整理,但依托本出版社或者特定专家资源成为必不可少的前提。

滚动式开发持续升级

数据库的开发向来都耗费“巨资”,这对于出版社来说不仅需要有魄力更需要有滚动式开发和运营的能力。

一般来说,出版社在进行古籍数据库开发时都会申请相关项目支持,如上海交大社的《中国地方历史文献数据库》就入选了2013~2015年度新闻出版改革项目库,中华书局的“中华经典古籍库”也利用财政投入不断发展,国家图书馆出版社申请到了文化产业发展专项资金经费等。但是,这些投入只能作为启动资金,数据库的建立和完善仍让大部分出版社为之苦恼。上海交大社副社长宗德宝回忆,为了解资金之急,上海交大社与上海交大历史系和地方文献中心协商延迟支付版权费用并共享未来收益。同样,资源平整、修复、扫描等也需要大笔资金,出版社与上海交大图书馆协商,由图书馆从馆藏数字化角度出发,先期招标扫描,费用由其承担或垫付,数据库建成后图书馆可免费使用,同样也可享有未来收益。出版社自筹资金开发数据库系统,并通过对合作公司的智力支持减少系统开发的投入。同时,通过边运营、边建设的模式带来一定的现金流。陕西师大社则采用与专家学者捆绑式合作,单独核算,独立运作,出版社提供最大化政策支持来保障数字产品的落地。

国家图书馆出版社将产品与项目紧密结合,把握出版节奏,注重效率,控制成本,先出可以销售的产品,逐步实现盈利后再扩大生产,使出版社增加新的利益增长点,顺利实现产业结构的转型升级。

在李强辉看来,古籍的数字化并不一定要走开发数据库之路,当下,陕西师大社正在尝试开发一部古籍工具书的数字化产品,从小投资项目入手开发古籍数字化产品。

岳麓书社“古典名著数字化工程”的首款产品——“四大名著”名家演播版可以说是当下数字化成功产品的典型代表。“四大名著”(名家演播版)并不是单纯地把“四大名著”的文字进行数字化转换,不是简单的“新瓶装旧酒”,而是利用二维码技术,在现有文本的基础上加入了大量的音频和视频,有艺术成就相当高的播音主持界专家的演播,也有中国古代文学研究专家的专业讲解和赏析,拓宽了“四大名著”的内涵和外延,非常适合当下的听书潮流和微视频潮流。

或许现在看来演播版的形式并不新鲜,但是对于出版社来说,这种尝试难能可贵。比起建立大型数据库或者数字平台,通过对纸书内容进行有效数字转化,这种投入相对较低、成效相对较快的尝试似乎更适合。

责任编辑:袁思源

分享到:

主办单位:中国出版集团公司 网站维护:中版集团数字传媒有限公司   京公网安备 11010102002203号 中国出版集团公司 2009,All Rights Reserved 京ICP备12053001号-1