籍合网:数字化让古籍活起来

1

从2003年成立古籍资源部,到2018年推出古籍整理与数字化综合服务平台——籍合网,再到2022年推出“3D超写实数字人苏东坡”,中华书局经过不懈探索,逐步奠定了其在古籍数字出版行业的领先地位。

“起舞弄清影,何似在人间。”正如苏东坡在《水调歌头•明月几时有》中所写的那样,这位大才子对世俗人间充满了无限深情。“我们想,对人间予以深情的东坡、被人们深爱的东坡,也一定愿意重返人间。”为此,中华书局古联公司联合元宇宙生态链企业北京谛听视界文化科技有限公司,基于古籍文献和数字技术进行了为期一年的认真研发,历经几十次研讨打磨及版本迭代,最终将全国首位“3D超写实数字人苏东坡”送到了大家的面前。中华书局110周年局庆大会之际,“数字人苏东坡”得到了读者的热情反馈。

如何推动中华优秀传统文化创造性转化、创新性发展?把握好数字化机遇,做好古籍数字化工作,无疑是让中华优秀传统文化展现出新时代风采的重要手段。从2003年成立古籍资源部、2015年改组为古联(北京)数字传媒科技有限公司(简称古联公司),到2018年古联公司推出古籍整理与数字化综合服务平台——籍合网,这些年中华书局经过不懈探索,逐步奠定了其在古籍数字出版行业的领先地位。在中华书局执行董事周绚隆看来:“中华书局过去10年最大的突破就是古籍数字化。我们成立了古联(北京)数字传媒科技有限公司,打造了包括中华经典古籍库在内的多个专业数据库,现在处于全国前列水平,在业内非常有影响力;还研发了古籍文字识别、自动标点等专利技术,搭建了古籍整理与数字化综合平台‘籍合网’,这些已经成为中华书局重要的品牌支撑。”

近日,国家新闻出版署发布通知,公布了2022年度出版融合发展工程入选名单。中华书局“籍合网”入选“2022年度数字出版优质平台遴选推荐计划”。

资源丰富 标准规范

早在2003年,中华书局就成立了古籍资源部,着手布局古籍数字化工作。2012年起,中华书局决定将数字化内容做成数据库。2014年,中华书局首款数据库产品——“中华经典古籍库”问世,该库汇集了中华书局历年出版的整理本古籍资源内容,是国内首个大型整理本古籍全文数据库。“中华经典古籍库”目前共上线9期资源,资源总量超20亿字,汇聚了凤凰出版社、巴蜀书社、齐鲁书社等20多家出版机构的优质古籍整理本资源,数据准确,内容权威,得到了学界的一致好评。

2015年8月,中华书局将古籍资源部改组为古联公司。此后的三年时间里,古联公司研发了在线古籍整理与发布系统,开启了全新的线上资源生产和出版模式。2018年,古联公司整合现有数字产品,推出“籍合网”。随后在线众包平台、古籍整理培训平台、古籍智能整理平台等创新产品与模式不断发展成形。近几年,古联公司发展迅速,在古籍数字化专业服务上,逐步形成了数据库建设、在线编校、技术服务、人才培养、校企合作的产业服务矩阵。

“籍合网”在成立之初,就得到古籍办的大力支持,目标是建成国家级古籍整理与数字化综合服务平台。平台将专业内容和智能技术相结合,聚合了以古籍整理为核心,以知识服务为脉络的各类数字化产品。旗下专题数据库主题多样,资源体量达40亿字,涵盖古籍文献、学术研究、文化艺术等各种类型,全面满足当下多元化、专业化的用户需求。

除了“中华经典古籍库”,以知识服务为主旨的条目型数据库——“中华古籍书目库”“历代进士登科数据库”“历代石刻专目总目数据库”等,发挥结构化数据优势,为用户提供完备、准确、实用的信息服务;以各类型石刻文献为主体的石刻数据库——“中华石刻数据库”及系列子库,与整理者通力合作,打造集历史资料与学术研究成果于一身的石刻专题数据库;专业文化艺术类数据库——“中华书法数据库”“中华木版年画数据库”等,全面收录历代书法作品及木版年画资源,图像清晰,并辅以文字著录,能够为相关研习者提供有价值的研究资料。

此外,“籍合网”还与学者合作,打造了包括“殷墟甲骨文数据库”“现代汉译文学编年考录数据库”等在内的多款专题性数据库产品,以数字出版形式发挥学术成果优势,弥补纸质出版的不足。

迄今为止,“籍合网”平台已拥有国内机构用户100余家、海外用户40余家、个人注册用户22万人。

字符类型多样、字际关系复杂、终端需求不同、生僻字繁多是古籍数字化工作时时面对的问题,主动开展字符集整理与规范工作,是解决古籍排版、数据库字符呈现、智能处理工具研发等系列问题的必要措施。为此,在古籍资源建设的同时,古联公司专门开发了“中华书局宋体字库”及“梵文悉昙体字库”“甲骨文摹写字库”等专门字体,收录超过15万字符,用于解决古籍中各类楷书生僻字及甲骨文、金文、小篆、梵文等特殊字符的在线检索和显示问题。

为了更好地保证古籍数字化的质量,古联公司制定了《数据加工流程总规范》《XML数据整理工作规范》《元数据规范》《图像采集规范》《文字采集规范》等26种数据加工及技术开发标准,规范业务生产流程。2020年10月,古联公司“古籍数字化标准体系的建设与应用”荣获中国质量协会颁发的质量技术奖二等奖。

这些标准已经成为多家出版社古籍数字化出版的应用标准,为后续国家古籍数字化工程的开展提供了支持。

服务高效 守正出新

古联公司拥有专业的古籍数字化技术与研发能力,设立了专门的技术部门和大数据中心,研究古籍整理、编辑、出版的自动化问题。

为改善传统古籍整理工作大量消耗人力、时间成本等问题,古联公司以古籍整理和古籍数字化的基础工作为线索,研发了数款古籍智能在线整理工具。目前已经投入使用的技术包括:面向古籍整理和专业出版的自动标点、繁简转换、命名实体识别、引文核对及融合多技术于一体的文达编校系统;应用于古籍数字化生产的古籍OCR、在线XML编辑器、元数据著录编辑器等。结合“籍合网”数据库使用场景,平台还提供了包括字符查询、纪年换算、字库、输入法一系列辅助研究的专业工具,向用户免费开放。

为解决古籍数据编校工作量大、专业化程度高的问题,古联公司建立了专门的古籍整理众包平台及“i编纂”小程序。自2018年上线服务以来,积累了近5000人的在线古籍编校队伍,发布任务42976个,处理14.84亿字,为多个大型古籍整理出版项目、地方文库编纂项目提供编校力量支持,极大地加速了项目进展。

古联公司总经理洪涛表示:“这些技术工具与众包平台相结合,在古籍数字化整理和编辑过程中爆发出巨大能量,极大地提高了古籍工作效率。”

古联公司2022年加快了发展的步伐,通过一系列新的尝试,大力推进出版融合发展,促进古籍内容普及传播。

2022年1月,古联公司推出了专业的古籍整理培训平台——籍合学院提供视频资源库、在线学习及教学、题库、考试、项目管理、认证等多场景功能。籍合学院的建立初衷,一是希望将籍合网的古籍数字化整理的工作机制与培训业务深度整合,解决线上整理的人才培养问题。二是为高校提供线上课程资源,辅助教学,同时发力职业教育,响应业界呼声,为古籍编辑提供继续教育服务。目前籍合学院累计策划课程已超过300课时,课程数量超过60门,已上线100余课时,参与洽谈合作的教师有上百位,均为古籍整理及出版界成绩卓著的学者、编辑。同时,籍合学院还发布了两期中华书局古籍整理训练营,得到了众多古籍整理爱好者的积极响应,报名学员遍及高校教师、学生、职业编辑等各行各业。

此外,古联公司打造的中华优秀传统文化经典音频——中华书局经典之声,目前已逐步在喜马拉雅上线,为读者增添了一个学习古代经典的新渠道。而通过数字科技实现千年归来的“3D超写实数字人苏东坡”,未来将会逐步参与到数字出版创新、文化普及教育、城市文化宣传、数字形象代言、数字文旅赋能、数字虚拟演艺、沉浸场景构建乃至国际传播等全新场景中去。

“路漫漫其修远兮”,如何让古籍活起来,如何让中华优秀传统文化传下去?古联公司正在融合创新之路上奋力书写新篇章。

分享到:

主办单位:中国出版集团有限公司 网站维护:中版集团数字传媒有限公司   京公网安备 11010102002203号 中国出版集团有限公司 2009,All Rights Reserved 京ICP备12053001号-1