搭建数字化整理平台,招募社会力量

900多人,有大学生、出版社编辑、律师、教师,还有远在德国、俄罗斯的中国留学生。4个多月的时间,他们在线上共同参与近2亿字的古籍审校。是中华书局的数字化古籍整理工作平台让他们跨时空相聚。

“业余选手”保质保量地完成了一项原本不可能完成的任务,令人欣喜。更让人欣喜的是,他们中大多数都是年轻人,熟练掌握古文阅读、具备一定文字学基础、善于运用数字技术是他们的共同特点。

按照中华书局的设想,未来古籍整理出版的全部流程都可以在网络上完成,最后纸电同步出版。有这么多热爱中华传统文化的年轻人,这个设想应该可以实现。

2017年年底,随着耗时8年多的《中华大藏经续编》陆续交稿,中华书局总编辑顾青发现自己面临着一项不可能完成的任务:全书近2亿字,2019年必须出版——作为国家出版基金资助项目,出版计划是定死的,不能更改。

担心

用众包的方式审校古籍,能保证质量吗

顾青算了一笔账:假设一名高产的古籍编辑一年审校300万字,2亿字需要中华书局60名古籍编辑工作一年。按照“三校一读”的出版流程,2亿字的书稿要从头到尾通读4遍,60名编辑即使白天黑夜连轴转也要干3年。

巨大的工作量、日益紧迫的出版日期让顾青发愁。他突然想到中华书局刚刚搭建的数字化古籍整理工作平台,为什么不利用这个平台招募社会力量共同参与呢?

但是,古籍整理专业性很强,中华书局的编辑大都毕业于相关专业,通常要在书局浸润三五年才能独立承担任务。从社会上招募志愿者,用众包的方式审校古籍,这不是异想天开吗?能保证质量吗?顾青心里也打鼓。

《中华大藏经续编》是国家重大古籍整理出版工程,也是国学大师任继愈先生的未竟之志。1997年,历时15年的《中华大藏经》在任继愈的主持下终于出版,但106册、约1亿字的《中华大藏经》并未能将历代佛经一网打尽,之外尚有2000多种佛经未收录。《续编》就是要将这些古籍审校出版。2009年6月,93岁高龄的任继愈在病榻上与中华书局签订了《续编》的出版合同。一个月后,老人溘然长逝。

“如果《续编》出现质量问题,怎么对得起任先生?”顾青说。但形势的发展已容不得犹豫。

中华书局搭建数字化整理平台,招募社会力量907

《中华大藏经·续编(汉文部分):印度典籍部》(全四册)

《中华大藏经·续编》编委会编

中华书局搭建数字化整理平台,招募社会力量955

《中华大藏经·续编(汉文部分):南传典籍部、藏传典籍部》(全二册)

《中华大藏经·续编》编委会编

放心

一批批审校稿陆续传回,质量全都达标

2018年3月,中华书局发出了第一份启事,招募在线审校人员。短短一个月,全国竟有1500多人报名。经过试用考核,最终留下900多人。这其中有在校大学生、出版社编辑、律师、教师等,遍布全国各地,甚至远在德国、俄罗斯、泰国的中国留学生也申请成为审校者。

入选者会领到一个专业古籍整理网站籍合网的账号,在线接受任务。中华书局将底本即内容最全、错误最少的作为校勘的基本依据的古籍图片与文档通过网络发给审校者,后者对照底本,逐字逐句审阅,遇到错讹,直接在平台上修改,书局编辑借助平台版本对比功能来查看审校者的修改记录,判断修改内容是否合格。

《续编》所收经典上迄唐代下至明清,有刻本有抄本,有梵文有巴利文,历代字体不一,正字俗字异体字错杂,有的模糊不清,有的残缺不全,给审校者出了很多难题。但业余审校者们以高度的责任感和严谨细致的作风拿出了一份让内行也赞不绝口的成绩。

中华书局搭建数字化整理平台,招募社会力量1449

来自山东的心理学老师鄢敬新用两个月的时间完成了20卷、近65万字的在线校对工作,撰写注释多达1444条。在工作中发现书局发给他的一部古籍的底本少了4卷,书局委托鄢敬新补齐所缺文本,保证了书稿的完整性。鄢敬新说:“我们审校的目的就是把电子文档中出现的问题找出来,最大限度地减少讹误,呈现古籍的本来面目。”

复旦大学博士生方思园熟识梵文,当仁不让地承担了梵文古籍的审校。梵文之难是众所周知的,有的梵文字母外形极为类似,稍不留神就会辨识错误。古籍上的梵文字很小,密密麻麻堆在一起,方思园睁大眼睛,一个字一个字比对识读。日本人开发了一套梵文字库,要支付巨额使用费。在书局的委托下,方思园和其他几位复旦同学开发出中国第一套适用于计算机输入的梵文字库,7000多个梵文文字都是一笔一画手工绘制的,负责摹写的人累得得了腱鞘炎,但成就感满满——“我觉得我们开发的字库比日本人的漂亮多了,排版出来很好看。”方思园说。

来自温州医科大学的朱若溪是敦煌学博士,她翻了很多大英博物馆和法国国家图书馆等收藏的敦煌文献,挑选最为清晰的PDF文件下载,发现了不少文稿整理者忽视的地方。比如敦煌写经中的错字衍字,千年以前的书写者如果发现了就会在旁边做个删除的记号,但这种记号只有在高清的彩色图片上才能看出来。古籍中的一些讹误,就是这样被她发现的。

随着一批批审校稿陆续传回来,顾青渐渐松了口气,因为业余古籍审校者的工作质量是达标的。顾青问了几位资深编审,“这批审校稿拿出去会不会毁了中华书局的名声?老先生们说,不会!我心里一块石头落地了。”

信心

在线审校者中年轻人占大多数,古籍整理后继有人

利用数字技术调动社会力量参与古籍整理是一个全新的尝试,它使以往仅仅局限在专业人士小圈子里的工作迈向大众,古籍整理的效率成百倍地提高。

任继愈先生主持编纂的《中华大藏经》有160多人参与,前后共计15年。而《续编》在9个月的时间里完成900多部经书约6000万字的审校任务。按照目前的进度,2019年完成全书出版,应该不成问题。

“这些在线审校者真的令人感动,有的人腿摔断了还坚持看稿子,有的人在进手术室之前还不忘交稿子……没有他们的奉献,我们是不可能完成这么大的任务的。”古联公司文献编纂部主任朱翠萍说。

在顾青看来,古籍整理后继有人了。900多名在线审校者中,二三十岁的年轻人占绝大多数。热爱中华传统文化、熟练掌握古文阅读、具备一定文字学基础、善于运用数字技术是他们的共同特点。借助网络交流的便利,很多疑难问题,发在QQ群里,大家共同探讨,很快就会有结果。

为了进一步做好在线审校工作,2018年12月15日,中华书局举办了第一届古籍在线整理专家学者论坛,对精选出的70余位在线审校者进行业务研讨与培训。中华书局总编辑助理俞国林现场出了3道题,3首未经句读的古诗和古文出现在大屏幕上,3位在线审校者仅仅看了十几秒就准确无误地断句标点,流畅地朗读出来。

除了人才,技术的进步也是提升古籍整理效率与质量的利器。按照中华书局的设想,未来古籍整理出版的全部流程都可以在网络上实现。整理一部古籍,首先扫描底本,系统自动识别文字,经人工检查后,将电子文本上传至平台;编辑把电子文本分成若干任务包,在平台上发布;整理者申领任务,利用平台提供的自动校勘、标点系统,初步整理后,人工修正错误并提交稿件;最后,编辑在线审稿、加工,然后自动排版,实现纸电同步出版。

中华书局搭建数字化整理平台,招募社会力量2866

中华书局总编辑顾青在“第一届古籍在线整理专家学者论坛”上发言

顾青表示,在古籍整理领域,人工智能不可能完全代替人的工作,每个环节都需要进行人工干预,只要做好前期的体例设计、后期的审核,完全可以编辑出符合古籍整理质量要求的出版物。

“和许多从事传统文化研究的老先生相比,我们是幸运的。他们没能赶上的好时候,我们赶上了。我们必须珍惜新时代给我们创造的机遇,殚精竭虑、全力以赴,为建设伟大祖国的优秀传统文化宝库,添砖加瓦,贡献自己的知识和力量。”作为在线审校者代表,鄢敬新说。

(本文转自《人民日报》2019年01月10日12版)

《中华大藏经·续编》前六册

《中华大藏经(汉文部分)·续编》是由任继愈先生倡议编纂,继1997年中华书局出齐《中华大藏经(汉文部分)》之后的又一重大文化工程。该续编是从《嘉兴藏》《卍续藏》《频伽藏》《大正藏》《普慧藏》等各版大藏经及敦煌文献、房山石经中,挑选《中华大藏经(汉文部分)》未收之重要佛教典籍,网罗遗珍,点校而成。《续编》规模宏大,收经八千余卷,2272种,每经一个序号,分列为“印度典籍部”、“南传典籍部”、“藏传典籍部”、“汉传注疏部”、“汉传撰著部”、“礼忏部”、“史传地志部”、“疑似部”、“音义目录部”、“外教部”十部。

中华书局搭建数字化整理平台,招募社会力量3410

《中华大藏经·续编(汉文部分):印度典籍部》(全四册)

《中华大藏经·续编》编委会编

9787101136241

1520.00元

《中华大藏经·续编(汉文部分):印度典籍部》(全四册),收录印度佛教经律论、贤圣集传典籍汉译本199种(第一—一九九号),包括《大乘宝云经》《楞伽阿跋多罗宝经会译》《苏悉地羯罗经》等重要文献,其中部分经目为历代各版本大藏经所无,如般若类精要之作敦煌本《唐梵翻对字音般若波罗蜜多心经》等。

中华书局搭建数字化整理平台,招募社会力量3627

《中华大藏经·续编(汉文部分):南传典籍部、藏传典籍部》(全二册)

《中华大藏经·续编》编委会编

9787101136258

760.00元

《中华大藏经·续编(汉文部分):南传典籍部、藏传典籍部》(全二册),收录南传佛教典籍6种(第二〇〇—二〇五号),涉及长、中、小、论部经典,包括《本生经》《发趣论》等;收录藏传佛教典籍3种(第二〇六—二〇八号),其中如清代工布查布译《佛说造像量度经》,是说明造佛像法度的经典,对研究佛教造像有重要的作用。

关于“籍合网”

中华书局搭建数字化整理平台,招募社会力量3865

“籍合网”是国内首款古籍整理与数字化综合服务平台,由中华书局下属古联(北京)数字传媒科技有限公司负责建设和运营。“籍合网”下集中整合了多种古籍数字化产品。《中华经典古籍库》是目前正在运营的重点产品。其资源以中华书局整理本古籍图书为核心,同时涵盖多家专业出版社的古籍整理成果,截至2018年,上线资源已达到近1900余种,总计约10亿字,数据资源以及合作出版社还在持续增加。该产品目前已经成为专业领域内最权威的古籍整理数据库。此外,“籍合网”整合的数字产品还包括《中华文史学术论著库》《中华古籍书目数据库》《中华善本古籍数据库》《中华文史工具书数据库》等,满足不同用户的阅读与研究需求。

责任编辑:赵冀斌

分享到:

主办单位:中国出版集团公司 网站维护:中版集团数字传媒有限公司   京公网安备 11010102002203号 中国出版集团公司 2009,All Rights Reserved 京ICP备12053001号-1