领导活动 | 部门工作动态 | 集团新闻 | 媒体关注 | 图片新闻 | 视频新闻 | 专题报道 | 一周回顾

在线辞书开发 从查词到学习服务的“变身”

6月11日,由商务印书馆推出的官方版本《新华字典》APP正式上线,除了查词功能,该APP还提供数字版纸版对照、原《新闻联播》播音员李瑞英播读、汉字规范笔顺动画等增值服务。正版新华字典APP的推出无疑是适应当下用户使用习惯的必然举措。早在此前,市面上就已经出现多个版本的“电子版《新华字典》”,官方版本的推出起到了正本清源的作用。与纸质辞书连续多年销量下滑的情况相反,在线辞书的产品数及使用量正逐年上升,多功能、立体化的在线辞书开发已经是辞书出版大户的重中之重。更为关键的是,出版社已经不仅仅将在线辞书定位于查词工具,而是力图通过在线辞书的开发打开在线语言学习服务的市场。

目前在线辞书可以分为三类:一是出版社依托纸质图书开发的在线辞书,这类在线辞书大都是精心编纂并且需要付费,主要特征是专业权威、制作精良;二是免费的互联网在线词典,如有道词典、百度词典,其主要特征是内容广泛,可以做辅助参考,但需要用户具有较强的辨别真伪能力;第三类是个人和小型机构提供的盗版在线词典,这类产品常常借原品牌影响力获取用户,内容未经审核且经常内含垃圾广告。据知情人透露,这些盗版词典很多和各类应用有千丝万缕的利益反馈关系。

作为当下国内排名前列的在线辞书开发商,上海海笛数字出版科技有限公司10余年的发展历程在某种程度上跟国内在线辞书需求的变化是相对应的。2003年,海笛创始人范剑淼上线了中国第一个在线词典——海词词典。海词词典从一开始采用的就是类似于维基百科模式的共享词库,吸引用户参与内容创作,并且把内容定位在解决留学生等人群在日常生活学习中遇到的表达和理解问题,几年时间就积累了上亿的用户。这可以算是较早的UGC(用户原创内容)的尝试。但是,几年之后,海笛COO张逸等人就意识到,维基模式在词典内容质量提高上有很多不足,而用户对专业辞书的需求正在膨胀。于是,海笛在2009年成立专业的词典编辑团队,结合互联网产品需求特点,为特定人群特别是在校学生人群,开展定制化词典服务。

为了快速提升内容品质,以及对接出版业对于在线辞典开发的需求,从2013年开始,海笛开始和专业辞书类出版社合作,将国内优质、有品牌影响力的辞书内容进行数字化,开发成可在移动端便捷查询和使用的APP。这项业务成为当前海笛的核心业务。《新华字典》APP的技术提供商正是海笛。

从事在线辞书开发有10余年的海笛COO张逸在接受采访时提到,随着用户对内容和体验要求的提高,加上在线辞书的便携、易用,会有越来越多的人选择收费的精品权威辞书。当然,一些只需要辅助了解的用户则会继续选择免费互联网词典或者免费的搜索引擎服务。

在线辞书“正版”扩容

不可否认的是,当下用户对在线辞书的需求已经不仅仅在于查词等基本功能,出售辞书版权进行简单的数字化对于出版社来说也非长久之计。收集用户使用数据、分析用户行为、保持与用户反馈及互动贯穿在在线辞书设计、调整、销售中。

作为工具书出版王国,商务印书馆在2009年就成立了数字出版中心,该中心的任务之一就是探索在线工具书的开发。在进入商务后就开始参与语料库建设的数字出版中心主任孙述学对工具书的数字化有着种种思考。他认为,在线辞书的开发应该是把纸书做成内容,把产品做成服务。在这种思路下,商务分几路进军在线工具书市场:一是“百种精品工具书数据库”,遴选商务印书馆100余种现代精品中外文工具书,涵盖汉、英、俄、德、法等20多个语种;总字数3.5亿余字,词目360余万条,面向的是机构用户。二是已有工具书APP化,如《牛津高阶英汉双解词典》第7版、第8版APP,前不久发布的《新华字典》APP以及正在开发中的《现代汉语词典》APP等。三是辞书纸电同步开发、同步发布,如在2015年,商务同时发布第三版《辞源》的纸质版、网络版和优盘版。优盘版内容源于纸质辞书,但是很多增值功能却是纸质辞书无法实现的,如模糊检索、划词检索、古音检索、书证检索、简繁体关联检索、词汇聚类等。数字技术辅助纸质版完成索引、专项检查等工作。四是应用型在线工具书APP开发。如2012年上线的“外国人学汉语工具书APP”,这款移动应用产品就是商务与英国精致绘图公司合作开发的。这个APP把商务很多权威的工具书的内容整合起来,如从图解词典中提取家庭、旅游、医院等场景图,从例句库提取例句,释义从汉语工具书数据库中提取,让外国人能够更加直观地进行汉语学习。

而这些在线产品的开发都得益于商务“三库”“两平台”体系的支撑。“三库”即语料库、辞书资源库和辞书数据库,这是商务编纂辞书的基础性资源。“两平台”指数字编纂平台和排版平台,这是商务数字出版的两个工作平台。“三库”“两平台”形成商务工具书数字出版的基础系统。

强化学习功能增加粘性

外语教学与研究出版社在在线辞书的开发上注重学习功能开发。据外研社综合出版事业部主任罗来鸥介绍,外研社在线辞书编纂思路的转变是很明显的:将词典丰富的学习功能和词汇学习结合起来。如《朗文当代》APP既可以查词也可以学词。APP里加入了单词发音评分功能,用户可以自我测评单词发音;APP提供各类考试及教材的词汇表,便于开展相关词汇系统学习;提供单词学习和记忆功能,用户可按照收藏制订复习计划,APP根据记忆曲线自动提醒复习等。这种学习功能的加入是增加用户粘性的有效手段。

为了能够开发适销对路的在线辞书,外研社在开发时首先会进行市场调研,确定市场需求,然后确认纸质图书的数字版权,开发APP前获得版权方的书面许可。而后进行需求整理,和技术方共同针对需求进行产品设计,在有可能的情况下还会拿产品原型在目标用户中再次调研。之后完成数据整理、产品开发、测试、上线。

罗来鸥认为,并不是所有的词典都适合开发成在线产品,外研社会根据纸版辞书中是否具有适合开发成学习功能的内容进行选择,即是否具有除了释义之外的其他延伸内容,这样可以减少内容研发的成本。“大而全的辞书也会考虑开发成数字版”,罗来鸥补充。如《新世纪英汉大词典》部头大,印刷版有3000多页。纸书容量有限,将纸书无法呈现的图片、音频、音效等多媒体内容集成到APP中,可以让用户拥有更好的查词体验。开发及运营成本、竞品价格、纸书销售价格、版权合作方的收益分成等都会影响到外研社在线辞书的定价。

当被问及当下在线辞书的收益情况时,罗来鸥表示目前市场情况尚好,“销售比较好的工具书APP的年下载量会达到几十万人次,付费转化率为1%~4%不等。”

社会化编纂崭露头角

不过,有专业人士认为,尽管功能更趋多元化、形式立体化,出版社开发的在线辞书仍未改变传统辞书的编纂和运营模式,没有“适应信息时代数字生态的进化”。现任《英汉大词典》主编朱绩崧就认为,词典要赚钱,就要踏踏实实做教育。词典的进化分形式与内容。形式上,要突破纸书的传统框架,在数字生态环境中,另立范式。内容上,要务大求全,以商品属性为主导,实现以读者参与为基础的半去中心化编纂,尽快回归教育产业的洪流。在编纂《英汉大词典》第3版时,朱绩崧就提出深度数字化、高度社会化词典编纂策略。

7月28日,上海译文出版社发出《英汉大词典》数字版开放公测邀请。据英汉大词典编纂处负责人张颖介绍,在运营可检索第2版全文的微信公众号“语言学问所”的基础上,编纂处希望通过“读者融入计划”扩大《英汉大词典》在中国高阶英语学习者中的影响,并逐步将该词典收录范围向20世纪以前扩展。公测期内,编纂处将从使用纸质版、微信公众号、手机应用的读者中,征募志愿者采编文献例证及新词新义,并将在手机应用及配套网页版的更新中,在相关条目内显著标注新增语料的来源和编者。记者发现,在“语言学问所”公众号上,用户既可以查词也可以使用“融入”功能新增语料。

张颖提到,在大家的观念里,辞书编纂需要“躲进小楼成一统”,而在数字化时代,这种“读者产生内容”与“编者产生内容”结合的编纂实践或许更能体现和发挥集体的智慧,让辞书“取之于民,用之于民”。

尽管是互联网原生词典开发公司,上海海笛数字出版科技有限公司与出版社一样,在如何“跳出纸质辞书的编纂思路,充分挖掘新媒介模式服务用户”上仍存在不少困惑。张逸提到,把数字辞书的词条内容升级到具备声音、动画、测验练习功能的新一代数字辞书,再把数字辞书的服务升级到权威全面的知识服务平台级别,这对于技术商及出版社都是一个重大挑战,很多内容和服务都需要创造性地研究和大胆探索尝试。工具书产品要充分利用网络和大数据的特征,向智慧平台方向进化,向个性化服务和海量权威知识服务平台方向进化。

责任编辑:袁思源

分享到:

主办单位:中国出版集团公司 网站维护:中版集团数字传媒有限公司   京公网安备 11010102002203号 中国出版集团公司 2009,All Rights Reserved 京ICP备12053001号-1