于洋:人工智能时代下的机器翻译与出版

于洋

随着科学技术日新月异的进步,当下国际出版业诞生了很多新鲜事物,在“国际出版聚焦中国”的沙龙主题下,我希望能将我所经历的机器翻译与出版的发展情况介绍给各位。

大数据预测未来出版趋势

2016年3月9日,阿尔法围棋(AlphaGo:一款围棋人工智能程序)对战围棋冠军李世石,最终李世石投子认输,阿尔法围棋取得的成就为人类带来了惊喜。时至今日,AI人工智能技术的发展成果和成熟度远超人们的想象,AI人工智能技术在各个行业得到极大的应用。人工智能的基础是大数据。

“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。为什么称之为“大”数据,以互联网为例,全球每分钟有240万名用户使用谷歌搜索引擎(Google)搜索关键词,701389名用户登录脸谱(Facebook),347222名用户登录推特(Twitter)。在中国,大约有400多万个网站,700多万名网民,微信用户9.27亿人。新闻资讯类App“今日头条”每天有6000万用户搜索新闻。这些庞大的数字,都是信息资产。

在出版行业也有大数据。据统计,每天有3000万条来自200多个不同国家、65种语言的出版业新闻资讯文章。2015年5月,中译语通科技有限公司推出了跨语言大数据平台(Process Language Big Data),这个平台可以将这些来自全球的不同种类新闻资讯的关键词进行统计分析,总结这些庞大数据中存在的规律,以帮助预测未来出版业的发展。

译见平台与新闻出版

在大数据基础上,中译语通公司深度挖掘跨语言大数据之美,开发了“译见”。它是跨语言的大数据信息搜索与分析的综合平台,整合机器翻译、语义分析、智能采编、数据挖掘等十余种当前最先进的自然语言处理、大数据和人工智能技术。通过利用此平台的数据分布分析技术,用户能够获取并得出一些独特的信息。比如,每年自然灾害发生的地点分布统计图。

目前,译见正在研究的不仅有出版资讯,还将深度观察财经行业信息,研究分析影响股票交易市场变化的具体因素,尝试发现新闻与市场、产业、公司之间的联系。译见用历史数据说明趋势,从每一条开源新闻中获得其具体发生地,从分析结果观察产业影响。用户可以利用这些开源资讯,观察媒体对出版业的影响。目前中国很多出版商在关注IP内容,用户可以追踪热点话题、分析对比产品,将其转化为出版业的产品。

机器翻译开辟未来

机器翻译是自然语言处理的一部分,融合了很多技术,处于大数据顶端的位置。近年来由于大数据发展速度迅猛,目前机器翻译已经得到了大规模的使用,机器翻译替代人类完成了难以想象的翻译量。在未来,机器翻译能更好帮助人类翻译,让人类看到不同的世界。

责任编辑:袁思源
分享到微信

分享到:

主办单位:中国出版集团公司 网站维护:中版集团数字传媒有限公司   京公网安备 11010102002203号 中国出版集团公司 2009,All Rights Reserved 京ICP备12053001号-1