领导活动 | 部门工作动态 | 集团新闻 | 媒体关注 | 图片新闻 | 视频新闻 | 专题报道 | 一周回顾

茅院生:未来已来,出版何去何从?

ChatGPT开启了人工智能时代的新篇章。从过去一年盈千累万的生成式大模型频出,到Sora文生视频模型的爆炸性面世,人工智能正在改变着个人生活、行业发展乃至世界格局,成为产业发展新动力。作为人工智能发展基础的内容产业——出版业更是受到了广泛而深远的影响。

茅总

茅院生
中国出版集团有限公司党组成员、中国出版传媒股份有限公司总经理

人工智能给出版带来全流程的赋能与提升

一是创新内容生产。人工智能帮助出版机构实现个性化内容创造、内容分析与市场洞察、数据驱动的故事叙述,增强现实和虚拟现实内容,为编辑的选题决策、内容把关、经营分析提供了智能化支持,为“从读者的需求去研发内容”提供了可行的方式与路径。中国社会科学院文学研究所发布的《2023中国网络文学发展研究报告》指出,生成式人工智能辅助网文作者提升创作效率已成行业共识。大多数网络小说以自然人思维产品为主体,借助人工智能对其进行修改、提升以优化品质。有出版企业最大限度地发挥人工智能的能力,让人工智能和自然人共同参与创作,如海峡出版发行集团推出了完全由生成式人工智能担纲插画创作的《我的书中有秘密花园》。由人工智能为主要创作者,自然人对其进行润色修改,填补人工智能不足也已成为现实,如中文在线集团的“中文逍遥大模型”让内容生产进入“人力+算力”的模式,可实现一键生成万字,一张图写出一部小说。

二是创新翻译与编辑校对。人工智能技术应用于翻译、封面设计、插图制作等编辑环节将提高出版效率,特别是对于拥有大量优质文字、图片内容或版权数据库资源的出版社而言,人工智能能够实现指数级的助力作用。中信出版集团成立的平行出版实验室结合人工智能对内容进行从翻译到审读的转化,在保证译文质量的同时还大大压缩了翻译时间。例如《淹没之城》《图尔之战》采用了人工智能辅助翻译,相较人工翻译缩短了6~12个月的时间。在稿件采编评审流程中,中华医学会杂志社引入了人工智能写作检测工具,防止新型学术不端行为。

三是创新营销方式。通过人工智能抓取大数据,用户画像会更加精准;通过人工智能问答技术,可基于用户需求生成“千人千面”的专属营销文案。Sora文生视频技术将让图书营销中的视频制作更加简单方便,由虚拟数字人讲解“图书+课程”的长视频将成为营销常态,直播平台推广形式会更加丰富多彩。

四是创新产品形态与服务。从前只在脑海中的内容情节,在生成式人工智能帮助下可看、可听、可互动,为出版物赋予更多“实现”的可能。利用生成式技术融合图文、音视频、在线课程、数据库资源,集合音乐、视频、动画、游戏等呈现方式,出版的形态将会突破纸质、音像、电子出版物等传统平面或线性载体,向更多维立体的方向发展。清华大学沈阳教授团队搭建的AIGC平台不仅可以将文本内容呈现为多媒体形式,还可以将书中的角色转化为可交互的虚拟人物,使读者可以在阅读时与主人公进行互动,帮助读者连接文字和影音两个世界,提升了读者的阅读体验。

五是创新流程管理。人工智能是企业数字化的重要驱动力,可促进出版行业进一步优化数字要素资源配置,挖掘数据语料化、知识化标引、多模态数据资源等数据的价值,为出版业带来组织形式、内容生产方式,甚至发展战略的调整。

人工智能给出版业带来的问题与困境

一是传统图书市场更加艰难。从纸质图书市场来看,人工智能的“剪贴”生成能力会极大提升快消书的出版效率和品种数,降低成本和定价,相关图书市场竞争将更加激烈,甚至会出现劣币驱逐良币的情况。Sora等视频生成技术将会让短视频领域井喷式扩张,读者将在各类短视频平台更快地获取新信息、新技术、新方法,“开屏有益”的感受可能超过“开卷有益”。高质量训练语料是高质量大模型的核心要素,而现在有些用于训练大模型的底层语料存在大量无用、错误的信息,甚至存在价值观问题,如果将此“原材料”生成图书,让读者在阅读中认为图书并不必然可信,将给传统出版业带来更加致命的打击。

二是人工智能大模型盈利困难。人工智能大模型研发最主要的条件是“语料+算力”,专业语料需要购买,算力需要软件硬件,研发投入动辄千万、亿万计。各单体出版机构推出的人工智能产品缺少通用性,工具产品形态少,商业推广应用困难。用户付费意愿和付费能力也非常有限。

三是法律伦理和版权问题难以解决。2023年《科学》《自然》《肿瘤学》等多家科学期刊发表声明,不接受论文将ChatGPT列为“合著者”。生成式文本不能在论文中使用,人工智能不能成为作者,违反这些政策将构成学术不端行为。但在使用者写了提示词并据此调整了无数遍,以此生产创作出的图片包含了使用人工智能的创意和劳动,版权如何区分引发了观点对立的讨论。围绕内容资源的核心版权很难达成深入合作,有些大模型厂商存在直接盗用出版单位专业内容的情况,如中国大百科全书出版社的《中国大百科全书》(第三版)网络版、军事百科数据库、社科词条库的专业内容在未经授权的情况下被一些大模型厂商用于底层训练,大模型生成出来的内容已经打散重组,很难追溯维权。

四是部分传统出版岗位可能被替代。专业生产内容和用户生产内容这两种模式都必须在成本、质量和规模三要素之间进行抉择,放弃其一,存在“内容生产不可能三角”的制约。生成式人工智能具有大规模内容生产、低成本、高质量的特点,打破了传统意义上的“不可能三角”,导致有些岗位需求可能出现大量下降。

中国出版集团在人工智能领域的探索与实践

一是构建专业语料库。中国大百科全书出版社依托在百科领域的专业优势,目前已完成近百万的可供大模型语料预训练和精调过程中使用的专业知识问答对语料,并在持续抽取专业知识问答对,计划生成上亿量级的专业知识问答对,构建基于权威百科知识的人工智能语料库,正式发布了百科智能机器人“司南君百科知识问答机器人”。中华书局古籍语料库、商务印书馆工具书语料库、中译语通多语言语料库等已经实现商业应用。

二是搭建垂类大模型。中华书局古联公司积极探索古籍大模型的研发与应用路径,2023年12月与南京农业大学联合推出的首个古籍整理大模型——“荀子”古籍大语言模型,包含了“四库全书”在内的古籍文献超20亿字大型语料库,能够实现自然语言理解、自动翻译、诗歌生成、自动标引等多项功能。三联书店对过往20余年《三联生活周刊》刊物和知识付费课程进行模型训练和优化,可以根据用户的提问从三联知识库中寻找适合的答案。中译语通公司发布的“格物”大模型包括支持113个语种的多语言预训练模型、融合文本-图像-音频-视频全模态能力的多模态生成式对话模型,以及多模态机器翻译、语音识别与合成、图像理解与OCR(文字识别技术)、自然语言处理、知识图谱、多模态内容理解生成等一系列智能服务,为翻译、编辑、校对等提供了便利。中国图书进出口(集团)有限公司聚焦行业打造的出版垂类大模型,形成了人工智能驱动的产品生态体系,在满足出版行业应用的同时,向水利、农业、材料等方向延展并实现商业化运营。

三是人工智能技术开发及应用。中华书局的“古籍智能整理平台”可实现古籍繁简转换、自动标点、OCR识别等智能技术,为行业古籍整理提供服务。《三联生活周刊》数字刊在三联中读APP上线,通过文本转语音服务实现了过往杂志文章和公众号文章的音频化制作。中译语通公司已经成为一家领先的人工智能企业,先后承担多项国家级重大专项任务建设,机器翻译技术支持60个语种翻译和网页、音视频及文档等多模态数据的翻译与人机协同翻译应用;与商务印书馆等联合打造的图书防伪溯源体系,实现了区块链、大数据以及人工智能技术在传统图书出版领域的新实践应用。中译文娱依托AIGC视觉技术能力,实现对各类短视频平台、直播平台等视听内容的画面、语音、文本的分析和审核;利用文本生成图像、图像风格迁移等技术能力,高效实现不同主题、风格的书籍插图、封面设计。中图公司联合国内外28家头部出版企业,为图书馆等公共文化服务领域提供以虚实深度合成为核心技术的新型文化消费场景融合解决方案;结合人工智能数据处理、内容生成与智慧互动能力,形成互动型知识服务,拓宽了图书单一阅读形式。

下一步,中国出版集团将根植集团的内容优势禀赋,牢牢把握数字经济蓬勃发展机遇,加强对人工智能、大数据等前沿技术的研究,积极参与通用大数据和垂类大数据模型建设及应用,创新构建“连接+算力+能力”新型信息服务体系。利用数字技术创新内容产品形态和传播渠道,进一步推动新技术与传统出版业态融合,努力形成一个内容多种形态,一个创意多个产品的立体化格局,打造优质出版内容数据知识服务新模式。

努力在新时代用人工智能发展出版业新质生产力

一是从思想和行动上主动拥抱人工智能。历史上的每一次技术变革都推动着出版业的深度创新。据预测,2024年中国用生成式人工智能产生的短视频数量将会是2023年的1000倍,预示着人工智能技术将对相关企业产生“质”的重构。人工智能改变了出版业的生产方式,数据要素同实体要素、技术要素一起成为推动出版业高质量发展的三大关键要素动力。只有技术更新和思维变革同步,产业创新才能成为可能。出版人必须以更大的勇气、智慧,更独特的视角、思维,更科学的战略、方法去拥抱人工智能。

二是从体制和机制上激发内生动力。传统出版企业要学习现代科技企业在经营管理上的先进经验,用现代企业制度完善企业治理,用市场机制配置资源。坚持制度建设与企业改革协同推进,建立产权清晰、权责明确、管理科学的现代企业制度,健全权责法定、权责透明、协调运转、有效制衡的公司治理机制,用制度创新激活企业发展内生动能。

三是从资源、资本、技术上推动行业广泛合作。未来已来。人工智能与出版的融合发展需要全行业精诚协作、开放共赢。出版社的专业内容是大模型生成内容的科学性、专业性和准确性的重要基础,我们要秉承开放、平等、协作、快速、共享的互联网的核心精神,与产业链上下游、技术研究应用机构、资本资源方等展开深度合作,通过建立合理的利益分配机制,推动语料、数据、科技资源共享,推动行业对新技术的广泛应用。

责任编辑:李春燕

主办单位:中国出版集团有限公司 网站维护:中版集团数字传媒有限公司   京公网安备 11010102002203号 中国出版集团有限公司 2009,All Rights Reserved 京ICP备12053001号-1