出版社数字编辑系统管见

 

本文刊载于《科技与出版》2016年第11期P57-59。如果您喜欢,欢迎订购我刊。邮发代号:82-655尽管...



本文刊载于《科技与出版》2016年第11期

P57-59。如果您喜欢,欢迎订购我刊。

邮发代号:82-655


尽管当下国内大部分出版社的主要营收仍来自传统纸本,但面对已然来临的数字化时代,出版业态变革已经拉开大幕。数字化出版,从战略部署到战术操作,已成为各出版社最具活力、也最富挑战性的工作。

数字化出版提高了内容的生产效率,丰富了内容的表现力,拓展了内容的传播广度和深度。数字化出版,首要任务是对内容的数字化处置。建构数字编辑系统,是出版社数字化发展的基础性工作。

优质,是出版社所提供内容的最大亮点,显著区别于现有网络信息。作为内容生产的技术支撑平台,出版社数字编辑系统在理念上有自身的定位,架构及功能上有一定的特征。总体来说,在顶层设计上要考虑支撑“八性”,并在总架构子系统和核心技术构成上加以具象化地展开。
1 “八性”
“八性”即权威性、专业性、丰富性、时效性、便利性、互动性、协同性、扩展性。出版社数字编辑系统在架构和功能上要支撑以上“八性”,这是内容创新与科技创新相融合的逻辑结果,也是数字化环境下出版社参与竞争、持续发展的必然要求。
-1.1-
权威性


如今,网络写作发布平台、网络信息服务公司如雨后春笋,比比皆是,网络信息铺天盖地。相比于互联网上以自助编写、问答、大数据挖掘推送等方式提供的信息和知识服务,出版社提供的数字化内容应该具有更高的权威性。权威性是出版社在数字化时代的制胜法宝。权威性的内涵是内容的准确性,以及作者和出版者的水准、知名度、美誉度等。为此,数字编辑系统需要构建相应的技术、功能、标准,对内容的来源、生成进行严格的监控、监管;遴选权威专家,并对应邀专家的专业、资历、学术成果、所撰知识内容及其参考文献等进行纪录、备案、查询和管理。同时,编辑加工和各层级审核的流程、工具、监控等,都是编辑系统应着重考虑的。
-1.2-
专业性


专业性有两层含义。首先,专业水准。目前网络大多提供的是信息服务,出版社以知识提供和服务为主,读者具有相应的文化程度,两者在内容上有很大区别。人类古往今来的知识,涵盖了哲学、社会科学、文学艺术、文化教育、自然科学、工程技术等学科领域,无论是综合性出版社还是专业出版社,数字化出版所提供内容应具有专业水准,这是题中之意。其次,专业领域。这也是出版社进入网络竞争的必然选择。目前网络信息已成汪洋大海,新的技术还在以惊人的速度每天催生大量新信息,内容几乎无所不包,几乎没有查不到的东西。出版社不可能拼数量,也不可能涉及所有领域。走专业化道路,在专业领域深耕细作,做到极致,做出特色,是理智的选择。出版社的编辑系统,针对自身的专业领域,在架构、基础库、标准、工具集等方面,都应有相对应的设计。
-1.3-
丰富性


过去的年代,阅读内容以文字为主,随着摄影、计算机,以及人们视线的扩展,社会开始进入读图时代。而当今,随着技术迅猛发展,不仅文字、图片,音频、视频也成为重要的元素,成为阅读和学习的有机组成部分,2016 年是VR元年,随着VR、AR的切入,可以想象,将随之大量涌入的虚拟现实和增强现实所带来的观感冲击将是前所未有的,也势必在阅读、学习领域掀起新的追捧。总之,当今时代,网民的阅读趣味、对知识的学习和解读,已进入了多维、立体、要素多元、形式新颖的时代。出版社编辑系统要充分考虑这一时代特点,跟踪技术发展,在富媒体的采集、制作、合作、集成、适配、管理等方面有所规划和设计。
-1.4-
便利性


便利性当然是针对用户而言的。编辑系统的使用者首先是编辑,对编辑人员要具有便利性。设计时首先考虑的问题并不单纯是技术,而是要考虑具体需要解决什么问题,是否方便编辑使用,能否尽量简化操作和工作量等,确定这些后,再考虑用哪些方法和技术来实现这个系统。在过往的案例中,由于编辑系统在操作层面过于复杂,导致编辑人员难以上手、最终不了了之的大有所在。其次,就是须观照数字化阅读的便利性特点,数字编辑系统须设计灵活的分类、索引、标签、关联等功能,需要支持多维的知识组织模态、内容呈现的丰富性,以及多媒体、各类参考资料等的关联、链接等,以尽可能满足读者需求。便利性是当下网络信息服务的显著特征和优势,已经具有很高专业水准。出版社数字编辑系统应该大力借鉴、狠下功夫。
-1.5-
时效性


科技的飞速进步,拓展了人类认知世界的广度和深度,知识呈现爆炸式增长,知识更新的频率越来越快。数字编辑系统需要全面展现相应领域的知识,并及时发现新的知识点,快速、快捷地扩展、补充新的知识,还需要对过时的、以偏概全的错误的知识及时进行甄别、更新、修改甚至淘汰。编辑系统可采用各种数据加工技术,将已有知识内容进行结构化处理,形成存量知识库;同时,采用各种实用的内容获取和发现工具,追踪新信息新知识来源,快速抓取和整理,不断扩充增量知识内容,还可采用有针对性的统计、分析、比对、校验等技术,进行知识淘汰和更新。
-1.6-
互动性


自由、开放、互动,用户至上,是互联网的基本精神和规则,也是数字化出版蓬勃发展的助燃剂。目前,以网络为平台,以各种方式吸引、激励读者、用户直接参与和互动,是互联网机构推动知识生产、信息聚合的主要方面,也是异于传统出版的最显著特征。其实,广大用户的参与,其评价、增补、修订甚至质疑、勘误,对出版社的内容建设都具有积极意义。出版社要想参与数字化出版,就要在出版观念、思维模式、生产方式上大胆突破。可为用户设计互动操作,如评论、收藏、转发等,还应设计方便用户对内容进行直接创作和更新的通道。同时,对互动方式下参与编辑的网民进行基于实名的严格身份认证,明确责任;建立以专家和编辑即时审读核校系统和机制,确保相关内容的准确。
-1.7-
协同性


协同的本质是增效。指两种或两种以上的独立部分相加或调配在一起,所产生的作用大于各独立部分单独应用时作用的总和。在出版过程,尤其在数字化出版过程中,作者、编者、各种资源、各个系统存在着相互影响的关系,可能是配合和协作关系,也可能是干扰和制约关系。而协同是有效利用资源的方式,可使整体利益最大化。所以,出版社数字编辑系统,还应该是一个工作协同系统。设计中可考虑由工作流、权限、角色三个要素决定任务的分配。任务可以划分多个部分(如文字编辑、图像处理、视频处理等),可以由独立用户进行、完成,该用户也可以采用求助、共享等方式让其他人参与。有争议可以团队讨论,由团队负责人评判。协同过程需要配备特殊的审核机制,全过程监控,纪录各版本编写信息,可进行版本回溯操作、不同版本的对比、保留所有版本的修改痕迹等。
-1.8-
扩展性


在中国,数字出版在出版社的萌动,始于20世纪90 年代,将数字技术应用于如创作、编辑加工、印刷复制等某些环节。随着技术的发展,出版社又先后试水录音带、录像带、CD、VCD、DVD、电子图书、数字杂志等新型数字出版物,以及互联网、计算机、MP3 播放器、MP4 播放器、手机等承载出版内容的新型载体,当今,又跨入了全面应用数字技术,改变编辑模式和经营模式的阶段。这20 多年的时间中,出版社在数字系统的构建上交了不少学费,有许多教训可寻。比如,技术和平台的“短命”,每上新的出版项目便开始新一轮系统开发,不断重复建设等。针对这些情况,如今在构建出版社数字编辑系统时,扩展性必定成为重要的设计要求。这就需要将当下需求、企业战略和路径,以及技术发展的趋势结合起来,统筹考虑。

技术的发展速度和应用范围,超出了人们的预期,超出了以往任何时代。对出版社来讲,高新技术的发展和应用,不仅仅是提高出版效率的问题,可能导致编辑的角色、任务都会发生变化。目前互联网巨头都声称在研究机器学习。前不久google的AlphaGo下围棋战胜了李世石,就是一个很经典的机器学习案例。而机器学习技术在出版上的应用具有广泛的前景。如大数据时代海量信息的提取,这些信息有用,但同时又是非结构化的文本。过去提取这些有用信息需要用户手动地写正则表达式(regular expression),但通常写正则表达式是复杂、费事又费力的工作。而现在,机器学习技术已经可以达到系统智能生成最有效的正则表达式,这将极大地便利用户提取有用信息,也将极大地方便知识的提取和生产。这些新技术的产生和应用,有可能推动出版社升级专注于内容分析、认定、深度加工,以及知识的多样化、个性化、柔性化服务,其余的一些工作可由计算机软件,如智能正则系统等完成。

总之,在出版社数字编辑系统的设计和构建中,预见性、迭代式、扩展性(灵活性)必须予以充分重视。比如,总体架构上,系统要方便维护,升级上有特殊设置;数据量突然增多时,能否可快速扩展现有系统;未来系统如果扩展和在新类型数据加入时,当前设计是否也可随之拓展等。
2   问 题
围绕“八性”,数字编辑系统具体要解决的问题包括业务、资源、管理、发展四个层面。它由一系列关联子系统构成。核心有基于协同工作的编辑子系统、基础数据加工子系统、多媒体与三维内容制作子系统、知识内容加工子系统,流程管理子系统,以及编纂工具集与接口管理子系统等。

然而,严格意义上普世的数字编辑系统可能不存在。对于不同的专业领域,不同的应用场景,也许最核心的技术、最本质的算法类似,但是要对不同的应用做优化和个性化。比如流程、节点、分布式的处理、运行时间、云上部署等。

出版社数字编辑系统的建设,理论上只是解决内容及编辑加工,而事实上,内容要能够被阅读,知识要实现服务,还需有数字化的发布平台和运营平台,同时,以市场为导向的发布方式和运营模式,也会对内容样态、对编辑加工的环节和流程产生影响。从这个角度上看,编辑系统和发布平台、运营平台是一个整体,密不可分,互为制约。

另外,在出版社数字编辑平台的建设中,从出版社的角度看,还存在上线前数据处理的门槛,下线后数据与排版对接,造字、字库等麻烦,但最大、最令人头痛的问题是建设过程中需求变化很大造成的困顿,从顶层设计、目标、架构到具体环节,对需求的诉求,开始可能是大而化之、语焉不详,施工过程中则摇摆不定、朝令夕改;而技术公司的问题是,对出版社的业务缺乏深入了解,缺乏真正适配出版业的架构师,加之,出版社和技术公司人员处于不同的语言体系中,沟通起来相当困难,参与各方时不时会有对牛弹琴、无所适从、效率低下、无可奈何的烦恼。

这个问题从根本上讲还是人的问题。数字编辑系统的建构,急需复合型编辑人才和技术人才,既熟悉出版流程和规律,也了解数字化阅读特点和趋势、了解数字化技术发展和应用现状及趋势。而复合型人才的培养、获得,将是出版社决胜数字出版的关键所在。
作者简介

龚莉

中国大百科全书出版社,100037,北京


    关注 科技与出版


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册