激话数据综合服务平台,给古书引入新的活力

激话数据综合服务平台,给古书引入新的活力 激话数据综合服务平台,给“养在闺阁”的古书引入新的活力

古书,即1912年以前通过印刻、抄录等方法所生产制造出版发行的书籍和参考文献,用于传承文明、普及教育及其记述历史时间,承重沉重的时间文化。有关数据统计表明,大家已经完成调查的270多万元部古书中,仅有7万多元部能够网上阅读文章,大量海量古书文化资源亟需智能化,这也是时下古书维护、承传与开启的主要问题之一。现阶段上海古籍出版社发布的“汇典·古书数据综合服务平台”造成业内关心,该服务平台汇聚上海市、长三角乃至更普遍地域出版社出版的高品质古书資源,运用全新电子光学识别文字(OCR)、自然语言理解、规模性语料库和人工神经网络标点符号等古书优化算法技术性,基本建设朝向中华传统文化与古书领域的专业知识综合服务平台。

“北方地区有中华书局‘籍合网’,南方地区有上海古籍出版社‘汇典’。”上海复旦大学公共图书馆副馆长、中华民族古书维护研究所政法委副书记医生杨光辉表明,古书智能化针对中华民族古代文明的承传、维护和运用有充分的推动作用,这一服务平台一方面可以把上海古籍出版社很多年累积上去的古书文化资源根据智能化的形式向大家普及化,另一方面还可以加快古书数据转换和发行的步骤,促进相对应出版发行产业链行业的信息化发展趋势。

历经数十年发展趋势的古书智能化之途任重而道远

《上海市全面推进城市数字化转型“十四五”规划》强调,要“推进文化艺术互联网大数据服务体系,推动文化资源智能化”,在媒体大结合、专业知识大融合的社会环境下,完成以电子信息技术促进传统文化的继承自主创新。古书智能化,是维护和合理安排古书的方位。上海复旦大学古籍整理研究室研究者石祥在接收记者采访时表示,“古书的‘用’和‘藏’中间是分歧的,谁都要来翻一翻,時间久了必定危害古书的维护”,而智能化以后,古书“母本”就无需冒着各种各样风险性“磨杆露臉”了。与此同时,“养在闺阁人未识”的古书可以在智能化以后摆脱“闺阁”,并不受時间、地区限定达到大量阅读者的浏览要求,完成一对多、点正对面、虚对实的转变。

从“将实体书变成扫描版”的“收集侧”到“将扫描版变成文字版”的“生产制造侧”,再到“将文字版变成古书研学旅行系统软件”的“运用侧”,古书智能化步骤并不繁杂。在数十年历史时间进步中,有两个分界点。其一是上世纪80时代,美国华裔专家学者陈炳藻明确提出用计算机统计分析《红楼梦》的词语,电子信息技术和历史人文科学研究慢慢逐渐融合。其二是1999年,被称作“大中型汉语电子出版工程项目的楷模书”文渊阁《四库全书》PDF面世。

2022-03-10

2022-03-10