当前位置:首页 > 资讯中心 > 最新资讯

【文化】科技神器助攻,让古籍活起来

日期:2022年04月27日

以下文章来源于文化产业观察,作者南星


文献古籍,一字一页蕴涵着中国绵延千年的璀璨文化和精神财富,承载着中华文明绵延五千年的脉络。但“世间好物不坚牢,彩云易散琉璃脆”,尽管多年来古籍得到储存与保护,也出现了易破损、利用价值低等问题。因此,如何让中华传统古籍得到传承与延续,并以大众喜闻乐见的形式打开,成为近年来古籍研究者的重要难题。

 


 

数字化时代的到来和科技的进步,使得古籍保护与利用得到了新的解法。诚然,人工智能技术的发展带来了古籍整理研究新的方法和思路的根本性的改变。那么,古籍修复遇上人工智能,擦出了怎样的火花呢?今天我们带你走进绵延千年的古籍世界,探寻其未来的发展之路。

 


一、古籍文本保护走向智能化


近年来,国家大力鼓励和支持中华古籍的传承与修复,《“十四五”文化和旅游发展规划》指出,需统筹推进古籍普查登记、保护修复、数字化建设、整理出版和宣传等工作;在今年,“古籍保护利用”也首次被写入政府工作报告,参加全国两会的不少代表委员也纷纷赞同,表示对古籍的保护利用将对传承和弘扬中华优秀传统文化起到强有力的推动作用。

 


 

但就目前古籍发展现状来看,我国古籍文物面临难以检索、利用率低、以文本形式进行数字化的古籍数量少等问题。在由北京大学数字人文研究中心、北京大学-字节跳动人文开放实验室、北京大学人工智能研究院联合主办的“古籍智能信息处理”系列研讨会上,北京大学数字人文研究中心主任王军表示,我国现存的古籍约有20万种,其中数字化扫描影像的有8万种,而实现文本数字化的仅有3万到4万种,且从1949年到2019年,共修复整理出版了近38000种,按此计算,我们可能需要两三百年的时间才能将现存古籍全部修复整理出来,但利用人工智能辅助整理,大概二三十年可以完成,人工智能技术将大大提高古籍修复效率。

 

图片来源:大儒谱社

 

,多年来我国一直将其作为古籍保护的主要形式;二是再生性保护,指对古籍进行影印再造、数字化或缩微化,让古籍影像和文本以纸本、数字或缩微胶片的形式存在,便于保存或传播;三是传承性保护,借助于人,通过人这一载体将古籍里的知识、内涵、故事传承下去。

 

图片来源:新华每日电讯

 

“在这三种保护中,科技发挥着重要的作用”。国家图书馆副馆长张志清表示,“在原生性保护方面,当我们开始修复一本古籍前,可以通过科技手段进行检测,对纸墨的各种物理、生化性能等进行检测,找到最好的修复方法和材料,采取最好的修复手段,降低对原件的损害”。

 

在再生性保护方面,即使将古籍进行数字化或缩微化,让古籍和文本以数字或者缩微胶片的形式存在,古籍最后也只是刻板的被储存,不便于人们使用。北京大学中文系教授杨海峥举了个例子:影印出来的古籍没有标点符号,首先不便于阅读,其次也不利于高效率的检索古籍内容,只能通过逐篇逐页逐字阅读原文,获取需要寻找的信息。

 

(缩微胶片数字化工序之一:制作缩微胶片分组卷)

 

传承性保护借助于人,利用人的大脑进行储存,但艾宾浩斯遗忘曲线告诉我们,人的记忆储存空间是有限的,不可能将流传下来的众多古籍完整地记忆下来。因此,要提升传统古籍的利用率,必须将古籍内容转化为数字文本,借助科技的力量将古籍数字化和活化。

 

图片来源:新华每日电讯

 

通过AI技术,实现古籍数字化检索和数字化解读,带给古籍修复及整理革命性的变化。近年来不少高校、古籍修复研究者在古籍数字化进行了多次开拓性的探索,比如利用OCR(光学字符识别)对纸本古籍一扫,古籍中的内容便会通过计算机最后生成 相应的数字文档。

 

图片来源:新华每日电讯

 

据了解,通过人工智能和大数据技术,已能实现从先秦时期到明清时期古籍文本语料的自动句读,且平均准确率达到94%,书名、地名、时代名和官职名自动识别准确率接近98%。

 

总的来说,古籍数字化将近一步提升古籍整理的准确率、完整度及开放度。不仅可以满足专家学者对重点文本精确度的要求;也能将学者、古籍研究者和古籍爱好者联系在一起,利用智能平台上的文字识别和校对工具,进行线上一站式整理古籍,提高古籍整理的效率。

 


二、古籍智能化仍面临挑战


古籍智能化将成为古籍修复的重要发展趋势,且已经取得重大进展,但也因存在以下问题,保护和修复工作仍然急迫。

 

 

其一是修复工序复杂,耗时长,时间成本高。古籍修复工序复杂,包括有建立档案、交接及拆书、制糊及染料、配纸及染纸、清洗书叶、蒸揭书叶、书叶修补、……等多道工序,修复时间长。

 

Step1:首先建立修复档案,扫描每一页的内容,建立图像和文字档案

 

Step2:拆书、揭页及编号:用“干揭”、“湿揭”、“蒸揭”等手法粘连书籍。

 

Step3:手工修补破洞

 

Step4:干燥处理

 

Step5:压平处理

 

Step6: 装订成册: 包括搓纸捻钉、理齐、打眼、穿纸捻钉

 

最终成果

 

所需工具数量众多,高倍放大镜、弯刀、喷笔、毛笔、尺子、针锥、刷子、钉板、真丝线……,五花八门,每一种都缺一不可,发挥着各自的作用,而古籍修复不可能每个步骤都借助科技且要求精细,造成所需时间成本高。

 

 

其二是花费资金大,资金匮乏。国家古籍保护中心办公室副研究馆员赵文友做过一个估算,如果将全国目前尚未数字化的40万版本的古籍全部数字化,采集、组织、储存、加工及管理等费用大概需要60亿元。但国家古籍保护中心每年用于古籍数字化工作的经费却不足1000万元,地方性图书馆的古籍数字化经费更是捉襟见肘。

 

图片来源:新华每日电讯

 

其三是技术要求高,修复难度大。目前现有的数字化很多是由缩微胶片转换而成,呈黑白影像且分辨率低,难以满足读者易于阅读的需求。同时将现存的千万册古籍全部数字化也是一个漫长且艰难的过程。

 

图片来源:新华每日电讯

 


三、古籍未来如何活化


“要解决这些问题,我认为需要政府、收藏机构和学术机构以及更多的社会力量共同参与,大家整合资源、资金、技术等方面的要素形成合力。”国家图书馆副馆长、国家古籍保护中心副主任张志清说道。

 

北京大学数字人文研究中心主任王军也认为,古籍实现数字化需要更多社会力量的加入。互联网公司本身具有一定的古籍修复经验和技术支撑,OCR技术在今日头条、字幕翻译以及行业文档识别等领域均有广泛应用,有效的推进了古籍修复数字化进程。

 

同时,北大教育基金会全面支持古籍修复工作,开发新的古籍数字化研究平台,并调动国内外的相关力量,致力于三年内完成一本基本涵盖儒家、道家和佛家核心要义的智能化整理工作。

 

图片来源:新华每日电讯

 

古籍数字化,需要掌握专业的古典文献知识及较高的人工智能技术,因此,随着人工智能技术在古籍修复整理领域的广泛应用,全新的交叉学科领域将被开辟,培养更多的复合型人才。


王军也认为,在古籍数字化的趋势下,高校古典文献学等相关专业如何培养兼具技术与学术能力的古典文献学人才,如何形成多学科交叉的课程体系,将是近年亟需解决的难题。


目前,业内在古籍文物修复工作达到共识,利用人工智能进行古籍修复整理需要跨学科、跨环境、跨平台、跨文化合作,也需要更多的社会机构支持及社会各界的共同努力。

 

 

四、结语

 

对古籍的修复、整理、保护和有效利用,是对中华文脉和传统文化的传承。古籍与科技的碰撞,将重新激活古籍中的文脉精华,赋予其崭新的时代价值与意义,让优质的古籍内容和优秀传统文化触及到更多的读者,散发出更耀眼的光芒。

 



排版:小Q

文章来源:文化产业观察

版权均归原作自己所有,未有商用意图,仅做分享交流