广州米图信息科技有限公司 > 新闻资讯 > 行业动态 >

古籍书刊扫描仪推动档案数字化

发布:2022-04-29 11:15 点击:0

       当下在数字转型背景下,利用高清度古籍书刊扫描仪把珍贵纸质档案数字化成为档案信息化、数字化、数据化建设的重要基石。珍贵纸质档案虽然都以纸张为主要载体,但在文本上存在印刷与手写之分,与前者相比,手写档案往往因字迹潦草难以辨识、书写准确率不可控(如存在繁体字、异形字)等原因,对光学字符识别(OCR)的准确率造成影响,需耗费大量的时间和精力进行人工比对核准,一定程度上制约了古籍书刊扫描仪数字化工作的效率。

       档案工作实践需求驱动着将高精度古籍书刊扫描仪和​人工智能技术应用于手写档案数字化工作的探索。例如,2016年,中国第一历史档案馆与相关技术公司合作开展 “满文档案图像识别软件的开发与应用项目”课题研究,研发的软件“满文识别通”能够对满文档案图像进行自动识别,识别结果自动转换成拉丁字母转写。虽然人工智能技术在手写档案数字化中的应用已经得到一定程度的重视,但是无论是开展试点或验收的项目数量还是相关工作开展的实际成效,都仍存在较大的提升空间。部分学者提及在其参与的相关课题研究中,卷积神经网络对于左右结构的字体和粘连的字体分割效果并不理想,手写体文本识别的准确率仍然有待提升。
       在国际上,梵蒂冈秘密档案馆(Vatican Secret Archives,VSA)主导的In Codice Ratio项目(http://www.inf.uniroma3.it/db/icr/)​以其丰富的历史档案馆馆藏资源支撑、高精度古籍书刊扫描仪和​先进的人工智能技术应用、创新的字符分割方式、系统化的软件平台设计与良好的字符识别效果,成为高精度
古籍书刊扫描仪和​人工智能技术助力珍贵历史档案数字化的典型案例。该项目的成功实施为历史研究人员提供更便捷、高效的检索服务。​