古籍数字化后,从深闺走向公众的智慧传承之路
在春茶上市的时节,读者只需"一键"操作,便能品味满城茶香。一部手机,扫描平台二维码,从茶文化文献智能互动体验,到茶文化新书免费阅读,再到线上下单、免费邮寄到家服务……这是刚刚结束的第九届数字中国建设峰会上,福建省图书馆依托"八闽书房"智慧阅读平台推出的地方文献智慧化便民服务之一。
读者通过扫描福建省图书馆海丝文献AR(增强现实)明信片,感受"一纸跨越古今"的交互式文化体验。
在智慧图书馆体系建设与古籍数字化工程推进的背景下,数字化、智能化技术正以前所未有的速度融入古籍保护与传播的深层脉络,引发了业界对数字阅读与传统阅读融合路径的新思考。
一、古籍走出"深闺":技术赋能的百年探索
1.1 数字化浪潮的历史脉络
文献资料的扫描(图形文件)应用,为广大读者提供了更多、更丰富、有价值的文献资料。然而,图形文件保留了原文件的风貌,但其占用空间大,不可检索,在编辑、修改、加工等方面显露了不足。而OCR技术的成熟应用,则弥补了这一领域的不足。
早在2001年,我国就已实现图书、档案、文献资料数字化的先进技术——OCR数字化加工系统。该系统是为实现海量图书、档案、文献资料数字化而研制的实用数字化加工系统,它可以对海量信息资源进行加工、存储、检索、传输和利用,是信息化基础建设的重要手段。
随着计算机技术的应用普及,互联网的长足发展,大批历史文献资料开发应用的需求不断增长。古籍数字化从最初的扫描存储,到如今的智能识别、知识图谱构建,经历了从"纸质到数字"到"数字到智能"的跨越式发展。
1.2 福建省图书馆的先行探索
福建省图书馆是这场探索的先行者之一。其推出的"八闽书房"智慧阅读平台,依托AI大语言模型、智能体、数字人等数智技术,深度盘活福建地方特色文献资源。
此前,该馆还以馆藏海丝古籍《瀛涯胜览》为核心,搭建了海丝文化专属大语言模型,开发出AR(增强现实)明信片、"AI+裸眼3D"视频、"瀛涯奇航"手游等系列产品。"AI与古籍深度融合,并非稀释文脉,而是深度挖掘古籍历史文化内涵与时代价值,构建古今对话、虚实交融的新型古籍传播和知识服务场景"。
北京师范大学发布"AI太炎2.0"大语言模型,旨在致敬国学大师章太炎,助力古汉语研究。该模型由国家语委重大项目"古籍整理智能化关键技术研究"研发,专用于古汉语文本理解,具备词义注释、文白翻译、句读标点、用典分析等功能,兼容繁简中文输入。AI太炎2.0在古籍整理、辞书编纂和语言研究等方面具有广泛应用潜力。
1.3 全国古籍数字化的蓬勃开展
2025年1月,由国家古籍保护中心指导,陕西省图书馆(陕西省古籍保护中心)主办的2025古籍数字化与活化利用经验交流活动在西安市举办。本次活动以"AI驱动古籍创新利用"为主题,与会代表们围绕古籍活化利用、传播推广等方面的创新做法和实践成果进行了深入交流与探讨。
2025年度古籍数字化与活化利用会议以"AI驱动古籍创新利用"为主题,来自全国24个省市自治区的公共图书馆、大学图书馆、古籍存藏单位的代表们围绕人工智能时代下数字化与活化利用、古籍传播推广等方面的创新做法和实践成果进行了深入交流与探讨。
国家古籍保护中心与陕西图书馆举办交流活动,征集100余个古籍数字化案例。
二、技术路线的多元化探索
2.1 人工智能大模型的三大应用场景
人工智能大模型在古籍整理出版领域主要有专业领域服务场景、学术知识服务场景、大众开放服务场景三大应用场景。以"荀子""AI太炎"等为代表的古籍整理出版领域人工智能大模型的发布和应用,不仅意味着人工智能大模型正朝着专业垂直细分领域发展。
同时,人工智能大模型正朝着专业垂直细分领域发展,为贯通古籍整理出版上、中、下游各环节,加速古籍智慧化转型升级提供重要机遇。AI太炎2.0的准确率在古籍整理中具有突破性表现,在句读任务中准确率分别达到诗99%、词95%、古文92%。
2.2 多模态技术的深度融合
多模态生成式人工智能能够同时理解和处理文本、图像、音频和视频数据,使研究者得以跨越单一媒介的限制。在古籍文献修复与解读方面,多模态融合技术展现出显著优势。敦煌写本研究项目通过红外成像与深度学习模型的结合,实现了对褪色文字的高精度识别与恢复,同时准确还原了纸张材质、墨迹特征等物质性信息,为写本年代判定提供了多元证据。
语音与文本的跨模态交互则在古代语言研究中发挥重要作用,研究人员基于音韵学知识与声学模型构建了《广韵》等韵书的发音复原系统,通过多模态特征分析揭示了唐宋时期音变规律的复杂性。
2.3 湖北省图书馆的VR古籍体验
湖北省图书馆的探索同样值得关注。在这里,观众戴上VR设备便可"穿越"至古代宴席场景,身临其境地体验投壶游戏中的礼仪规则、投壶技巧,感受古人互动的生动情境。
了解到,该馆已完成2000余部110余万筒子叶的古籍数字化加工,对古籍的版本、作者、年代、地域等信息进行了详细标注。同时利用知识图谱技术,构建起跨书籍的人物、事物、地域、事件关联网络,将分散的古籍信息整合为结构化知识体系,为读者提供一站式古籍服务。
湖北省博物馆在2025年启动人工智能应用研讨会,推出原创科技应用项目,包括"曾侯乙尊盘三维数字化复原"项目入选互联网大会案例集。
2.4 南京图书馆的"食光机"项目
在江苏南京图书馆,"食光机"古籍活化项目让古籍里的菜谱从故纸堆走入了寻常百姓的餐桌。"我们从馆藏古籍中挖掘古代食谱,通过线上展示与线下体验相结合的方式,让典籍中的饮食文化'活'起来"。
这一项目去年荣获国际图联图书馆国际营销奖特别提名奖,是当届所有获奖项目中唯一的古籍活化类项目。此外,该馆还公开发布了江苏省古籍数字化资源集成平台,实现馆内千万页级、馆外400万页级的免费古籍全文影像阅览服务。
三、守护古籍内核:从"技术秀"到"文化根脉"
3.1 "数字热"背后的冷思考
"数字热"持续升温,许多图书馆人则进行着"冷思考":技术加持下,古籍数字化的"内核"须进一步巩固。这一担忧并非空穴来风。采访中,记者观察到部分地区的古籍数字化存在"重呈现、轻阐释""重感官、轻思辨"的倾向。
观众在体验后,对古籍本身的文本价值、历史意义知之甚少,留下的更多是感官层面的浅层记忆。"AI时代的快节奏碎片化阅读,容易消解读者对原著原典的敬畏与耐心"。
3.2 版本意识与技术研究的深度融合
古籍数字化工作必须高度重视版本意识,不能将其视作"从零到一"的技术工程,而应充分吸纳传统阅读和学术研究的既有成果。"古籍数字化开发利用,必须把技术开发和学术研究两支队伍、两个行业深度融合,以提供品质保障"。
研究表明,人工智能在古籍整理出版领域面临资源和技術两大难题。建议通过多方协作解决资源问题,加强行业规范以应对技术挑战。
古籍图像的水印保护技术也需同步完善。数字化古籍图像水印嵌入流程从"密钥"和"载体图像"作为输入,经"水印生成过程"生成水印信号,随后通过"水印嵌入"操作将水印嵌入到载体图像中。整个过程体现了高度安全性和鲁棒性设计,通过多重加密与变换机制,确保水印在古籍图像中不易被检测或移除。
3.3 公众服务的核心命题
北京大学教授、文化和旅游部北京大学研究基地(公共文化)主任李国新则从公众服务的角度切入问题核心。他认为,制约古籍资源为大众服务的障碍主要是古今语言体系的不同。
不能要求现代人都学好古代汉语再利用古籍资源,而应基于许多现代人不熟悉古汉语的现实,破解古籍资源的大众化利用难题。在他看来,目前最迫切需要解决的问题,是为普通读者"读懂"古籍搭建起获取内容的入口和通道,重点解决古籍检索系统的检索词古今对照和相互关联的问题。
这需要统筹规划、多学科合作、"大兵团"协同。公共图书馆以服务社会大众为主要任务,在推动古籍资源的大众化利用方面承担着特殊的责任。应发挥整体优势,破解这一难题。
四、融合路径:数字阅读与传统阅读的共生
4.1 智慧图书馆服务的发展趋势
公共图书馆数字资源服务创新应构建数字中台,深挖数据价值,打造智慧化的数字中枢。加强技术赋能,推进图书馆服务智慧化转型。革新运营模式,打造线上线下融合、上下游协同的资源服务新生态。
公共图书馆需要把握数字化、网络化、智能化发展机遇,创新服务内容和手段,将资源服务转换为知识服务,加快推进公共图书馆的智慧化转型。在人工智能时代,图书馆在空间形态、信息技术、知识载体快速迭代的浪潮中,应坚守"三个无可替代":图书馆保障全民平等获取知识的社会价值无可替代;专业馆员在公共服务与创新中的角色无可替代;图书馆支撑终身学习、全民阅读的功能无可替代。
4.2 生成式AI带来的范式转型
生成式AI正推动图书馆从"数字化"跃迁至"数智化"。理念上,资源建设由经验判识转化为AI驱动,知识组织借助语义网络实现动态关联,参考咨询升级为实时Agent服务。
技术层面,AI融合XR打造沉浸式元宇宙图书馆,使其从"资源仓库"变身"知识助理"与"创新孵化器"。面对伦理与幻觉风险,图书馆需开放而审慎。馆员亦将转型为兼具科技与人文素养的"智慧设计师"。
生成式AI浪潮下,图书馆应克服技术焦虑,理性评估AI的"辅助"而非"替代"角色,聚焦其在馆藏活化、采编优化等核心业务中的战略价值。需以使命导向遴选技术,防范盲从与资源错配,强化批判思维与AI素养教育,巩固知识中枢地位,拓展普惠与深度服务。
4.3 阅读推广的核心目标
阅读推广现已发展成为图书馆的主流服务。体现图书馆核心价值的阅读推广的最终目标是通过阅读提升公民素养,使不爱阅读的人爱上阅读,使不会阅读的人学会阅读,使阅读有困难的人跨越阅读的障碍。
五、未来展望:技术与人性的平衡之道
5.1 跨模态检索与关联分析的新机遇
跨模态检索与关联分析技术为古籍整理与文物研究建立了新型知识发现机制。传统碑刻拓片研究往往依赖研究者的经验与记忆,难以系统化处理大量文献与图像资料之间的对应关系。
多模态检索系统通过深度神经网络建立了拓片图像与相关文献记载的语义关联,使研究者能够基于视觉特征检索文献记载,或根据文本描述定位相关图像资料。DeepSeek推出的Janus Pro等视觉语言模型通过解耦视觉编码路径,将视觉信息处理分为多个独立通道,大幅提升了对复杂文化遗产的理解与生成能力。
5.2 大模型在历史与社会模拟中的应用
宏观层面上,大模型模拟历史与社会变迁的能力为社会科学提供了新的实验工具。Hua等人将研究视角扩展到宏观历史事件,通过大语言模型模拟了第一次世界大战、第二次世界大战和中国古代战国时期的国家决策与后果。在这些模拟中,每个基于大语言模型的智能体代表一个国家或一国领导人,被编程模仿其历史行为、策略和决策模式。
5.3 构建古籍活化利用的长效机制
古籍资源如何在"活"起来之后真正"入心",这仍是数字阅读与传统阅读相结合的重要课题,也是古籍资源活化利用需要持续回答的命题。
AI将改变信息获取方式,同时也将赋能采购、标引、古籍数字化与参考咨询,未来图书馆将在变革中更强大。AI技术正以前所未有的深度和广度重塑图书馆,挑战与机遇并存。图书馆人应主动学习AI知识,提高服务效率;勇于革除旧业务、探索新应用。以智慧引导AI与馆藏、服务深度融合,防范幻觉风险。以耐心推进智能化建设的长期进程。
六、让千年智慧在数字时代延续
古籍保护从纸页延伸到云端,是科技对文明的虔诚备份。数字化扫描仪每一次快门的轻响,都是历史与未来的对话。
技术路线对比
技术路线 | 特点 | 适用场景 | 准确率 |
OCR数字化加工系统 | 成熟稳定、技术完善 | 批量文字识别 | 95%以上 |
多模态大模型 | 理解能力强、容错高 | 复杂版面识别 | 85%-95% |
AI太炎2.0模型 | 专业古文识别 | 古汉语文本处理 | 92%-99% |
多模态融合技术 | 图文音结合 | 写本研究、文献复原 | 90%以上 |
知识图谱构建 | 跨文献关联 | 结构化知识体系 | 依赖人工标注 |

在古籍数字化迈向“深水区”的今天,单纯的技术堆砌已无法满足行业对“高质量”与“深内涵”的双重追求。真正的数字化转型,需要的是对业务逻辑的深刻洞察与对技术路径的精准把控。
正如古籍保护需要“版本意识”与“学术支撑”,企业的数字化升级同样需要专业的伙伴同行。广州米图信息科技有限公司,专注于为企业提供定制化的数字化解决方案,我们不仅懂技术,更懂业务。
- 上一篇:图书馆OCR数字化做到95%准确率,背后的复杂链路AI智能体
- 下一篇:没有了


