发布时间:2024-09-02
2024年7月4日,世界人工智能大会在上海开幕。在众多前沿技术展示中,一款AI古籍修复模型引起了广泛关注。这款由合合信息旗下扫描全能王携手华南理工大学团队共同研发的模型,展示了如何利用人工智能技术对古籍文献进行数字化修复。
AI古籍修复模型的核心技术包括图像修复、文字识别与重建、版面还原等。在图像修复方面,模型利用计算机视觉和图像处理技术,可以对古籍的模糊、污损或部分缺失的图像进行还原。文字识别与重建则结合了自然语言处理和光学字符识别(OCR)技术,能够自动识别和转换古籍中的文字,并根据上下文推断缺失或模糊的内容。版面还原技术则通过机器学习算法学习已知古籍的版式规律,尝试恢复缺失部分的版面结构。
在大会现场,AI古籍修复模型展示了对敦煌遗书的修复效果。敦煌遗书是敦煌莫高窟藏经洞出土的公元4至11世纪的古写本及印本的统称,被誉为“中国中古时代的百科全书”。由于年代久远,大量文献页面存在不同程度的残损。AI古籍修复模型通过字形修补、褪色修复、背景补全等方式,成功完成了数字化修复。以《汉书·刑法志》节选章节为例,修复后的残卷第一次以完整的姿态呈现,为研究汉代司法制度和司法实践提供了宝贵资料。
AI古籍修复技术的意义不仅在于解决了古籍保护中的难题,更重要的是为传统文化的传承开辟了新的途径。通过数字化修复,可以有效防止古籍内容的进一步流失,为学术研究提供更完整、准确的资料。同时,数字化的形式也使得古籍内容更容易被大众接触和理解,有助于传统文化的普及和传承。
展望未来,AI古籍修复技术还有很大的发展空间。合合信息展台工作人员表示,他们将继续提升模型的精度和效率,希望联通更多专业的文献研究机构及技术专家,共同推动中国传统文化与现代科技的融合创新。随着技术的不断进步,我们有理由相信,越来越多珍贵的古籍将得以“重生”,为后人展现中华文明的璀璨光芒。