• • 下一篇
陈荟慧1,孙洪韬1,关柏良1,衡中青2
CHEN
Huihui1, SUN Hongtao1, GUAN Boliang1, HENG
Zhongqin2
摘要: 古籍汉字检索是当前古籍数字化工作的一部分。古籍版面中通常存在汉字印刷字模不一致和字体种类多的现象,使用视觉特征实现汉字检索是有效的解决方案。为此,提出汉字特征提取编码网络(CFEENet)。首先,使用卷积神经网络提取古籍汉字图像的视觉特征;然后,使用可训练的通用向量聚合描述层NetVLAD聚合视觉特征并编码;最后,使用余弦相似度计算编码相似性以实现古籍版面汉字检索。使用t分布邻域嵌入对CFEENet编码降维后可视化分析,发现编码形成的簇密度高、簇间重叠小、编码分辨率高。在多个古籍数据集上测试CFEENet,实验结果表明,CFEENet在大多数场景下的平均精度均值(mAP)和F1分数优于古籍汉字图像特征提取网络(ACCINet)等对比方法,且在检索质量与效率之间实现良好平衡,验证了CFEENet在古籍汉字检索任务中的适用性与有效性。
中图分类号: