%0 Journal Article %A 王誉天 %T 基于Bag-of-words和Hash编码的近似重复图像检测算法 %D 2013 %R 10.3724/SP.J.1087.2013.00667 %J 计算机应用 %P 667-669 %V 33 %N 03 %X 针对近似重复图像检测的传统算法存在检测效率和准确率不够高的缺点,提出了基于Bag-of-words和哈希编码的近似重复图像检测算法。该算法首先利用Bag-of-words把一幅图像表示成一个500维的特征向量; 然后,利用主成分分析(PCA)和尺度不变特征转换(SIFT)进行特征降维,并利用Hash编码技术对特征进行编码; 最后,利用动态距离度量技术实现近似重复图像的检测。实验结果表明,利用该算法进行近似重复图像检测是完全可行的,在准确度和查全率之间做到了较好的平衡,查准率可达90%~95%,查全率可达70%~80%。 %U http://www.joca.cn/CN/10.3724/SP.J.1087.2013.00667