摘要: 针对传统的最大稳定极值区域(MSER)无法很好的提取低对比度图像的文本区域的问题,提出一种新的方法基于边缘增强的场景文本检测。根据先验知识可以知道图像边缘处的梯度值最大,因此利用方向梯度算子(HOG)获得图像中每个像素点的梯度信息,将方向梯度值与原图像进行相关运算就可以有效的增强图像的边缘信息,从而提高图像的对比度。原图像转换到灰度图像时会损失颜色信息,颜色空间包含了很多有价值的纹理信息。为了使改进后的MSER更好的发挥作用,采用在更符合人类视觉效果的HSI空间进行MSER,以此提取更多感兴趣的文本候选区域。其次,利用贝叶斯模型进行分类,主要采用笔画宽度、边缘梯度方向和拐角点三个特征剔除非字符区域。最后将筛选后的字符组合成文本行。在公共数据集ICDAR 2003和ICDAR 2013评估算法性能,实验结果表明,基于边缘增强的MSER方法能够更好的提取图像的文本区域,对于背景复杂和低对比度的场景图像有很好的鲁棒性和实时性,可以实现较高的召回率。
中图分类号: