基于笔画相关加权的视频图像文字识别

doi:10.3724/SP.J.1087.2012.02305

计算机应用 ›› 2012, Vol. 32 ›› Issue (08): 2305-2312.DOI: 10.3724/SP.J.1087.2012.02305

基于笔画相关加权的视频图像文字识别

苏畅¹,²,胡晓冬²,王斌辅²,尚凤军²

1. 美国康奈尔大学计算机系，纽约州伊萨卡市 14853，美国
2. 重庆邮电大学计算机科学与技术学院，重庆 40065

收稿日期:2011-11-14 修回日期:2012-01-09 发布日期:2012-08-28 出版日期:2012-08-01
通讯作者: 胡晓冬
作者简介:苏畅(1979-),女,辽宁鞍山人,副教授,博士,主要研究方向:无线传感器网络通信协议、物联网;
胡晓冬(1986-),男,河南新密人,硕士研究生,主要研究方向:图像处理、文字识别;
王斌辅(1990-)男,河南漯河人,主要研究方向：图像处理;
尚凤军(1972-),男,内蒙古宁城人,副教授,博士,主要研究方向:移动IPv6、无线传感网络。
基金资助:
重庆市教委科学技术研究项目(KJ110504);重庆市科委自然科学基金资助项目(2009BB2081);教育部留学回国人员科研启动基金资助项目(教外司留[2010]1174)

Video image character recognition based on stroke-related weight

SU Chang¹,²,HU Xiao-dong¹,WANG Bin-fu¹,SHANG Feng-jun¹

1. College of Computer Science and Technology, Chongqing University of Posts and Telecommunications, Chongqing 400065, China
2. Department of Computer Science, Cornell University, Ithaca, NY, 14853, USA

Received:2011-11-14 Revised:2012-01-09 Online:2012-08-28 Published:2012-08-01
Contact: HU Xiao-dong

摘要/Abstract

摘要： 为了提取影视视频图像中的字幕信息，提出一套鲁棒的方法：首先采用图像的边缘特征对字幕信息进行区域定位，并给出结合边缘信息的方法对图像文字进行二值化；其次，采用投影法和区域生成方法定位单个文字；最后，充分考虑到文字笔画的拓扑结构，进行相邻子网格笔画结构相关性的判定，并采用笔画模糊隶属度完成弹性网格特征的提取。该方法在复杂的背景图像中能够有效得到文字的二值图像，并保证了提取特征的稳定性、健壮性，对二值化后的影视字幕的识别率达到92.1%，实验结果表明了方法的有效性。

关键词: 视频图像, 文字识别, 文本定位, 二值化, 子网格特征, 笔画相关性

Abstract: In order to extract the subtitle in the video image, a robust method was proposed. First, the image edge feature was adopted in caption location step, and the binarization method of text images with the edge information was given. Then, the method combined with projection and regional generation was used to locate a character. Finally, taking fully account of the topology of the text strokes, the stroke correlation among the adjacent sub-grids was determined and the stroke fuzzy membership was used to complete the elastic grid feature extraction. This method can effectively get the binary image of characters from a complex background image, ensure the stability and robustness in feature extraction. The experimental results show the method is effective, and its recognition rate has been up to 92.1%.

Key words: video image, character recognition, text location, binarization, sub-grid feature, stroke correlation

中图分类号:

TP391.41

苏畅胡晓冬王斌辅尚凤军. 基于笔画相关加权的视频图像文字识别[J]. 计算机应用, 2012, 32(08): 2305-2312.

SU Chang HU Xiao-dong WANG Bin-fu SHANG Feng-jun. Video image character recognition based on stroke-related weight[J]. Journal of Computer Applications, 2012, 32(08): 2305-2312.

[1]	张一飞, 李新福, 田学东. 基于图像分割的立体匹配算法[J]. 计算机应用, 2020, 40(5): 1415-1420.
[2]	张洁玉. 基于图像分块的局部阈值二值化方法[J]. 计算机应用, 2017, 37(3): 827-831.
[3]	张矿, 朱远平. 基于超像素融合的文本分割[J]. 计算机应用, 2016, 36(12): 3418-3422.
[4]	杜丙新. 基于相对定向和小区域融合的视频图像拼接[J]. 计算机应用, 2015, 35(1): 220-223.
[5]	向荣周慧娟. 基于Gabor特征与BP神经网络的屏幕显示自动校验系统[J]. 计算机应用, 2013, 33(05): 1463-1466.
[6]	李智慧范铁生唐春鸽刘磊. 具有层次素描纹理的素描画绘制方法[J]. 计算机应用, 2012, 32(10): 2851-2854.
[7]	周理毕笃彦查宇飞罗宏凯何林远. 弱边缘电荷耦合器件羊毛图像二值化算法[J]. 计算机应用, 2012, 32(04): 1133-1136.
[8]	张鹏钟俊郭安明彭强. 设备监控图像预处理算法改进及其FPGA实现[J]. 计算机应用, 2011, 31(06): 1706-1708.
[9]	翟乃强. 改进的中国象棋棋盘识别方法[J]. 计算机应用, 2010, 30(4): 980-981.
[10]	常丹华苗丹何耘娴. 图谱理论在文本图像二值化算法中的应用[J]. 计算机应用, 2010, 30(10): 2802-2804.
[11]	赵星阳孙继银. 一种可抗二值化攻击的文本图像可见水印算法[J]. 计算机应用, 2009, 29(1): 165-167.
[12]	刘琼周慧灿王耀南. 基于亮度分级和方向密度的无监督文本定位[J]. 计算机应用, 2008, 28(6): 1523-1526.
[13]	杨鸿雁刘正光. 基于指纹方向图的模糊二值化算法研究[J]. 计算机应用, 2008, 28(4): 999-1000.
[14]	廖开阳张学东章明珠潘晓红. 结合方向信息的指纹二值化及后处理算法[J]. 计算机应用, 2008, 28(4): 1001-1005.
[15]	赵磊陈琼陈中. 一种新的改进OPTA细化算法[J]. 计算机应用, 2008, 28(10): 2639-2642.

基于笔画相关加权的视频图像文字识别

Video image character recognition based on stroke-related weight

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics