计算机应用 ›› 2015, Vol. 35 ›› Issue (11): 3075-3078.DOI: 10.11772/j.issn.1001-9081.2015.11.3075

• 2015年全国开放式分布与并行计算学术年会(DPCS 2015)论文 • 上一篇    下一篇

基于图形处理器的可变形部件模型算法的并行化

刘宝平1, 陈庆奎1,2, 李金静1, 刘伯成1,2   

  1. 1. 上海理工大学 光电信息与计算机工程学院, 上海 200093;
    2. 上海理工大学 管理学院, 上海 200093
  • 收稿日期:2015-06-17 修回日期:2015-07-20 发布日期:2015-11-13
  • 通讯作者: 刘宝平(1990-),男,山东临沂人,硕士研究生,主要研究方向:并行计算、模式识别.
  • 作者简介:陈庆奎(1966-),男,上海人,教授,博士生导师,博士,CCF高级会员,主要研究方向:网络计算、并行计算、物联网; 李金静(1988-),女,山东滨州人,硕士研究生,主要研究方向:并行计算、模式识别; 刘伯成(1982-),男,福建福州人,博士研究生,主要研究方向:高性能计算、异构集群调度算法.
  • 基金资助:
    国家自然科学基金资助项目(60970012);高等学校博士学科点专项科研博导基金资助项目(20113120110008);上海重点科技攻关项目(14511107902);上海市工程中心建设项目(GCZX14014);上海智能家居大规模物联共性技术工程中心项目(GCZX14014);上海市一流学科建设项目(XTKX2012);沪江基金研究基地专项(C14001).

Parallelization of deformable part model algorithm based on graphics processing unit

LIU Baoping1, CHEN Qingkui1,2, LI Jinjing1, LIU Bocheng1,2   

  1. 1. College of Optical-Electrical and Computer Engineering, University of Shanghai for Science and Technology, Shanghai 200093, China;
    2. College of Management, University of Shanghai for Science and Technology, Shanghai 200093, China
  • Received:2015-06-17 Revised:2015-07-20 Published:2015-11-13

摘要: 目前目标识别领域,在人体检测中精确度最高的算法就是可变形部件模型(DPM)算法,针对DPM算法计算量大的缺点,提出了一种基于图形处理器(GPU)的并行化解决方法.采用GPU编程模型OpenCL,对DPM算法的整个算法的实现细节采用了并行化的思想进行重新设计实现,优化算法实现的内存模型和线程分配.通过对OpenCV库和采用GPU重新实现的程序进行对比,在保证了检测效果的前提下,使得算法的执行效率有了近8倍的提高.

关键词: 可变形部件模型, 图形处理器, OpenCL, 人体检测

Abstract: At present, in the field of target recognition, the highest accuracy algorithm is the Deformable Part Model (DPM) for human detection. Aiming at the disadvantage of large amount of calculation, a parallel solution method based on Graphics Processing Unit (GPU) was proposed. In this paper, with the GPU programming model of OpenCL, the details of the whole DPM algorithm were implemented by the parallel methods,and optimization of the memory model and threads allocation was made. Through the comparison of the OpenCV library and the GPU implementation, under the premise of ensuring the detection effect, the execution efficiency of the algorithm was increased by nearly 8 times.

Key words: Deformable Part Model (DPM), Graphics Processing Unit (GPU), OpenCL, human detection

中图分类号: