基于HTK的语音识别的并行化研究与实现

计算机应用

基于HTK的语音识别的并行化研究与实现

刘勇进史晓东

福建厦门大学信息科学与技术学院计算机科学系

收稿日期:2008-10-10 修回日期:2008-12-08 发布日期:2009-04-01 出版日期:2009-04-01
通讯作者: 刘勇进

Research and implementation of parallel speech recognition based on HTK

Yong-jin LIU Xiao-dong SHI

Received:2008-10-10 Revised:2008-12-08 Online:2009-04-01 Published:2009-04-01
Contact: Yong-jin LIU

摘要/Abstract

摘要： 详细地分析了语音识别的过程，给出了相应的算法描述，并分析了语音识别并行化的可能性。将并行计算的思想应用于语音识别的算法中，使用多线程技术，并引入避免竞争条件的机制，在多核计算机上并行地计算HMM模型节点的似然率，从而得到语音识别的并行化算法。分析了该并行化算法的性能，同时在语音识别工具包HTK 3.4上实现了这种并行化算法。基于WSJ0语料库的实验结果表明该并行化算法在不影响识别结果的前提下能够有效地提高语音识别的实时性能。

关键词: 多核, HTK, 并行计算, 语音识别

Abstract: After comprehensively analyzing the process of speech recognition and depicting its corresponding algorithm, the feasibility of the parallelism in the algorithm was analyzed. The parallel computing concept and the multi-threading technology were applied in the algorithm of speech recognition, and a protection mechanism was introduced to avoid the occurring race condition during the computing of likelihood of Hidden Markov Model (HMM) on multi-core computer. Then the parallel algorithm for speech recognition was proposed and its performance was also evaluated. The experiments on WSJ0 corpora demonstrate that the implementation of parallel algorithm which was realized in HTK 3.4 toolkit can greatly improve the real-time performance of speech recognition without affecting the results of recognition.

Key words: multi-core, Hidden Markov Modelling Tookit (HTK), parallel computing, speech recognition

中图分类号:

TP391.42

刘勇进史晓东 . 基于HTK的语音识别的并行化研究与实现[J]. 计算机应用.

Yong-jin LIU Xiao-dong SHI . Research and implementation of parallel speech recognition based on HTK[J]. Journal of Computer Applications.

[1]	高建清, 屠彦辉, 马峰, 付中华. 基于渐进比率掩蔽目标的自适应噪声估计方法[J]. 《计算机应用》唯一官方网站, 2023, 43(4): 1303-1308.
[2]	刘聪, 万根顺, 高建清, 付中华. 基于韵律特征辅助的端到端语音识别方法[J]. 《计算机应用》唯一官方网站, 2023, 43(2): 380-384.
[3]	姜松岩, 廖晓鹃, 陈光柱. 基于可满足性模理论的多处理机通信延迟优化任务调度方法[J]. 《计算机应用》唯一官方网站, 2023, 43(1): 185-191.
[4]	蔡婧雯, 韦永壮, 刘争红. 基于GPU的密码S盒代数性质评估方法[J]. 《计算机应用》唯一官方网站, 2022, 42(9): 2750-2756.
[5]	祁祥洲, 邢红杰. 基于中心核对齐的多核单类支持向量机[J]. 《计算机应用》唯一官方网站, 2022, 42(2): 349-356.
[6]	邱鑫源, 叶泽聪, 崔翛龙, 高志强. 联邦学习通信开销研究综述[J]. 《计算机应用》唯一官方网站, 2022, 42(2): 333-342.
[7]	徐启迪, 刘争红, 郑霖. 基于GPU的低密度奇偶校验码译码加速技术[J]. 《计算机应用》唯一官方网站, 2022, 42(12): 3841-3846.
[8]	柏财通, 崔翛龙, 郑会吉, 李爱. 基于自监督知识迁移的鲁棒性语音识别技术[J]. 《计算机应用》唯一官方网站, 2022, 42(10): 3217-3223.
[9]	杨悦, 王士同. 基于随机特征映射的四层多核学习方法[J]. 《计算机应用》唯一官方网站, 2022, 42(1): 16-25.
[10]	孟慧玲, 王耀彬, 李凌, 杨洋, 王欣夷, 刘志勤. TACLeBench中内核程序循环级推测并行性分析[J]. 计算机应用, 2021, 41(9): 2652-2657.
[11]	安鑫, 杨海娇, 李建华, 任福继. 热安全约束下异构多核系统动态映射方法[J]. 计算机应用, 2021, 41(9): 2631-2638.
[12]	解文博, 韦永壮, 刘争红. 基于CUDA的SKINNY加密算法并行实现与分析[J]. 计算机应用, 2021, 41(4): 1136-1141.
[13]	杨先凤, 贵红军, 傅春常. 统一计算设备架构下的F-X域预测滤波并行算法[J]. 计算机应用, 2021, 41(2): 486-491.
[14]	王梅, 许传海, 刘勇. 基于神经正切核的多核学习方法[J]. 《计算机应用》唯一官方网站, 2021, 41(12): 3462-3467.
[15]	雷皓云, 任珍文, 汪彦龙, 薛爽, 李浩然. 基于上界单纯形投影图张量学习的多核聚类算法[J]. 《计算机应用》唯一官方网站, 2021, 41(12): 3468-3474.