基于前后向语言模型的语音识别词图生成算法

计算机应用 ›› 2010, Vol. 30 ›› Issue (10): 2563-2566.

• 人工智能 • 下一篇

基于前后向语言模型的语音识别词图生成算法

李伟¹,吴及²,吕萍²

1. 清华大学电子工程系
2.

收稿日期:2010-04-14 修回日期:2010-06-22 发布日期:2010-09-21 出版日期:2010-10-01
通讯作者: 李伟

Speech recognition lattice-generating algorithm with forward-backward language model

Received:2010-04-14 Revised:2010-06-22 Online:2010-09-21 Published:2010-10-01

摘要/Abstract

摘要： 为了克服语音识别中单遍解码词图生成算法速度较慢的缺点，提出一种基于前后向语言模型的两遍快速解码算法。两遍解码分别采用前向与后向语言模型,同时通过优化以减少前后向语言模型不匹配对识别结果造成的影响。实验证明，该算法在保持识别准确率的基础上有效地提升了解码速度。

关键词: 语音识别, 词图, 语言模型, 两遍解码, 后向扩展

Abstract: In order to lighten the heavy computational burden of one-pass lattice-generating algorithms for speech recognition, a fast two-pass decoding algorithm was proposed on the basis of the forward-backward language model. The forward and backward language models were applied to the first and second decoding processes separately. Furthermore, some optimization rules were given to reduce the impact of language model mismatch and to avoid its side-effects on recognition results. The experimental results show that this algorithm quickens the decoding process without decreasing the recognition accurate rate.

Key words: speech recognition, lattice, language model, tow-pass decoding, backward extension

中图分类号:

李伟吴及吕萍. 基于前后向语言模型的语音识别词图生成算法[J]. 计算机应用, 2010, 30(10): 2563-2566.

[1]	吴相岚, 肖洋, 刘梦莹, 刘明铭. 基于语义增强模式链接的Text-to-SQL模型[J]. 《计算机应用》唯一官方网站, 2024, 44(9): 2689-2695.
[2]	孙焕良, 王思懿, 刘俊岭, 许景科. 社交媒体数据中水灾事件求助信息提取模型[J]. 《计算机应用》唯一官方网站, 2024, 44(8): 2437-2445.
[3]	魏超, 陈艳平, 王凯, 秦永彬, 黄瑞章. 基于掩码提示与门控记忆网络校准的关系抽取方法[J]. 《计算机应用》唯一官方网站, 2024, 44(6): 1713-1719.
[4]	徐月梅, 胡玲, 赵佳艺, 杜宛泽, 王文清. 大语言模型的技术应用前景与风险挑战[J]. 《计算机应用》唯一官方网站, 2024, 44(6): 1655-1662.
[5]	赖华, 孙童, 王文君, 余正涛, 高盛祥, 董凌. 多模态特征的越南语语音识别文本标点恢复[J]. 《计算机应用》唯一官方网站, 2024, 44(2): 418-423.
[6]	姜雨杉, 张仰森. 大语言模型驱动的立场感知事实核查[J]. 《计算机应用》唯一官方网站, 2024, 44(10): 3067-3073.
[7]	黄梦林, 段磊, 张袁昊, 王培妍, 李仁昊. 基于Prompt学习的无监督关系抽取模型[J]. 《计算机应用》唯一官方网站, 2023, 43(7): 2010-2016.
[8]	高建清, 屠彦辉, 马峰, 付中华. 基于渐进比率掩蔽目标的自适应噪声估计方法[J]. 《计算机应用》唯一官方网站, 2023, 43(4): 1303-1308.
[9]	高永兵, 高军甜, 马蓉, 杨立东. 用户粒度级的个性化社交文本生成模型[J]. 《计算机应用》唯一官方网站, 2023, 43(4): 1021-1028.
[10]	刘聪, 万根顺, 高建清, 付中华. 基于韵律特征辅助的端到端语音识别方法[J]. 《计算机应用》唯一官方网站, 2023, 43(2): 380-384.
[11]	许亮, 张春, 张宁, 田雪涛. 融合多Prompt模板的零样本关系抽取模型[J]. 《计算机应用》唯一官方网站, 2023, 43(12): 3668-3675.
[12]	黄诚, 赵倩锐. 基于语言模型词嵌入和注意力机制的敏感信息检测方法[J]. 《计算机应用》唯一官方网站, 2022, 42(7): 2009-2014.
[13]	江静, 陈渝, 孙界平, 琚生根. 融合后验概率校准训练的文本分类算法[J]. 《计算机应用》唯一官方网站, 2022, 42(6): 1789-1795.
[14]	张海丰, 曾诚, 潘列, 郝儒松, 温超东, 何鹏. 结合BERT和特征投影网络的新闻主题文本分类方法[J]. 《计算机应用》唯一官方网站, 2022, 42(4): 1116-1124.
[15]	师夏阳, 张风远, 袁嘉琪, 黄敏. 基于多语BERT的无监督攻击性言论检测[J]. 《计算机应用》唯一官方网站, 2022, 42(11): 3379-3385.

基于前后向语言模型的语音识别词图生成算法

Speech recognition lattice-generating algorithm with forward-backward language model

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics