%0 Journal Article %A 侯云舒 %A 蒋东梅 %A 蒋晓悦 %A 吕国云 %A 赵荣椿 %T 基于动态贝叶斯网络的音视频连续语音识别和音素切分 %D 2007 %R %J 计算机应用 %P 1670-1673 %V 27 %N 7 %X 构造了两个单流单音素的动态贝叶斯网络(DBN)模型,以实现基于音频和视频特征的连续语音识别,并在描述词和对应音素具体关系的基础上,实现对音素的时间切分。实验结果表明,在基于音频特征的识别率方面:在低信噪比(0~15dB)时,DBN模型的识别率比HMM模型平均高12.79%;而纯净语音下,基于DBN模型的音素时间切分结果和三音素HMM模型的切分结果很接近。对基于视频特征的语音识别,DBN模型的识别率比HMM识别率高2.47%。实验最后还分析了音视频数据音素时间切分的异步关系,为基于多流DBN模型的音视频连续语音识别和确定音频和视频的异步关系奠定了基础。 %U http://www.joca.cn/CN/abstract/article_10249.shtml