《计算机应用》唯一官方网站 ›› 2023, Vol. 43 ›› Issue (2): 374-379.DOI: 10.11772/j.issn.1001-9081.2021122043
所属专题: 人工智能
汪洋1, 傅洪亮1, 陶华伟1(), 杨静1, 谢跃2, 赵力3
Yang WANG1, Hongliang FU1, Huawei TAO1(), Jing YANG1, Yue XIE2, Li ZHAO3
摘要:
域自适应算法被广泛应用于跨库语音情感识别中;然而,许多域自适应算法在追求减小域差异的同时,丧失了目标域样本的鉴别性,导致其以高密度的形式存在于模型决策边界处,降低了模型的性能。基于此,提出一种基于决策边界优化域自适应(DBODA)的跨库语音情感识别方法。首先利用卷积神经网络进行特征处理,随后将特征送入最大化核范数及均值差异(MNMD)模块,在减小域间差异的同时,最大化目标域情感预测概率矩阵的核范数,从而提升目标域样本的鉴别性并优化决策边界。在以Berlin、eNTERFACE和CASIA语音库为基准库设立的六组跨库实验中,所提方法的平均识别精度领先于其他算法1.68~11.01个百分点,说明所提模型有效降低了决策边界的样本密度,提升了预测的准确性。
中图分类号: