摘要: 摘 要: 针对现有卷积模型为主的反欺骗说话人验证方法捕获全局特征依赖不理想的问题,提出了一种利用全局-局部特征依赖的反欺骗说话人验证方法。首先,对于欺骗语音检测模块,设计两种滤波器组合方式对原始语音进行滤波,通过对频率子带的掩蔽实现样本扩充;其次,提出多维全局注意力机制,通过对信道维度、频率维度和时间维度分别进行池化,获得每个维度的全局依赖关系,将全局信息通过加权的方式与原始特征融合。最后,对于说话人验证部分,引入统计金字塔池化时延神经网络(SPD-TDNN),在获取多尺度时频特征的同时,计算特征的标准差,加入全局信息。结果表明,与集成时频图卷积模型(AASIST)相比,提出的欺骗语音检测方法在ASVspoof2019数据集上将等错误率降低了53%。与单独的金字塔池化说话人验证方法相比,提出的反欺骗说话人验证方法将等错误率降低了23个百分点。验证了所提方法借助全局特征依赖能够实现更好的分类效果。
中图分类号: