《计算机应用》唯一官方网站 ›› 2025, Vol. 45 ›› Issue (12): 3813-3819.DOI: 10.11772/j.issn.1001-9081.2024121815
岳峰1,2,3, 彭洋1,4, 苏兆品1,2,4, 张国富1,3,4, 廉晨思3,5, 杨波3,5, 方振1,4
Feng YUE1,2,3, Yang PENG1,4, Zhaopin SU1,2,4, Guofu ZHANG1,3,4, Chensi LIAN3,5, Bo YANG3,5, Zhen FANG1,4
摘要:
基于手机语音的多媒体取证任务一直都是研究热点,然而已有语音手机识别任务均局限于闭集模式,即训练集与测试集共享相同的类别集合,无法保证未知类别手机的识别精度,所以现有方法无法直接应用于未知手机。为此,提出一种基于特征交互与表示增强的语音手机来源开集识别方法(FireOSCI)。首先,设计基于多头注意力模块Fastformer的全局特征提取模块GlobalBlock,以更好地捕捉整个语音样本的全局信息,获得丰富的设备特征信息;其次,设计基于SE-Res2Block(Squeeze-Excitation Res2Block)的局部特征提取模块LocalBlocks,专注于增强跟手机信息相关的特征,抑制与手机来源识别无关的特征;随后,设计基于注意力机制的特征融合机制,将全局特征和多层局部特征深度融合;最后,设计基于注意力池化的手机来源确认网络,以提高开集模式下的识别准确率。在13个不同手机品牌、86种不同型号的手机语音数据集上的对比实验结果表明,所提方法可以实现未知类别手机的识别,为语音手机来源的开集识别提供可参考的技术方案。
中图分类号: