• • 下一篇
宋子扬,昌燕*,闫丽丽,赵银山,刘洪林,宋海权
摘要: 语音伪造技术正在潜在威胁着人们的生活,目前市面上的经典伪造语音检测模型正面临着性能提升瓶颈、模型参数过多等问题。针对这些问题,本文提出一种基于量子-Transformer的伪造语音检测模型——量子安全语音模型(Quantum Security Speech Model,QSSM)模型。该模型使用参数化量子电路(Parameterized Quantum circuit,PQC)构建量子QKV映射模块以生成Query、Key和Value向量;通过Swap test实现特征向量间自注意力计算,利用PQC实现量子注意力池化以聚合上下文信息。实验结果表明,该量子-Transformer模型在伪造语音检测任务上的等错误率比RawNet2等经典模型下降0.5%~4.5%不等,与经典Transformer模型相比,参数量下降43%。该模型为资源受限环境下部署伪造语音检测方案提供了新的路径。
中图分类号: