基于量子-Transformer的伪造语音检测模型

doi:10.11772/ j.issn.1001-9081.2025101279

《计算机应用》唯一官方网站

• • 下一篇

基于量子-Transformer的伪造语音检测模型

宋子扬，昌燕^*，闫丽丽，赵银山，刘洪林，宋海权

成都信息工程大学网络空间安全学院(芯谷产业学院)，成都 610225

收稿日期:2025-11-03 修回日期:2026-01-22 接受日期:2026-02-11 发布日期:2026-03-12 出版日期:2026-03-12
通讯作者: 昌燕
基金资助:
国家自然科学基金项目.

Deepfake speech detection model based on quantum-Transformer

Received:2025-11-03 Revised:2026-01-22 Accepted:2026-02-11 Online:2026-03-12 Published:2026-03-12
Contact: CHANG Yan

摘要/Abstract

摘要： 语音伪造技术正在潜在威胁着人们的生活，目前市面上的经典伪造语音检测模型正面临着性能提升瓶颈、模型参数过多等问题。针对这些问题，本文提出一种基于量子-Transformer的伪造语音检测模型——量子安全语音模型(Quantum Security Speech Model,QSSM)模型。该模型使用参数化量子电路(Parameterized Quantum circuit,PQC)构建量子QKV映射模块以生成Query、Key和Value向量；通过Swap test实现特征向量间自注意力计算，利用PQC实现量子注意力池化以聚合上下文信息。实验结果表明，该量子-Transformer模型在伪造语音检测任务上的等错误率比RawNet2等经典模型下降0.5%~4.5%不等，与经典Transformer模型相比，参数量下降43%。该模型为资源受限环境下部署伪造语音检测方案提供了新的路径。

关键词: 关键词: 量子计算, 机器学习, 伪造语音, 注意力计算, 语音检测

Abstract: Voice forgery technology poses a potential threat to people's lives. Currently, classical fake speech detection models on the market face challenges such as performance improvement bottlenecks and excessive model parameters. To address these issues, a quantum‑Transformer based fake speech detection model—the Quantum Security Speech Model (QSSM)—was proposed. In this model, parameterized quantum circuits (PQC) were used to construct a quantum QKV mapping module for generating Query, Key, and Value vectors. The self‑attention computation between feature vectors was implemented via the Swap test, and quantum attention pooling based on PQC was employed to aggregate contextual information. Experimental results demonstrate that the quantum‑Transformer model reduces the equal error rate by 0.5% to 4.5% compared with classical models such as RawNet2 in fake speech detection tasks, while decreasing the parameter count by 43% relative to the classical Transformer model. This model provides a new pathway for deploying fake speech detection solutions in resource‑constrained environments.

Key words: quantum computing, machine learning, deepfake, attention module, Speech detection

中图分类号:

TN915.08

宋子扬昌燕闫丽丽赵银山刘洪林宋海权. 基于量子-Transformer的伪造语音检测模型[J]. 计算机应用, DOI: 10.11772/ j.issn.1001-9081.2025101279.

[1]	郗恩康, 范菁, 金亚东, 董华, 俞浩, 孙伊航. 联邦学习在隐私安全领域面临的威胁综述[J]. 《计算机应用》唯一官方网站, 2026, 46(3): 798-808.
[2]	梁永濠, 李金龙. 用于神经布尔可满足性问题求解器的新型消息传递网络[J]. 《计算机应用》唯一官方网站, 2025, 45(9): 2934-2940.
[3]	葛丽娜, 王明禹, 田蕾. 联邦学习的高效性研究综述[J]. 《计算机应用》唯一官方网站, 2025, 45(8): 2387-2398.
[4]	郭书剑, 余节约, 尹学松. 图正则化弹性网子空间聚类[J]. 《计算机应用》唯一官方网站, 2025, 45(5): 1464-1471.
[5]	朱俊屹, 常雷雷, 徐晓滨, 郝智勇, 于海跃, 姜江. 基于最小先验知识的自监督学习方法[J]. 《计算机应用》唯一官方网站, 2025, 45(4): 1035-1041.
[6]	洪梓榕, 包广清. 基于集成学习的雷达自动目标识别综述[J]. 《计算机应用》唯一官方网站, 2025, 45(2): 371-382.
[7]	王一铭, 李世源, 廖南清, 陈庆锋. 基于证据深度学习的不确定性感知无监督医学图像配准模型[J]. 《计算机应用》唯一官方网站, 2025, 45(10): 3371-3380.
[8]	尚游, 缪祥华. 面向生成式对抗网络的贝叶斯成员推理攻击[J]. 《计算机应用》唯一官方网站, 2025, 45(10): 3252-3258.
[9]	张嘉琳, 任庆桦, 毛启容. 利用全局-局部特征依赖的反欺骗说话人验证系统[J]. 《计算机应用》唯一官方网站, 2025, 45(1): 308-317.
[10]	陈学斌, 任志强, 张宏扬. 联邦学习中的安全威胁与防御措施综述[J]. 《计算机应用》唯一官方网站, 2024, 44(6): 1663-1672.
[11]	姚梓豪, 栗远明, 马自强, 李扬, 魏良根. 基于机器学习的多目标缓存侧信道攻击检测模型[J]. 《计算机应用》唯一官方网站, 2024, 44(6): 1862-1871.
[12]	佘维, 李阳, 钟李红, 孔德锋, 田钊. 基于改进实数编码遗传算法的神经网络超参数优化[J]. 《计算机应用》唯一官方网站, 2024, 44(3): 671-676.
[13]	郑毅, 廖存燚, 张天倩, 王骥, 刘守印. 面向城区的基于图去噪的小区级RSRP估计方法[J]. 《计算机应用》唯一官方网站, 2024, 44(3): 855-862.
[14]	李博, 黄建强, 黄东强, 王晓英. 基于异构平台的稀疏矩阵向量乘自适应计算优化[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3867-3875.
[15]	陈学斌, 屈昌盛. 面向联邦学习的后门攻击与防御综述[J]. 《计算机应用》唯一官方网站, 2024, 44(11): 3459-3469.

基于量子-Transformer的伪造语音检测模型

Deepfake speech detection model based on quantum-Transformer

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics