DPCS2017+15+一种基于CNN的翻录语音检测算法

• •

DPCS2017+15+一种基于CNN的翻录语音检测算法

李璨¹,王让定²,严迪群³

1. 宁波大学信息科学与工程学院
2. 宁波大学信息科学与工程学院
3. 宁波大学

收稿日期:2017-08-01 修回日期:2017-08-20 发布日期:2017-08-20
通讯作者: 李璨

DPCS2017+15+Recaptured voice replay detection based on convolutional neural network

Received:2017-08-01 Revised:2017-08-20 Online:2017-08-20
Contact: Can LI

摘要/Abstract

摘要： 随着高保真度、便携式录音设备的普及，使得翻录语音与原始语音具有较高的相似性，常被不法分子用于对说话人认证系统进行攻击，以达到非法认证的目的，危害了合法用户的权益。为改善识别系统此类安全问题，则必须防止翻录语音的成功闯入。通过提取原始语音与翻录语音的语谱图，并将其输入到卷积神经网络中，提出了一种基于Convolutional Neural Network (CNN)的翻录语音检测方法。搭建了适应于检测翻录语音的网络框架，分析讨论了输入不同窗移的语谱图对检测率的影响，对不同偷录及回放设备的翻录语音进行了交叉实验检测，并与现有的经典算法进行了对比。实验结果表明，该方法能够准确地判断待测语音是否为翻录语音，其检测率达到了99.26%，且性能优于现有算法。

关键词: 卷积神经网络, 翻录语音检测, 语谱图, 录音设备, 网络框架

Abstract: With the popularity of portable and high-fidelity recording devices, the high similarity between the recaptured voice and the original voice may be utilized for attack the speaker verification system illegally by the criminals, which harms the legitimate interests of the system user.In order to improve the ability of resisting this attack, this paper proposes a CNN-based algorithm of detecting recaptured speeches by using spectrogram of the voice. For the detection task, a novel network structure is constructed, and the effect of the spectrograms with different window shifts are discussed.In addition, the cross-over experiments for various eavesdropping and replay devices are construct in this paper.Experimental results demonstrate that the proposed method can accurately discriminate whether the recording voice is recaptured or not. The detection rate achieves 99.26%, and furthermore is higher than of the state-of-the-art methods.

Key words: convolutional neural network(CNN), recapture voice detection, spectrogram, recording devices, network structure

中图分类号:

TP391

李璨王让定严迪群. DPCS2017+15+一种基于CNN的翻录语音检测算法[J]. 计算机应用.

[1]	董永峰, 白佳明, 王利琴, 王旭. 融合先验知识和字形特征的中文命名实体识别[J]. 《计算机应用》唯一官方网站, 2024, 44(3): 702-708.
[2]	侯瑞峰, 张鹏程, 张丽媛, 桂志国, 刘祎, 张浩文, 王书斌. 基于全变分正则项展开的迭代去噪网络[J]. 《计算机应用》唯一官方网站, 2024, 44(3): 916-921.
[3]	周景贤, 李希娜. 基于改进卷积神经网络和射频指纹的无人机检测与识别[J]. 《计算机应用》唯一官方网站, 2024, 44(3): 876-882.
[4]	王星, 刘贵娟, 陈志豪. 高斯混合模型与文本图卷积网络结合的虚假评论识别算法[J]. 《计算机应用》唯一官方网站, 2024, 44(2): 360-368.
[5]	荆智文, 张屿佳, 孙伯廷, 郭浩. 二阶段孪生图卷积神经网络推荐算法[J]. 《计算机应用》唯一官方网站, 2024, 44(2): 469-476.
[6]	张睿, 宋思琪, 胡静, 张永梅, 柴艳峰. 基于统计和自适应ParNet的产学研绩效评价[J]. 《计算机应用》唯一官方网站, 2024, 44(2): 628-637.
[7]	张家伟, 高冠东, 肖珂, 宋胜尊. 基于改进分层注意网络和TextCNN联合建模的暴力犯罪分级算法[J]. 《计算机应用》唯一官方网站, 2024, 44(2): 403-410.
[8]	高芸芸, 赵腊生, 张强. 基于双向长短时记忆和卷积Transformer的声学词嵌入模型[J]. 《计算机应用》唯一官方网站, 2024, 44(1): 123-128.
[9]	陈豪, 夏振平, 程成, 林李兴, 张博文. 基于Transformer-CNN的轻量级图像超分辨率重建网络[J]. 《计算机应用》唯一官方网站, 2024, 44(1): 292-299.
[10]	郭晓, 陈艳平, 唐瑞雪, 黄瑞章, 秦永彬. 融合行为词的罪名预测多任务学习模型[J]. 《计算机应用》唯一官方网站, 2024, 44(1): 159-166.
[11]	张秋余, 温永旺. 用于语音检索的三联体深度哈希方法[J]. 《计算机应用》唯一官方网站, 2023, 43(9): 2910-2918.
[12]	尚绍法, 蒋林, 李远成, 朱筠. 异构平台下卷积神经网络推理模型自适应划分和调度方法[J]. 《计算机应用》唯一官方网站, 2023, 43(9): 2828-2835.
[13]	路琨婷, 费蓉蓉, 张选德. 融合卷积神经网络的遥感图像全色锐化[J]. 《计算机应用》唯一官方网站, 2023, 43(9): 2963-2969.
[14]	李豆豆, 李汪根, 夏义春, 束阳, 高坤. 基于特征交互与自适应融合的骨骼动作识别[J]. 《计算机应用》唯一官方网站, 2023, 43(8): 2581-2587.
[15]	秦源源, 张鸿. 基于注意力特征金字塔网络的肺结节检测算法[J]. 《计算机应用》唯一官方网站, 2023, 43(7): 2311-2318.