基于混合微粒群算法的说话人识别

计算机应用

• 智能感知与模式识别(Intelligence percepti • 上一篇下一篇

基于混合微粒群算法的说话人识别

许允喜陈方

湖州师范学院南京航天航空大学

收稿日期:2007-12-24 修回日期:2008-01-28 发布日期:2008-06-01 出版日期:2008-06-01
通讯作者: 许允喜

Speaker recognition based on hybrid particle swarm optimization algorithm

Xun-xi XU Fang CHENG

Received:2007-12-24 Revised:2008-01-28 Online:2008-06-01 Published:2008-06-01
Contact: Xun-xi XU

摘要/Abstract

摘要： 为了解决传统高斯混合模型(GMM)对初值敏感，在实际训练中极易得到局部最优参数的问题，提出了一种采用微粒群算法优化GMM参数的新方法。该方法将最大似然估计融入到微粒群算法迭代过程中，形成了新的混合算法。它利用微粒群算法的全局优化性及最大似然估计的局部寻优性求解高斯混合模型的参数，以提高参数精度。说话人辨认实验表明，与传统的方法相比，新方法可以得到更优的模型参数，使得系统的识别率进一步提高。

关键词: 说话人识别, 微粒群算法, 高斯混合模型

Abstract: The traditional training methods of Gaussian Mixture Model (GMM) are sensitive to the initial model parameters, which often leads to a local optimal parameter in practice. To resolve this problem, a new GMM optimization method was proposed based on Particle Swarm Optimization (PSO). It utilized Maximum Likelihood (ML) algorithm in the PSO iteration and provided a new architecture of hybrid algorithm. Because of the global optimization characteristic of the particle swarm optimizer method and the strong local searching capacity of ML, it can obtain model parameters with high precision. Experiment for text-independent speaker identification shows that this method can obtain more optimum GMM parameters and better results than the traditional method.

Key words: speaker identification, Particle Swarm Optimization (PSO), Gaussian Mixture Model (GMM)

许允喜陈方. 基于混合微粒群算法的说话人识别[J]. 计算机应用.

Xun-xi XU Fang CHENG. Speaker recognition based on hybrid particle swarm optimization algorithm[J]. Journal of Computer Applications.

[1]	陈聿, 田博今, 彭云竹, 廖勇. 联合手肘法和期望最大化的高斯混合聚类电力系统客户分群算法[J]. 计算机应用, 2020, 40(11): 3217-3223.
[2]	牛晓可, 黄伊鑫, 徐华兴, 蒋震阳. 基于听皮层神经元感受野的强噪声环境下说话人识别[J]. 计算机应用, 2020, 40(10): 3034-3040.
[3]	彭磊, 杨秀云, 张裕飞, 李光耀. 基于全局与局部相似性测度的非刚性点集配准[J]. 计算机应用, 2019, 39(10): 3028-3033.
[4]	林朗, 王让定, 严迪群, 李璨. 基于修正倒谱特征的回放语音检测算法[J]. 计算机应用, 2018, 38(6): 1648-1652.
[5]	喻新荣, 李志华, 闫成雨, 李双俐. 云数据中心高效的虚拟机整合方法[J]. 计算机应用, 2018, 38(2): 550-556.
[6]	陶志勇, 刘晓芳, 王和章. 融合密度峰值的高斯混合模型聚类算法[J]. 计算机应用, 2018, 38(12): 3433-3437.
[7]	陈文兵, 管正雄, 陈允杰. 基于条件生成式对抗网络的数据增强方法[J]. 计算机应用, 2018, 38(11): 3305-3311.
[8]	孙念, 张毅, 林海波, 黄超. 基于多特征i-vector的短语音说话人识别算法[J]. 计算机应用, 2018, 38(10): 2839-2843.
[9]	陈艳, 严腾, 宋俊芳, 宋焕生. 基于高斯混合模型和AdaBoost的夜间车辆检测[J]. 计算机应用, 2018, 38(1): 260-263.
[10]	黄亮, 潘平, 周超. 基于量子隧穿效应的说话人真伪鉴别方法[J]. 计算机应用, 2017, 37(9): 2617-2620.
[11]	马新军, 吴晨晨, 仲乾元, 李园园. 基于SIFT的说话人唇动识别[J]. 计算机应用, 2017, 37(9): 2694-2699.
[12]	李俊山, 杨亚威, 朱子江, 张姣. 基于自然图像块相似性和稀疏先验性的图像复原[J]. 计算机应用, 2017, 37(8): 2319-2323.
[13]	刘晙, 袁培燕, 李永锋. 基于完整可见性模型的改进鲁棒OctoMap[J]. 计算机应用, 2017, 37(5): 1445-1450.
[14]	张海艳, 高尚兵. 图像分割中改进空间约束贝叶斯网络模型的应用[J]. 计算机应用, 2017, 37(3): 823-826.
[15]	黄文娜, 彭亚雄, 贺松. 基于MAP+CMLLR的说话人识别中发声力度问题[J]. 计算机应用, 2017, 37(3): 906-910.

基于混合微粒群算法的说话人识别

Speaker recognition based on hybrid particle swarm optimization algorithm

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics