《计算机应用》唯一官方网站 ›› 2025, Vol. 45 ›› Issue (12): 3864-3871.DOI: 10.11772/j.issn.1001-9081.2024121792
Jun ZENG1,2, Yinghua TONG1,2(
), Defang WANG1,2
摘要:
随着多维数据特征的复杂性不断增加,现有的异常检测方法在捕捉特征分布方面表现出局限性,同时传统的聚类和统计方法在参数选择上遇到了更大的挑战,这些共同导致了检测性能的提升受到限制。针对上述问题,提出一种基于累积概率波动和自动化聚类的异常检测方法。首先,计算特征的累积概率波动以表征特征的高斯混合分布,并根据累积概率波动值对特征进行压缩变换;其次,在基于密度的噪声应用空间聚类(DBSCAN)中利用深度强化学习寻找最优聚类参数,并对压缩变换后的数据集进行聚类;最后,综合数据的聚类结果与数据特征的累积概率波动值判断数据点是否异常。实验结果表明,所提方法在6个实验数据集上的平均精确率、召回率、F1分数和受试者工作特征曲线下面积(AUC)相较于对比方法中表现最好的方法分别提升了36.39%、2.73%、14.90%和4.84%。可见,所提方法在无需手动选择参数的情况下,有效提高了对多维复杂特征数据异常检测的综合性能。
中图分类号: