%0 Journal Article
%A 陈黎飞
%A 杨天鹏
%T 基于概率模型的非均匀数据聚类算法
%D 2018
%R 10.11772/j.issn.1001-9081.2018020375
%J 计算机应用
%P 2844-2849
%V 38
%N 10
%X 针对传统K-means型算法的"均匀效应"问题,提出一种基于概率模型的聚类算法。首先,提出一个描述非均匀数据簇的高斯混合分布模型,该模型允许数据集中同时包含密度和大小存在差异的簇;其次,推导了非均匀数据聚类的目标优化函数,并定义了优化该函数的期望最大化(EM)型聚类算法。分析结果表明,所提算法可以进行非均匀数据的软子空间聚类。最后,在合成数据集与实际数据集上进行的实验结果表明,所提算法有较高的聚类精度,与现有K-means型算法及基于欠抽样的算法相比,所提算法获得了5%~50%的精度提升。
%U http://www.joca.cn/CN/10.11772/j.issn.1001-9081.2018020375