%0 Journal Article %A 陈黎飞 %A 杨天鹏 %T 基于概率模型的非均匀数据聚类算法 %D 2018 %R 10.11772/j.issn.1001-9081.2018020375 %J 计算机应用 %P 2844-2849 %V 38 %N 10 %X 针对传统K-means型算法的"均匀效应"问题,提出一种基于概率模型的聚类算法。首先,提出一个描述非均匀数据簇的高斯混合分布模型,该模型允许数据集中同时包含密度和大小存在差异的簇;其次,推导了非均匀数据聚类的目标优化函数,并定义了优化该函数的期望最大化(EM)型聚类算法。分析结果表明,所提算法可以进行非均匀数据的软子空间聚类。最后,在合成数据集与实际数据集上进行的实验结果表明,所提算法有较高的聚类精度,与现有K-means型算法及基于欠抽样的算法相比,所提算法获得了5%~50%的精度提升。 %U http://www.joca.cn/CN/10.11772/j.issn.1001-9081.2018020375