计算机应用 ›› 2011, Vol. 31 ›› Issue (05): 1359-1362.DOI: 10.3724/SP.J.1087.2011.01359
张燕平,张娟,何成刚,褚维翠,张利娜
ZHANG Yan-ping, ZHANG Juan, HE Cheng-gang, CHU Wei-cui, ZHANG Li-na
摘要: 针对传统K-means算法对初始点敏感的问题,采用数论中的佳点集理论结合Leader方法对K-means聚类算法加以改进,启发式地生成样本初始中心。根据两者不同的结合方式,所提算法分别称为KLG和KGL。佳点集理论能够产生比随机选取点更好的点,Leader方法则能反映数据对象本身的分布特性。结合佳点集理论和Leader方法各自的优点,能获得优化的初始中心。在UCI数据集上的实验表明,KLG算法和KGL算法所得到的结果均好于传统的和其他一些初始化的K-means算法。