摘要: 多视图聚类是近年来图数据挖掘领域的研究热点。但由于数据采集技术的限制或人为因素等原因常导致视图或样本缺失问题。如何降低多视图的不完整性对聚类效果的影响是多视图聚类目前面临的重大挑战。因此,综合研究不完整多视图聚类近年的发展具有重要的理论意义和实践价值。首先,归纳分析不完整多视图数据缺失类型;其次,详细比较了基于多核学习、矩阵分解学习、深度学习、图学习的四类不完整多视图聚类方法,分析代表性方法的技术特点和区别;再次,从数据集类型、视图和类别数量、应用领域等角度总结22个公开不完整多视图数据集;然后,总结评价指标,并系统分析现有不完整多视图聚类方法在同构和异构数据集上的性能表现;最后,归纳分析不完整多视图聚类目前存在的问题、未来的发展方向及现有应用领域。
中图分类号: