摘要: 摘 要: 针对深度变分文本聚类模型在实际应用中遇到的分布信息缺失和分布坍塌问题,提出一种基于分布增强的深度变分文本聚类模型(DAVAE)。该模型通过分布信息增强的方法,整合增强潜在语义分布至原始潜在语义分布中,从而提高潜在分布的信息完整性和准确性;同时模型采用分布一致性约束策略,促使模型学习一致的语义表征,提高模型学习的语义分布对数据真实信息的表达能力,从而提升聚类性能。与现有的深度变分推断模型和深度聚类模型相比,DAVAE的归一化互信息(NMI)指标在Abstract,BBC,Reuters-10k和BBCSports四个现实数据集上分别提升了0.16、9.01、2.30和2.72个百分点,验证了模型的有效性。
中图分类号: