摘要: 离群点检测作为数据挖掘的一个重要研究方向,可以从大量数据中发现少量与多数数据有明显区别的数据对象。基于密度的离群点检测作为代表性检测技术得到了持续关注,已有的密度离群点检测算法LOF不能适应数据分布异常情况离群点检测,INFLO算法引入反向k近邻点集有效地解决了数据分布异常情况的离群点检测问题,但存在需要对所有数据点不加区分的分析其k近邻和反向k近邻点集,效率较低,对大数据集适应性差的不足。针对这些问题,提出局部密度离群点检测算法LDBO,算法引入强k近邻点和弱k近邻点等概念,对数据集中的数据点进行区别对待,并对数据点的离群性进行预判断,有效的提高了数据分布异常情况离群点检测算法的效率,理论分析和实验结果表明,算法效率优于INFLO,算法是有效可行的。
中图分类号: